NVIDIA presume (con números) en la era MoE: Signal65 estima que GB200 NVL72 puede ser hasta 15× más rentable por token que AMD MI355X
La conversación sobre infraestructura de Inteligencia Artificial está dejando de girar solo alrededor del “rendimiento bruto” y empieza a obsesionarse con algo mucho más prosaico: cuánto cuesta servir cada token cuando el usuario exige respuestas rápidas, a escala y con buena “sensación” de interacción. En ese terreno, los modelos MoE (Mixture of Experts / Mezcla de Expertos) están empujando a la industria hacia un problema incómodo: la comunicación entre nodos y la latencia interna se vuelve casi tan importante como la potencia de cálculo. En ese contexto, la firma Signal65 ha publicado un análisis centrado en lo que llama “la nueva economía de la inferencia” para MoE, comparando plataformas de NVIDIA y AMD con una idea base: el coste relativo