Blackwell Ultra aprieta el acelerador: 50 veces más rendimiento por megavatio para la era de los agentes de IA
La inferencia —y no solo el entrenamiento— se está convirtiendo en el auténtico cuello de botella de la nueva ola de Inteligencia Artificial. Y el motivo es simple: los agentes y los asistentes de programación están devorando tokens a un ritmo que obliga a replantear la economía del cómputo. Según el informe State of AI de OpenRouter, las consultas relacionadas con programación pasaron de representar alrededor del 11% del volumen total de tokens a superar el 50% en semanas recientes. Ese cambio no es solo estadístico: marca una transición desde usos exploratorios hacia tareas aplicadas como depuración, generación de código, scripting y flujos con herramientas integradas. En ese contexto, NVIDIA ha publicado nuevos datos que buscan poner números a una