Tensordyne Napier desafía a NVIDIA con un chip de IA basado en matemáticas logarítmicas

Noticias Cloud

Tensordyne quiere entrar en la carrera de la inferencia de Inteligencia Artificial por una vía distinta a la habitual. La compañía ha anunciado Napier, un chip fabricado en 3 nm que promete más rendimiento por vatio, menor consumo y mayor capacidad de procesamiento de tokens que las plataformas de NVIDIA Blackwell y Rubin. La propuesta llega en un momento en el que el coste de servir modelos de gran tamaño se ha convertido en uno de los grandes problemas de la industria.

La empresa no está planteando solo otro acelerador de IA. Su mensaje es más ambicioso: rediseñar la forma en que se calculan las operaciones de los modelos mediante matemáticas logarítmicas, una arquitectura de memoria muy integrada y una interconexión de baja latencia pensada para escalar dentro del rack. La promesa es clara, aunque todavía necesita pruebas independientes: servir modelos de billones de parámetros con menos energía, menos infraestructura y más margen económico para proveedores cloud, neo clouds y empresas.

Napier ha completado el tape-out, según Tensordyne, y la compañía asegura que el silicio está entrando en fabricación de alto volumen en las instalaciones de TSMC. El chip se ha desarrollado en colaboración con Broadcom y TSMC, y la plataforma incorpora trabajo de integración con Juniper Networks para la red de escala interna. La empresa habla además de más de 200 millones de dólares en demanda prevista para sistemas Napier, una cifra que apunta a interés comercial, aunque no equivale todavía a despliegues masivos verificados.

Un chip de 3 nm centrado en inferencia

Napier está diseñado para inferencia, no para competir de forma genérica en todos los usos de entrenamiento y cómputo acelerado. Ese enfoque es importante. La inferencia de modelos grandes se está convirtiendo en una carga económica enorme: más usuarios, más agentes, más contexto, más tokens generados y más exigencia de latencia. En ese escenario, el rendimiento bruto importa, pero el rendimiento por vatio y por dólar puede importar aún más.

Según los datos publicados y recogidos por medios técnicos, el chip Napier integra 138.000 millones de transistores, 144 GB de memoria HBM3E, 256 MB de SRAM y alcanza 2,1 PFLOPS de cómputo FP8 denso con un consumo declarado de 300 W por paquete. Son cifras pensadas para posicionarlo frente a los aceleradores de IA de gama alta, pero su elemento diferencial no está solo en el nodo de fabricación o la memoria.

Característica	Tensordyne Napier
Proceso de fabricación	TSMC 3 nm
Transistores	138.000 millones
Memoria HBM	144 GB HBM3E
SRAM	256 MB
Cómputo declarado	2,1 PFLOPS FP8 denso
Consumo por chip	300 W
Enfoque principal	Inferencia de modelos generativos
Estado comunicado	Tape-out completado y transición a fabricación

La compañía basa buena parte de su ventaja en TDN Math, una aproximación que reemplaza operaciones de multiplicación a gran escala por cálculo basado en sumas dentro de un sistema numérico logarítmico. La idea de usar sistemas logarítmicos no es nueva en computación, pero Tensordyne afirma haberla llevado a hardware específico y a un stack de software capaz de ocultar esa complejidad al usuario.

Ese último punto será decisivo. Un chip de IA puede prometer mucho, pero si obliga a reentrenar modelos, cambiar formatos de forma dolorosa o rehacer pipelines, su adopción se complica. Tensordyne asegura que su software gestiona conversiones y ofrece compatibilidad con herramientas conocidas como PyTorch, Triton y vLLM. La promesa es que los clientes no tengan que adaptar sus modelos desde cero a una aritmética distinta.

TDN72: el rack como unidad de competencia

Tensordyne no presenta Napier como un chip aislado, sino como parte de un sistema. Su unidad principal es el TDN72 Inference Pod, con 72 chips Napier. Cuatro pods forman un rack completo con 288 chips, 42 TB de HBM3E, 74 GB de SRAM, 608 PFLOPS FP8 densos y un consumo declarado de 120 kW. La compañía afirma que cada pod es refrigerado por aire y consume 30 kW.

La elección de 72 chips no parece casual. NVIDIA ha establecido el formato NVL72 como referencia en sus plataformas de escala rack, con 72 GPUs y 36 CPUs Grace en GB300 NVL72, y una configuración similar de 72 GPUs Rubin y 36 CPUs Vera en Vera Rubin NVL72. Tensordyne intenta facilitar una comparación directa: mismo número de aceleradores por dominio de escala, pero con otra arquitectura matemática y energética.

Sistema	Configuración destacada	Memoria	Potencia declarada
Tensordyne TDN72 Pod	72 chips Napier	10 TB HBM aprox.	30 kW
Tensordyne rack completo	4 pods, 288 chips	42 TB HBM3E	120 kW
NVIDIA GB300 NVL72	72 Blackwell Ultra + 36 Grace	20 TB HBM3E GPU + 17 TB LPDDR5X	No comparable directamente en la ficha pública
NVIDIA Vera Rubin NVL72	72 Rubin + 36 Vera	20,7 TB HBM4	No comparable directamente en la ficha pública

Las comparaciones de Tensordyne son agresivas. La empresa afirma que Napier puede ofrecer 17 veces más tokens por vatio y 13 veces más tokens por segundo que NVIDIA Blackwell. También asegura que su sistema puede servir modelos de múltiples billones de parámetros con 1.000 tokens por segundo por usuario en un solo rack, frente a configuraciones mucho más grandes basadas en Rubin y LPX.

Estas afirmaciones deben tratarse como datos de parte. No hay todavía benchmarks independientes ampliamente aceptados que permitan verificar en igualdad de condiciones esos ratios frente a Blackwell, Blackwell Ultra o Rubin. Además, las comparaciones de inferencia dependen mucho del modelo, tamaño de contexto, batch, precisión, interconexión, software, calidad de servicio, memoria disponible y perfil real de uso.

La apuesta: cambiar la matemática, no solo añadir chips

La mayoría de competidores de NVIDIA intentan diferenciarse por coste, disponibilidad, especialización o integración vertical. Tensordyne añade otro argumento: cambiar la forma de representar y ejecutar las operaciones. Su enfoque logarítmico busca reducir coste energético y área de silicio en operaciones clave de los modelos transformer, especialmente en inferencia.

Este planteamiento tiene atractivo porque la industria se enfrenta a una realidad incómoda. Aumentar GPUs, racks y megavatios no escala indefinidamente. El coste de energía, refrigeración, memoria HBM, red, espacio y suministro eléctrico empieza a marcar el límite de muchos proyectos. Una arquitectura que reduzca consumo sin penalizar precisión ni compatibilidad tendría valor inmediato.

Bloque de la plataforma	Función
TDN Math	Matemáticas logarítmicas para reducir coste computacional
TDN AIP	Procesador de Inteligencia Artificial Napier
TDN ACT	Bandeja de cómputo del sistema
TDN Link	Interconexión scale-up de baja latencia
TDN72 Pod	Servidor de 72 chips para inferencia
TDN Rack	Cuatro pods, 288 chips y 42 TB de HBM3E

La cuestión es si la ventaja se mantiene en producción real. La historia del hardware de IA está llena de promesas espectaculares que luego chocan con software inmaduro, falta de soporte, dificultad para atraer desarrolladores o incapacidad para mantener una hoja de ruta rápida frente a NVIDIA. Tensordyne tendrá que demostrar no solo que su chip es eficiente, sino que su sistema es fiable, programable, escalable y disponible en volumen.

ServeTheHome resume bien el punto: Napier resulta interesante porque no se limita a copiar el formato de NVIDIA y prometer menor precio, sino que intenta cambiar la matemática. Eso lo hace más relevante técnicamente, pero también más exigente. Cualquier cambio profundo en la representación numérica debe probar que conserva calidad, precisión y estabilidad en modelos reales.

NVIDIA sigue teniendo el ecosistema

El desafío de Tensordyne se produce contra un rival que no compite solo con chips. NVIDIA vende una plataforma completa: GPUs, CPUs, NVLink, redes InfiniBand y Ethernet, software, librerías, sistemas rack-scale, herramientas de gestión y una enorme base de desarrolladores. GB300 NVL72 integra 72 GPUs Blackwell Ultra y 36 CPUs Grace, con 20 TB de HBM3E para GPU, 17 TB de LPDDR5X para CPU y 130 TB/s de ancho de banda NVLink. Vera Rubin NVL72 eleva la apuesta con 72 GPUs Rubin, 36 CPUs Vera, HBM4 y NVLink 6.

Plataforma NVIDIA	Datos oficiales destacados
GB300 NVL72	72 Blackwell Ultra, 36 Grace, 20 TB HBM3E GPU, 130 TB/s NVLink
Vera Rubin NVL72	72 Rubin, 36 Vera, 20,7 TB HBM4, 260 TB/s NVLink
Rubin GPU	50 PFLOPS NVFP4 por GPU
Vera Rubin NVL72	3.600 PFLOPS NVFP4 de inferencia
Enfoque NVIDIA	Plataforma completa de IA, red, software y gestión

NVIDIA también afirma que Vera Rubin NVL72 reduce el coste por millón de tokens frente a GB200 NVL72 y multiplica el rendimiento por megavatio en modelos de razonamiento. Es decir, la propia NVIDIA está atacando el mismo problema que Tensordyne: inferencia más barata y eficiente para modelos cada vez más grandes.

Esto deja a Napier en una posición interesante, pero complicada. Si sus cifras se verifican, puede ser una alternativa para proveedores que necesitan más margen en inferencia y no quieren depender por completo del ecosistema NVIDIA. Si el software o la disponibilidad no acompañan, el mercado puede seguir prefiriendo una plataforma más cara pero más madura.

La batalla se desplaza al coste por token

Napier llega en el momento adecuado. La inferencia se está convirtiendo en el gran gasto recurrente de la Inteligencia Artificial generativa. Entrenar un modelo es caro, pero servirlo a millones de usuarios, agentes y aplicaciones puede serlo aún más. En ese contexto, el sector empieza a mirar métricas como tokens por segundo, tokens por vatio, coste por millón de tokens, memoria por rack, densidad de usuarios y latencia por petición.

Tensordyne habla de hasta 33 millones de dólares más de ingresos anuales por rack frente a Blackwell, una cifra que debe interpretarse como una proyección comercial basada en supuestos de uso, precio y ocupación. Aun así, señala hacia dónde se mueve el negocio. La infraestructura de IA ya no se venderá solo por FLOPS, sino por margen operativo en servicios reales.

Para los hiperescalares, una mejora clara de tokens por vatio puede reducir costes energéticos, liberar capacidad eléctrica y retrasar inversiones en nuevos centros de datos. Para neo clouds, puede mejorar el margen en inferencia premium. Para empresas, podría hacer más viable ejecutar modelos grandes on-premise sin refrigeración líquida compleja, siempre que las promesas de compatibilidad y eficiencia se cumplan.

La pregunta ya no es si NVIDIA tendrá competencia. La tendrá, porque el mercado es demasiado grande y el coste de la inferencia deja espacio para arquitecturas especializadas. La pregunta es cuántas de esas alternativas pasarán de una presentación convincente a una plataforma desplegable, mantenible y confiable.

Tensordyne ha colocado Napier en esa conversación con una propuesta audaz: menos dependencia del escalado bruto, más eficiencia matemática y una arquitectura pensada para servir modelos gigantes. Ahora falta la parte más difícil: demostrarlo fuera de sus propios materiales, con clientes reales, cargas reales y comparativas que resistan el escrutinio técnico.

Preguntas frecuentes

¿Qué es Tensordyne Napier?

Napier es un chip de inferencia de Inteligencia Artificial fabricado en 3 nm y basado en una arquitectura de matemáticas logarítmicas desarrollada por Tensordyne.

¿Qué promete frente a NVIDIA Blackwell?

Tensordyne afirma que Napier ofrece 13 veces más tokens por segundo y 17 veces más tokens por vatio que Blackwell, aunque esas cifras proceden de la propia compañía y necesitan validación independiente.

¿Qué tiene de especial TDN Math?

TDN Math usa un enfoque logarítmico para reducir el coste de determinadas operaciones de los modelos de IA, sustituyendo parte de la multiplicación intensiva por cálculo basado en sumas.

¿Está ya disponible Napier?

Tensordyne afirma que Napier ha completado el tape-out y que pasa a fabricación de alto volumen, pero el despliegue comercial y los benchmarks independientes todavía serán clave para valorar su impacto real.

Fuentes: Tensordyne