Etched sale de incógnito con 800 millones y un chip de inferencia para competir en IA

Silvia A. Feliz

Etched ha dejado atrás el modo sigiloso con una de las cartas de presentación más agresivas del mercado de hardware para inteligencia artificial: 800 millones de dólares captados, más de 1.000 millones de dólares en contratos de clientes y un chip funcional fabricado con el proceso N4P de TSMC. La startup, con sede en San José, no quiere vender solo un acelerador. Su propuesta es construir clústeres de inferencia completos, diseñados desde el silicio hasta el rack, el software, la refrigeración y la producción.

La compañía llega en un momento en el que la IA empieza a cambiar de cuello de botella. Entrenar modelos gigantes sigue siendo caro, pero la presión se está trasladando con fuerza a la inferencia: ejecutar esos modelos millones de veces al día, con baja latencia, buen coste por token y consumo eléctrico asumible. Cada agente, copiloto, chatbot, buscador corporativo o aplicación con modelos de lenguaje convierte la inferencia en un problema de infraestructura continua.

Etched afirma que su primer silicio A0 ya volvió de TSMC en N4P y que está validando su primer producto a escala de rack con clientes para atender más de 1.000 millones de dólares en demanda contratada. La empresa también asegura que sus primeros racks empezarán a enviarse este verano y que ha iniciado producción.

Una startup que quiere vender clústeres, no solo chips

El anuncio de Etched es relevante porque se aleja del discurso clásico de “tenemos un ASIC más rápido”. La compañía habla de frontier inference clusters, una categoría en la que el rendimiento depende de muchas piezas al mismo tiempo: chip, paquete, memoria, placa, interconexión, refrigeración, software de serving, simulación, test y capacidad de fabricación.

Según la información publicada por la propia compañía, Etched cuenta con más de 400 ingenieros procedentes de empresas como NVIDIA, Google TPUs, Broadcom, SK hynix y TSMC. Ha captado 800 millones de dólares en cuatro rondas no anunciadas, incluida una inversión estratégica de VentureTech Alliance, un vehículo vinculado al entorno de TSMC.

El último tramo de financiación fue una ronda de 500 millones de dólares que situó la valoración post-money de Etched en 5.000 millones de dólares, según la información recogida por Data Center Dynamics. Entre los inversores y apoyos citados aparecen nombres financieros y tecnológicos como Jane Street, Hudson River Trading, Stripes, Radical Ventures, Primary VC, Peter Thiel, Geoffrey Hinton y Andrej Karpathy.

Dato anunciado	Detalle
Financiación total	800 millones de dólares
Última ronda	500 millones de dólares
Valoración post-money	5.000 millones de dólares
Contratos de clientes	Más de 1.000 millones de dólares
Proceso de fabricación	TSMC N4P
Equipo	Más de 400 ingenieros
Enfoque	Clústeres de inferencia a escala de rack

Etched también afirma que ha montado una fábrica en Taiwán y que ha construido en sus oficinas de California un centro de datos de 2 MW, una instalación de test y un laboratorio de prototipado NPI. La empresa no ha dado muchos más detalles de esas instalaciones, pero el mensaje es claro: quiere controlar más partes de la transición entre diseño y producción.

Low Voltage Inference y memoria a escala de clúster

La parte técnica del anuncio gira en torno a dos ideas. La primera es Low Voltage Inference o LVI. Etched sostiene que muchos chips de IA no pueden sostener su pico teórico de FLOPs porque, al aumentar la utilización, sube el consumo y aparece el estrangulamiento térmico. Su arquitectura busca ejecutar los bloques matemáticos a menos de la mitad del voltaje habitual en chips de IA, con el objetivo de aumentar densidad de cómputo y mantener más rendimiento sostenido.

La compañía afirma que puede ejecutar MoE dispersos de billones de parámetros por encima del 80 % de los FLOPs pico sin thermal throttling. Es una afirmación potente, pero todavía necesita validación independiente y datos públicos comparables. Etched ha indicado que compartirá más información sobre rendimiento y hoja de ruta durante el verano.

La segunda idea es Cluster Scale Memory o CSM. Etched plantea una memoria compartida de baja latencia a través del dominio de escala, apoyada en una interconexión propia de muy baja latencia y alto ancho de banda. La compañía sostiene que su diseño híbrido HBM/SRAM busca resolver dos problemas a la vez: capacidad de memoria y latencia entre memorias.

Esto apunta directamente al problema de la inferencia moderna. En cargas de modelos grandes, el rendimiento no depende solo de cuántas operaciones puede hacer un chip. Depende de cuánto tarda en mover datos, cómo se atienden cargas de prefill y decode, qué ocurre con contextos largos y cómo se mantienen costes bajos cuando los modelos se usan de forma interactiva.

Por qué la inferencia se convierte en el gran negocio

La tesis de Etched es que la infraestructura actual no está optimizada para servir modelos frontera de forma sostenible y económicamente viable. Gavin Uberti, cofundador y CEO, lo plantea así: la IA se está integrando rápidamente en todas las industrias y aplicaciones, y eso eleva la necesidad de infraestructura acelerada de inferencia.

La lectura tiene sentido. El entrenamiento concentra titulares porque exige clústeres enormes y presupuestos multimillonarios. Pero la inferencia es donde una aplicación vive todos los días. Un modelo que responde a usuarios, agentes o sistemas internos genera coste cada vez que se ejecuta. Si la latencia es alta, la experiencia empeora. Si el consumo por token es elevado, el margen se estrecha. Si el hardware no escala, el producto no aguanta crecimiento.

Por eso están apareciendo propuestas especializadas. Algunas buscan chips más simples y muy eficientes para una familia concreta de modelos. Otras apuestan por memoria más cercana al cómputo. Otras intentan reducir dependencia de GPU generalistas. Etched quiere diferenciarse con una visión de sistema completo: chip, rack, software y producción co-diseñados.

La dificultad está en que competir contra NVIDIA no es solo competir contra un chip. Es competir contra CUDA, networking, sistemas HGX/DGX, librerías, proveedores cloud, integradores, disponibilidad, soporte y una base enorme de desarrolladores. Etched parece entenderlo, porque no se presenta como un fabricante de silicio aislado, sino como una compañía de infraestructura.

Producción como producto

Uno de los mensajes más interesantes del anuncio viene de Rob Wachen, cofundador de Etched: “la producción es el producto”. La frase resume bien el momento del mercado. En IA, una arquitectura brillante no sirve de mucho si no puede fabricarse, probarse, desplegarse y operarse a escala.

Ese es el punto donde muchas startups de chips han sufrido históricamente. Lograr un tape-out exitoso es difícil. Producir con yield, asegurar packaging, validar racks, cerrar cadena de suministro, conseguir clientes cloud, mantener software y cumplir calendarios es todavía más complicado.

Etched dice haber trabajado con clientes de IA, proveedores cloud e hiperescalares en decisiones de co-diseño, y asegura haber probado racks en despliegues representativos de centros de datos y ejecutado terabytes de patrones de tráfico de producción en su simulador. Son afirmaciones relevantes, aunque el mercado esperará resultados medibles, benchmarks públicos y despliegues reales antes de saber hasta dónde llega la ventaja.

La entrada de Etched añade presión a un mercado que se está especializando muy rápido. La primera fase de la IA generativa estuvo dominada por la disponibilidad de GPU. La siguiente puede estar marcada por quién consigue reducir el coste de servir modelos grandes sin sacrificar latencia ni capacidad de escala.

Etched llega con dinero, contratos, un chip funcional y un equipo técnico de primer nivel. Todavía tiene que demostrar producción, rendimiento y fiabilidad en campo. Pero su aparición confirma una tendencia clara: la inferencia ya no es una fase secundaria de la IA. Se está convirtiendo en una categoría propia de infraestructura, con chips, racks y arquitecturas diseñadas específicamente para sostener el uso masivo de modelos.

Preguntas frecuentes

¿Qué ha anunciado Etched?
Etched ha salido de modo sigiloso con 800 millones de dólares captados, más de 1.000 millones en contratos de clientes y un chip funcional fabricado en TSMC N4P.

¿Qué tipo de producto desarrolla?
La compañía desarrolla clústeres de inferencia para IA, no solo chips. Su enfoque combina silicio, racks, software, memoria, refrigeración e interconexión.

¿Qué es Low Voltage Inference?
Es una arquitectura con la que Etched busca ejecutar bloques matemáticos a menor voltaje para sostener más rendimiento sin estrangulamiento térmico.

¿Qué es Cluster Scale Memory?
Es el enfoque de Etched para crear una memoria compartida de baja latencia a escala de clúster, combinando HBM y SRAM con una interconexión propia.

¿Puede competir con NVIDIA?
Todavía es pronto. Etched tiene financiación, talento y contratos, pero deberá demostrar rendimiento, producción, software y despliegues reales a gran escala frente a un ecosistema NVIDIA muy consolidado.