Rebellions compra SqueezeBits para cerrar el círculo de la inferencia IA

Rebellions ha anunciado la adquisición de SqueezeBits, una startup surcoreana especializada en optimización de inferencia y compresión de modelos de inteligencia artificial. La operación refuerza un movimiento cada vez más evidente en el mercado de infraestructura IA: fabricar chips ya no basta. Para competir en despliegues reales, hay que controlar también el software que permite ejecutar modelos con velocidad, coste contenido y fiabilidad.

La compañía de Seúl quiere evolucionar desde fabricante de NPUs hacia proveedor de infraestructura IA de extremo a extremo. Con SqueezeBits, Rebellions incorpora a su propia organización una pieza que hasta ahora trabajaba de forma cercana con ella: optimización de modelos, reducción de carga computacional, software de serving y adaptación de frameworks abiertos como vLLM a entornos basados en NPU. Rebellions afirma que ambas compañías colaboraban desde 2024 en tecnologías de compresión de modelos y software dedicado para sus chips.

El mensaje de fondo es claro. La batalla de la IA empresarial se está desplazando hacia la inferencia, es decir, el momento en el que un modelo responde a una petición real de usuario, aplicación o sistema. Ahí se decide el coste por consulta, la latencia, el consumo eléctrico y la capacidad de escalar un servicio sin que la factura se dispare.

Del chip al sistema completo

Rebellions no quiere presentarse solo como una empresa de semiconductores. Tras la compra de SqueezeBits, su propuesta pasa a combinar hardware NPU, optimización de software e inferencia servida en una única plataforma. Eso significa cubrir más partes del recorrido: desde que una solicitud entra en el sistema hasta que el modelo se ejecuta y devuelve una respuesta.

La operación encaja con una tendencia más amplia. En IA generativa, el rendimiento bruto del chip importa, pero no explica por sí solo el resultado final. Un acelerador puede ser eficiente sobre el papel y rendir por debajo de lo esperado si el modelo no está bien adaptado, si el serving no aprovecha el hardware, si la gestión de memoria es pobre o si la pila de software obliga a los desarrolladores a reescribir demasiado código.

SqueezeBits aporta precisamente ese conocimiento. Fundada en marzo de 2022, la empresa trabaja en compresión y optimización de modelos para reducir el coste de despliegue y operación de servicios de IA. Rebellions destaca que la startup ha colaborado con compañías globales de hardware como Intel y NVIDIA, y que ha construido tecnologías para acelerar modelos y reducir costes en distintos entornos de cómputo.

Pieza de la infraestructuraQué aporta tras la adquisición
NPU de RebellionsHardware especializado para inferencia IA
Compresión de modelosMenor consumo de memoria y cómputo
Optimización de inferenciaMenor latencia y mejor uso del acelerador
ServingEjecución de modelos en producción
vLLM y frameworks abiertosMenor barrera para desarrolladores
Integración full-stackMenos trabajo manual en despliegues reales

La palabra importante es integración. Muchas empresas quieren alternativas a la GPU para inferencia, pero no quieren asumir una migración difícil. Si un NPU exige demasiados cambios en código, herramientas, despliegue y observabilidad, su ventaja de coste o consumo puede quedarse en laboratorio. Por eso el software es tan importante como el silicio.

vLLM, PyTorch y la importancia de no romper el flujo del desarrollador

Rebellions y SqueezeBits ya habían trabajado juntas en la comunidad coreana de desarrolladores con talleres centrados en vLLM, un framework abierto de inferencia muy usado para servir grandes modelos de lenguaje. En un resumen técnico publicado por SqueezeBits, ambas compañías explicaban que los ejercicios se ejecutaron sobre servidores NPU ATOM-MAX de Rebellions, con Kubernetes como capa de infraestructura y flujos basados en PyTorch, Optimum y vLLM.

Ese detalle importa más de lo que parece. La adopción de nuevos aceleradores no depende solo de benchmarks. Depende de si los equipos pueden usar herramientas conocidas, mantener sus patrones de despliegue y obtener mejoras sin rehacer toda su plataforma. SqueezeBits señalaba en ese taller que el plugin vLLM-RBLN permitía conservar el flujo de código habitual de GPU con cambios mínimos.

Para Rebellions, adquirir SqueezeBits permite llevar esa capa al centro de su producto. No es solo una compra de talento. Es una forma de reducir la distancia entre hardware especializado y aplicaciones reales. En un mercado dominado por NVIDIA, las alternativas necesitan algo más que chips eficientes: necesitan que los desarrolladores puedan ejecutar modelos con comodidad, que los clientes tengan soporte claro y que el rendimiento se mantenga en producción.

Una pieza más en la estrategia coreana de IA soberana

La adquisición también tiene lectura industrial. Rebellions se ha convertido en una de las apuestas más visibles de Corea del Sur para construir una cadena propia de infraestructura IA. En diciembre de 2024 completó su fusión con SAPEON Korea, operación que la compañía presentó como el nacimiento del primer unicornio coreano de chips de IA bajo la marca Rebellions. Aquella integración unió capacidades de dos empresas nacionales de semiconductores IA y reforzó su ambición internacional.

Ahora, con SqueezeBits, la compañía amplía el foco. Ya no se trata solo de integrar dos fabricantes de chips, sino de incorporar software de inferencia y optimización. La propia Rebellions sitúa la compra dentro de la construcción de infraestructura IA soberana y recuerda que en marzo de 2026 fue seleccionada como primera inversión directa del National Growth Fund, dentro del esfuerzo coreano por crear una especie de “K-NVIDIA”.

La comparación con NVIDIA no debe tomarse de forma literal. NVIDIA no lidera solo por sus GPUs, sino por CUDA, librerías, networking, sistemas completos, software de inferencia, soporte a desarrolladores y una enorme red de partners. Si Corea quiere crear un actor local con posibilidades reales, necesita algo parecido a menor escala: chip, software, herramientas, comunidad, sistemas y casos de uso.

Ahí SqueezeBits puede tener un papel relevante. La optimización de inferencia es una de las capas donde se gana o se pierde competitividad. Un modelo que consume menos memoria, responde antes y aprovecha mejor el hardware permite vender infraestructura con un argumento más sólido que el de la soberanía tecnológica por sí sola.

La inferencia se convierte en el centro del negocio

La compra refleja una idea que se repite cada vez más en el sector: la próxima fase de la IA no se medirá solo por entrenar modelos más grandes, sino por ejecutarlos de forma rentable. Cada chatbot corporativo, agente, buscador interno, copiloto, herramienta de análisis o sistema de atención automatizada necesita inferencia continua. Eso convierte el coste operativo en un asunto central.

En ese contexto, la compresión de modelos, la cuantización, la gestión eficiente de memoria, el batching, el caching y el serving dejan de ser detalles técnicos. Son la diferencia entre un servicio viable y uno demasiado caro para escalar.

Rebellions intenta posicionarse justo ahí. Su apuesta es que los clientes puedan usar NPUs como infraestructura de inferencia sin enfrentarse a una capa de optimización demasiado compleja. La adquisición de SqueezeBits apunta a reducir esa fricción técnica y comercial.

La operación no garantiza por sí sola que Rebellions pueda competir con los gigantes del sector. NVIDIA, AMD, Intel, Google, AWS, Huawei y otras compañías tienen recursos, clientes y plataformas muy desarrolladas. Pero sí muestra que la compañía surcoreana entiende el punto crítico: en IA, el hardware sin software se queda corto. Y en inferencia, la eficiencia solo cuenta si llega hasta producción.

Preguntas frecuentes

¿Qué ha comprado Rebellions?
Rebellions ha adquirido SqueezeBits, una startup especializada en optimización de inferencia, compresión de modelos y software para ejecutar IA de forma más eficiente.

¿Por qué es importante esta compra?
Porque permite a Rebellions integrar hardware NPU, optimización de software y serving de inferencia en una misma plataforma, reduciendo la complejidad para los clientes.

¿Qué es la inferencia en IA?
Es la fase en la que un modelo ya entrenado recibe una petición, la procesa y devuelve una respuesta. Es la parte que más pesa cuando un servicio de IA se usa a gran escala.

¿Qué relación tenían Rebellions y SqueezeBits antes de la compra?
Desde 2024 colaboraban en compresión de modelos, software para NPUs de Rebellions y actividades para desarrolladores centradas en vLLM.

¿Qué significa “K-NVIDIA”?
Es una forma de describir la ambición de Corea del Sur de crear un campeón nacional de infraestructura IA capaz de competir en chips, software y sistemas para inteligencia artificial.

vía: rebellions.ai

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×