Marvell quiere exprimir la memoria CXL con compresión en silicio

La memoria se ha convertido en una de las piezas más caras y tensas de la infraestructura de inteligencia artificial. No faltan solo GPUs. Faltan gigabytes cerca del procesador, módulos DDR5 de servidor, memoria para bases de datos en caliente, capacidad para inferencia de modelos grandes y sistemas capaces de sostener búsquedas vectoriales sin disparar el coste por nodo. En ese contexto, Marvell plantea una idea sencilla de explicar, pero difícil de ejecutar bien: comprimir la memoria directamente en el controlador CXL.

La propuesta se apoya en Structera X y Structera A, su familia de dispositivos CXL para expansión de memoria y aceleración cerca de los datos. La compañía sostiene que el cuello de botella actual no se resuelve solo añadiendo más DRAM, porque la DRAM es cara, escasa y compite con la demanda de los centros de datos de IA. El punto diferencial está en un bloque de hardware específico, llamado Compression-Decompression Block, que comprime los datos cuando se escriben en memoria y los descomprime cuando se leen, sin intervención del procesador ni cambios visibles para el sistema operativo.

La promesa económica es directa: si una carga permite una relación de compresión de 2:1, cada gigabyte físico puede comportarse como dos gigabytes útiles. Si la relación es mayor, el ahorro potencial aumenta. En una etapa en la que el precio de la memoria de servidor condiciona la compra de máquinas, esa diferencia puede pesar tanto como la CPU o la GPU elegida.

CXL no solo amplía memoria, también puede cambiar su coste real

Compute Express Link, más conocido como CXL, permite conectar memoria y aceleradores al procesador con coherencia y semántica de memoria sobre PCIe. En la práctica, abre la puerta a ampliar capacidad más allá de los bancos DDR del servidor, crear niveles de memoria y, en versiones más avanzadas, avanzar hacia modelos de memoria más compartida o desagregada.

Hasta ahora, gran parte de la conversación sobre CXL se ha centrado en añadir más memoria a servidores que ya no pueden crecer dentro de los canales tradicionales de la CPU. Marvell intenta mover el debate un paso más allá: no basta con sumar capacidad física; hay que aumentar la capacidad útil de esa memoria, especialmente cuando muchos datos en memoria son compresibles.

ElementoQué aporta
CXLExpande memoria fuera de los canales DDR tradicionales
Structera XControladores para ampliar capacidad de memoria por servidor
Structera AAceleradores cerca de memoria para cargas intensivas
CDBCompresión y descompresión en silicio
LZ4Algoritmo sin pérdida, rápido y de baja latencia
One-to-many mappingPresenta al host más memoria virtual que DRAM física

La diferencia frente a comprimir desde software está en dónde se paga el coste. Cuando una base de datos, un motor analítico o una aplicación comprime con la CPU, gana capacidad, pero consume ciclos de cómputo, añade complejidad y exige que el software esté preparado. Marvell traslada ese trabajo a silicio dedicado dentro del dispositivo CXL, con la intención de mantenerlo en línea con el ancho de banda de memoria y fuera del camino de la CPU.

El bloque CDB, la pieza clave del anuncio

El Compression-Decompression Block no es una biblioteca ni una opción de firmware añadida tarde. Marvell lo presenta como un bloque de hardware dedicado, integrado en sus dispositivos Structera CXL. Su función es transparente: el host escribe datos, el controlador los comprime antes de guardarlos en DRAM; cuando el host los lee, el controlador los descomprime y entrega la información como si estuviera leyendo memoria normal.

La compañía usa una variante propia de LZ4, un algoritmo sin pérdida muy conocido por su velocidad. LZ4 se usa en bases de datos, sistemas de almacenamiento, motores analíticos y software donde la latencia de descompresión importa. La elección no busca la máxima compresión posible a cualquier precio, sino un equilibrio entre ratio, latencia y ancho de banda.

Métrica anunciadaValor
AlgoritmoDerivado de LZ4
Tamaños de página4 KB y 1 KB
Ratio máximo64:1 en páginas todo cero
Niveles de esfuerzo0 a 3, configurables
Tipo de compresiónSin pérdida
Visibilidad para el hostTransparente para CPU y sistema operativo

El ratio máximo de 64:1 suena llamativo, pero conviene leerlo con cuidado: se refiere a casos extremos, como páginas compuestas solo por ceros. En cargas reales, la cifra útil depende del tipo de dato. No comprime igual texto estructurado, código fuente, contenido web, binarios compilados, bases de datos o lenguaje natural.

Cuánta memoria útil se puede ganar

Marvell publica ratios sobre distintos tipos de datos y los compara con LZ4 ejecutado en el host. En sus mediciones, Structera CDB iguala o se acerca mucho a la calidad de compresión de LZ4 en software, pero sin ocupar CPU.

Tipo de datoRatio Structera CDBRatio LZ4 en host
XML2,75x2,64x
Base de datos (nci)3,64x3,65x
Código fuente (samba)2,00x2,07x
Contenido web (webster)1,67x1,65x
Lenguaje natural (dickens)1,32x1,32x
Binario compilado (mozilla)1,68x1,73x

El resultado más interesante no es el ratio más alto, sino la consistencia. En XML y bases de datos, el ahorro puede ser muy alto. En lenguaje natural, la ganancia es más modesta. En binarios, depende del tipo de contenido. Para una infraestructura real, esto obliga a medir antes de comprar: no todas las cargas convertirán 12 TB físicos en 24 TB útiles, y mucho menos en 48 TB.

Aun así, incluso ratios de 1,5x o 2x pueden cambiar presupuestos. En entornos con grandes pools de memoria, una mejora de capacidad útil sin añadir módulos reduce coste, consumo, espacio y presión sobre la cadena de suministro. En bases de datos en memoria, recomendadores, inferencia de LLM, cachés, motores de búsqueda vectorial y analítica, la memoria no es un accesorio: es parte central del coste por consulta o por usuario.

Por qué importa ahora: DDR5 se ha vuelto una partida crítica

El anuncio llega en un momento en el que la memoria de servidor ha dejado de comportarse como una commodity barata. Marvell cita precios spot de 27 a 37 dólares por GB para RDIMM DDR5 de servidor, lo que situaría un pool de 12 TB cerca del medio millón de dólares solo en DRAM. También señala subidas de entre el 300 % y el 400 % desde mediados de 2025.

Aunque esas cifras deben tratarse como referencias de mercado aportadas por la compañía, encajan con una tendencia más amplia. Los fabricantes de memoria están priorizando HBM, DRAM de servidor, contratos con hiperescalares y productos ligados a IA. La memoria para servidores generalistas compite con una demanda mucho más agresiva que hace unos años.

ProblemaEfecto en infraestructura
DDR5 caraSuben los costes de servidores y pools CXL
Demanda de IAAbsorbe capacidad de fabricación
HBM prioritariaDesplaza inversión hacia productos de mayor margen
Más modelos en inferenciaCrece la memoria necesaria por nodo
Bases de datos en memoriaAumenta la presión sobre capacidad útil
Vector searchRequiere grandes volúmenes cerca del cómputo

La compresión en hardware no crea DRAM nueva, pero hace que la existente trabaje más. Esa distinción es importante. No soluciona todos los problemas de suministro, pero puede retrasar compras, reducir configuraciones máximas y hacer viables diseños que con memoria sin comprimir resultarían demasiado caros.

No todas las cargas encajan igual

El principal riesgo de este tipo de tecnología está en venderla como una ganancia universal. No lo es. La compresión depende de los datos. Una carga con páginas muy repetitivas, estructuras regulares o muchos ceros puede beneficiarse mucho. Una carga con datos ya comprimidos, cifrados o con alta entropía apenas ganará capacidad. Además, CXL introduce su propia latencia frente a memoria local DDR, y la compresión añade otro elemento que debe evaluarse.

Eso no invalida la propuesta. Solo obliga a colocarla en el sitio correcto. CXL comprimido puede ser muy atractivo para memoria fría o templada, datos de gran tamaño con acceso irregular tolerable, caches de segundo nivel, bases de datos que no necesitan toda su capacidad en DDR local o cargas donde el coste por GB importa más que unos nanosegundos adicionales.

Buen candidatoCandidato delicado
Bases de datos con datos compresiblesDatos ya comprimidos
Caches ampliasCargas ultralatentes
Vector search con memoria caraDatos cifrados en memoria
Recomendadores con grandes tablasAccesos aleatorios muy sensibles
Analítica en memoriaPicos donde CXL sea cuello de botella
Memoria tieredAplicaciones sin tolerancia a variación

La adopción real dependerá de pruebas independientes, integración con sistemas operativos, herramientas de observabilidad, políticas de asignación de memoria y madurez de CXL en cada plataforma CPU. El hardware puede hacer transparente la compresión, pero los arquitectos seguirán necesitando saber qué parte de su memoria vive en DDR local y qué parte en un nivel CXL comprimido.

Una señal del futuro de la memoria en IA

La lectura más amplia es que la industria empieza a tratar la memoria como una capa activa, no como una reserva pasiva de bytes. Durante años se añadía DRAM a los servidores y se asumía que el software ya la usaría. Con IA, bases vectoriales y grandes motores de inferencia, esa etapa se complica. Ahora hay que decidir qué datos merecen HBM, cuáles deben vivir en DDR local, cuáles pueden moverse a CXL y cuáles pueden comprimirse sin penalizar demasiado.

Marvell intenta situarse justo en esa frontera. Structera no compite con una CPU o una GPU, sino con el coste de llenar de DIMMs cada máquina. En un centro de datos grande, ahorrar módulos puede ser tan valioso como ganar rendimiento bruto. Menos DRAM física también puede significar menor consumo y menos presión en una cadena de suministro saturada.

La idea no será exclusiva de Marvell para siempre. Si la memoria sigue cara, otros controladores CXL, aceleradores y arquitecturas de servidor buscarán mecanismos parecidos. La compresión, la deduplicación, el tiering automático y la memoria compartida se convertirán en herramientas habituales para exprimir capacidad.

El gigabyte útil será la nueva métrica

Durante mucho tiempo se compraba memoria por capacidad física: 512 GB, 1 TB, 3 TB, 12 TB. En la nueva etapa, esa cifra será insuficiente. Lo que importará será la capacidad útil por euro, por vatio, por ranura y por carga. Ahí es donde la compresión en silicio puede cambiar la conversación.

Marvell no está diciendo que todos los datos se multipliquen por cuatro ni que CXL comprimido sustituya a la DRAM local. Su mensaje es más concreto: en un mercado donde cada gigabyte de servidor cuesta mucho más, no tiene sentido almacenar datos compresibles como si la memoria siguiera siendo barata.

Si CXL se consolida como extensión natural de la memoria del servidor, la compresión en línea puede pasar de ser una función diferenciadora a convertirse en requisito. En IA, donde la escala se mide tanto por cómputo como por memoria disponible, cada gigabyte cuenta. La novedad es que ahora Marvell quiere que cada gigabyte cuente más de una vez.

Preguntas frecuentes

¿Qué es Marvell Structera CXL?
Es una familia de dispositivos CXL para ampliar capacidad de memoria y acercar aceleración a los datos en servidores de centros de datos.

¿Qué aporta la compresión CDB?
Comprime datos en hardware cuando se escriben en DRAM y los descomprime al leerlos, de forma transparente para CPU, sistema operativo y aplicaciones.

¿Significa que siempre se duplica la memoria?
No. El ratio depende de los datos. Marvell muestra ratios de 1,32x a 3,64x en distintos tipos de datos, con máximos mucho más altos solo en casos extremos como páginas todo cero.

¿Qué cargas pueden beneficiarse más?
Bases de datos en memoria, recomendadores, inferencia de LLM, búsquedas vectoriales, caches grandes y cargas donde la capacidad sea más importante que la latencia mínima.

vía: marvell

encuentra artículos

newsletter

Recibe toda la actualidad del sector tech y cloud en tu email de la mano de RevistaCloud.com.

Suscripción boletín

LO ÚLTIMO

Las últimas novedades de tecnología y cloud

Suscríbete gratis al boletín de Revista Cloud. Cada semana la actualidad en tu buzón.

Suscripción boletín
×