La compresión de vídeo vuelve a moverse. La Alliance for Open Media (AOMedia) avanza hacia la recta final de AV2, su próximo códec abierto y sin royalties, con una promesa difícil de ignorar: alrededor de un 30 % de reducción de bitrate para la misma calidad visual frente a AV1. La cifra, respaldada por pruebas internas del grupo de trabajo, tiene un impacto directo en la economía del streaming, el vídeo bajo demanda, los videojuegos en la nube y cualquier servicio que dependa de mover píxeles de forma eficiente por Internet.
Tras cinco años de desarrollo, las herramientas nucleares del códec están cerradas y la sintaxis de alto nivel se encuentra en fase avanzada. El calendario señalado por la propia alianza ubica la especificación final hacia finales de 2025, un hito que, si se cumple, desencadenará la siguiente fase: optimización de codificadores, adopción en software y, sobre todo, integración en silicio para decodificación (y más adelante codificación) por hardware.
Qué cambia realmente con AV2
AV2 no es una ruptura con el pasado, sino una evolución calculada del enfoque híbrido por bloques que domina la compresión moderna. Mantiene la estructura familiar de AV1, pero introduce mejoras profundas en casi todos los eslabones del pipeline:
- Bloques más grandes y partición más flexible. El salto a superbloques de 256×256 permite capturar patrones a gran escala con menos sobrecarga. La partición recursiva —totalmente flexible— afina el ajuste a texturas, bordes y regiones de movimiento, evitando gastar bits donde no hace falta.
- Predicción intra más inteligente. Se incorporan modos data-driven que aprovechan estadísticas del contenido para elegir direcciones y patrones, y se refuerza el chroma-from-luma (CFL) para que la información de luminancia ayude a predecir croma sin penalizaciones de detalle.
- Predicción inter con memoria mejor gestionada. AV2 jerarquiza referencias y permite seleccionar hasta siete fotogramas pasados con un sistema de ranking que elige de forma más informada. La novedad destacada es Temporal Interpolation Prediction (TIP), un método que interpela información temporal para mejorar el manejo del movimiento en escenas de alta resolución o con cambios rápidos.
- Cuantización con más control. Llega un quantizer exponencial unificado y de mayor rango para 8, 10 y 12 bits, acompañado de trellis-coded quantization (TCQ) y matrices de cuantización definidas por el usuario. El objetivo: conservar microdetalle a bitrates agresivos y ofrecer diales finos para perfilar la degradación a gusto del operador.
- Transformadas que preservan textura. El códec añade transformadas “aprendidas” y cross-component para capturar correlaciones difíciles con menos artefactos, clave en piel, vegetación, grano y patrones finos. En paralelo, se afina la codificación de coeficientes para manejar mejor screen content y material mixto (presentaciones, UI, gráficos animados).
- Postprocesado que limpia sin “lavar”. Un deblocker generalizado sustituye cadenas más rígidas y ayuda a mantener contornos y nitidez. Nuevos filtros —Guided Detail Filter y Cross-Component Sample Offset— reducen ruido de compresión con menos efecto acuarela. El film grain synthesis gana flexibilidad para preservar el look cinematográfico sin disparar el bitrate.
Todo este arsenal se ha diseñado con un requisito explícito: viabilidad en hardware. La lección aprendida con AV1 es clara: por muy eficiente que sea un códec en papel, su adopción masiva llega cuando SoCs móviles, televisores, set-top boxes y GPUs incluyen decodificadores dedicados de bajo consumo y alta velocidad. AV2 parte con esa premisa integrada en la arquitectura.
30 % menos de bits: por qué es más que un titular
En un servicio global, ahorrar un 30 % de bitrate a misma calidad no es un detalle; es capex y opex puros. Menos bits significan:
- Tráfico de CDN más barato, o, a igualdad de presupuesto, más sesiones concurrentes.
- Almacenamiento por título y por ladder de bitrate más contenido, con impacto acumulado en librerías VOD gigantes.
- Ganancia efectiva de calidad en redes móviles y escenarios de congestión: a igual ancho de banda disponible, menos paradas y menos degradación.
Para creadores y broadcasters, esta eficiencia puede reequilibrar la ecuación entre calidad y coste: 1080p60 más estable, 1.440p accesible en más geografías, 4K HDR con menor penalización y mejor mantenimiento de textura en planos complejos. En gaming en la nube y vídeo interactivo, donde laten restricciones de latencia y detalle fino, la combinación de nuevas predicciones y filtros promete menos artefactos a bitrates agresivos.
Un aterrizaje por fases: software hoy, hardware mañana
La adopción real de un códec no se decide el día que se publica la especificación. Ocurre en tres fases que se solapan:
- Software. Librerías de referencia y encoders/decoders optimizados (por ejemplo, ramas “SVT” o implementaciones de AOM), integración en toolchains de transcodificación, plugins para NLEs y soporte en navegadores. Esta fase permite pruebas y despliegues controlados, pero con coste computacional alto, especialmente en codificación.
- Hardware (decode). Cuando los decodificadores por hardware llegan a móviles, TVs y STB, se desbloquea la experiencia masiva del usuario final: autonomía, calor, zapping fluido y estabilidad. Esta suele ser la bisagra de la adopción.
- Hardware (encode). La aceleración de codificación llega después y es decisiva para directos de gran escala y workflows con SLAs muy exigentes. Hasta entonces, la producción live tenderá a apoyarse en códecs previos (HEVC/AV1) según caso de uso, mientras AV2 gana terreno primero en VOD y catálogos.
Dónde coloca AV2 el listón frente a HEVC, VVC y AV1
El ecosistema actual convive con varias generaciones: HEVC (H.265) mantiene presencia en broadcast, Blu-ray y muchas cadenas de producción; VVC (H.266) ofrece mejoras de eficiencia sobre HEVC y AV1, pero arrastra el lastre de royalties y complejidad; AV1 se ha consolidado como el gran códec abierto en navegadores, apps y dispositivos recientes. Si AV2 cristaliza ≈30 % sobre AV1, el lado abierto de la balanza volverá a ganar tracción en eficiencia, disminuyendo el incentivo de moverse hacia opciones con licencias fragmentadas.
Esto no significa que VVC u otros estándares pierdan sentido; cada vertical optimiza con sus propias restricciones (calidad per-pixel, latencia, compatibilidad, licencias, patentes, hardware instalado). Pero para Internet a escala, donde los costes por bit dictan márgenes, AV2 aparece como un sucesor lógico de AV1.
Casos de uso donde AV2 puede brillar
- Streaming global de series y cine. Catálogos con alto peso en 4K, HDR y grano cinematográfico agradecerán el combo de nueva cuantización, transformadas y film grain más flexible.
- Contenido deportivo y directo. La mejor gestión del movimiento con TIP y la mayor eficiencia temporal son buenas noticias, a medio plazo, para directos exigentes (siempre que el encode se optimice lo suficiente).
- Screen content, educación y productividad. La codificación más fina de material mixto (UI + vídeo) reduce artefactos en screencasts, cursos y videoconferencias.
- Vídeo interactivo y cloud gaming. Menos bits a igual calidad significa latencias más competitivas bajo los mismos límites de red, y mejor detalle en texturas complejas.
Qué queda por resolver
- Velocidad de codificación. De salida, los códecs de nueva generación son costosos en CPU/GPU. Hacen falta optimizaciones agresivas y presets equilibrados que acerquen la relación calidad/tiempo a niveles operativos para VOD y, especialmente, live.
- Ecosistema de herramientas. Integraciones en FFmpeg, GStreamer, editores y pipelines profesionales; perfiles y niveles claros; matrices y presets de referencia por caso de uso.
- Disponibilidad de hardware. Sin decode por hardware en los grandes SoCs y televisores, la adopción masiva se ralentiza. Los roadmaps de fabricantes serán el gran termómetro de 2026-2027.
- Pruebas independientes y ciegas. Más allá de VMAF o PSNR, se necesitan paneles de visión y benchmark realista (deportes, animación, grano fuerte, pantalla mixta) para validar la mejora en condiciones del mundo real.
Qué debería hacer la industria desde hoy
- Planificación de migración. Identificar títulos o canales donde el ahorro del 30 % produzca mayor retorno. Empezar por catálogos long-tail o títulos de alto tráfico puede acelerar payback.
- Pilotos controlados. Desplegar A/B tests con AV2 en workflows de VOD y segmentos de audiencia con dispositivos potentes, midiendo QoE, rebuffering y tiempo de visualización.
- Vigilancia de silicio. Seguir de cerca anuncios de decodificación AV2 en móviles, televisores y STBs, y ajustar hojas de ruta de apps y reproductores.
- Formación técnica. Preparar a equipos de vídeo e infraestructura en nuevos diales (matrices, TCQ, TIP, filtros), para exprimir las ganancias sin sorpresas.
Mirando a 2026: el escenario razonable
Si la especificación se cierra a finales de 2025 y el ecosistema responde, 2026 podría ver primeras olas de adopción en VOD y en aplicaciones web donde el software ya sea suficiente en equipos potentes. El salto masivo dependerá del soporte por hardware: cuando los decodificadores empiecen a llegar a gamas medias de móviles y televisores, y los navegadores habiliten paths eficientes, la penetración puede replicar —y acelerar— la trayectoria que ya siguió AV1.
El objetivo, compartido por plataformas, fabricantes y usuarios, es simple de enunciar y difícil de ejecutar: más calidad con menos bits, de forma abierta y sostenible. AV2 se postula como el siguiente peldaño para conseguirlo.

Preguntas frecuentes (FAQ)
¿Cuándo estará lista la especificación de AV2?
La AOMedia prevé cerrar la especificación a finales de 2025. A partir de ese momento, comenzará la carrera por optimizar encoders, actualizar toolchains y preparar el soporte en hardware.
¿Cuánto mejora AV2 frente a AV1?
Las pruebas presentadas por el grupo de trabajo señalan en torno a un 30 % de reducción de bitrate a igual calidad, con mejoras observadas tanto en PSNR-YUV como en VMAF. La ganancia exacta depende del contenido, el preset del encoder y las condiciones de red.
¿Será necesario comprar dispositivos nuevos?
Para una experiencia óptima y eficiente, sí, se necesitará decodificación por hardware en móviles, televisores y set-top boxes de futuras generaciones. Mientras tanto, la reproducción por software será viable en dispositivos potentes, a costa de mayor consumo y posibles limitaciones en escenarios de baja batería.
¿Qué casos de uso notarán antes la mejora?
VOD y catálogos con alto peso de 4K/HDR y grano cinematográfico se beneficiarán pronto. En directos y deportes, el cambio dependerá de la optimización del encoder y la llegada de encode por hardware. El screen content (educación, productividad) también verá menos artefactos a bitrates bajos.
Fuentes
- Alliance for Open Media (AOMedia) — “AV2 Video Codec Architecture”, presentación técnica de Andrey Norkin (Netflix).
- Comunicaciones públicas de AOMedia sobre el calendario de AV2 y cobertura técnica especializada.
- Información sectorial sobre eficiencia comparada y estado de adopción de AV1/HEVC/VVC en plataformas y dispositivos.
- Internet Útil