AMD ha presentado nuevos resultados de rendimiento en inteligencia artificial que sitúan sus tarjetas gráficas profesionales RDNA 3 de 48 GB por delante de la RTX 4090 de Nvidia. Según pruebas realizadas con DeepSeek R1, la Radeon Pro W7900 y la Radeon Pro W7800, ambas con 48 GB de VRAM, lograron hasta 7,3 veces más rendimiento que la RTX 4090 en ciertos escenarios de inferencia de modelos de lenguaje.
Resultados de las pruebas en DeepSeek R1
David McAfee, vicepresidente y gerente general de Ryzen CPUs y Radeon Graphics en AMD, compartió en X (anteriormente Twitter) una serie de pruebas realizadas con LM Studio 0.3.12 y Llama.cpp runtime 1.18, comparando el rendimiento de las GPU en cuatro configuraciones distintas:
Prueba | RTX 4090 | Pro W7800 48GB | Pro W7900 48GB |
---|---|---|---|
Distill Qwen 32B 8-bit | 2,7 tokens/s | 19,1 tokens/s | 19,8 tokens/s |
Distill Llama 70B 4-bit | 2,3 tokens/s | 12,8 tokens/s | 12,7 tokens/s |
Distill Qwen 32B 8-bit (variante) | 2,5 tokens/s | 15,7 tokens/s | 16,2 tokens/s |
Distill Llama 70B 4-bit (variante) | 2,0 tokens/s | 10,1 tokens/s | 10,4 tokens/s |
En términos de mejora de rendimiento frente a la RTX 4090, AMD afirma que sus GPU RDNA 3 de 48 GB son:
- 7,3 veces más rápidas en Distill Qwen 32B 8-bit.
- 6,5 veces más rápidas en otra variante de Distill Qwen 32B 8-bit.
- 5,5 veces más rápidas en Distill Llama 70B 4-bit.
- 5,2 veces más rápidas en otra variante de Distill Llama 70B 4-bit.
El impacto de la VRAM en modelos de IA
Uno de los factores clave en el rendimiento de estos modelos de inteligencia artificial es la cantidad de VRAM disponible. En tareas de inferencia con modelos de lenguaje extenso (LLM), los parámetros se almacenan directamente en la memoria de la GPU. En este sentido, AMD argumenta que sus modelos con 48 GB de VRAM pueden manejar los modelos más grandes de DeepSeek R1 sin necesidad de dividir la carga en varias GPU.

Sin embargo, este beneficio viene con un coste elevado. La Radeon Pro W7900 de 48 GB tiene un precio de 3.500 dólares, lo que la sitúa 1.500 dólares por encima del precio base de la RTX 5090 (2.000 dólares) y 2.000 dólares más que la RTX 4090 (1.500 dólares en su lanzamiento). Aun así, sigue siendo más asequible que la RTX A6000 Ada de 48 GB, la opción más cercana de Nvidia en términos de capacidad de VRAM.
El contraataque de Nvidia
Aunque estos resultados posicionan a AMD como una opción competitiva para cargas de trabajo de inteligencia artificial, la compañía ha evitado comparar sus GPU con la nueva RTX 5090, el modelo insignia más reciente de Nvidia. Anteriormente, cuando AMD publicó benchmarks similares sobre la RX 7900 XTX, Nvidia respondió con sus propios datos, mostrando que su GPU superaba a la de AMD en DeepSeek R1 bajo configuraciones similares.
Es probable que Nvidia contraataque con nuevos benchmarks para demostrar el rendimiento de sus modelos más recientes frente a las RDNA 3 de 48 GB, sobre todo considerando que la RTX 5090 solo cuenta con 32 GB de GDDR7 frente a los 48 GB de las tarjetas de AMD.
El panorama de las GPU para inteligencia artificial sigue evolucionando, y aunque AMD muestra ventajas en memoria VRAM y rendimiento en ciertas pruebas, la batalla por la supremacía en IA entre Nvidia y AMD está lejos de decidirse.