La nueva versión lidera los benchmarks internacionales y consolida la apuesta de Google por una IA autónoma y razonadora
Google ha presentado oficialmente Gemini 2.5, su modelo de inteligencia artificial más potente y sofisticado hasta el momento, marcando un nuevo hito en el desarrollo de tecnologías cognitivas avanzadas. Esta evolución, que se posiciona como un salto cualitativo respecto a versiones anteriores, refuerza la estrategia del gigante tecnológico en su carrera por liderar la próxima generación de agentes inteligentes.
El modelo Gemini 2.5 Pro Experimental, primera iteración de esta nueva generación, ya encabeza los principales rankings de evaluación como LMArena, una clasificación basada en preferencias humanas. Los resultados destacan su capacidad de razonamiento avanzado, así como un rendimiento sobresaliente en programación, matemáticas y ciencias, sin recurrir a técnicas adicionales de votación mayoritaria, que suelen elevar el consumo de recursos computacionales.
IA que “piensa” antes de responder
A diferencia de otros sistemas que se limitan a clasificar o predecir resultados, Gemini 2.5 introduce el concepto de modelos de pensamiento, capaces de interpretar el contexto, analizar información, extraer conclusiones lógicas y tomar decisiones fundamentadas antes de generar una respuesta. Esta evolución es posible gracias a una combinación entre un modelo base más robusto y un proceso de postentrenamiento refinado, que mejora sustancialmente la calidad de las respuestas.
Líder en pruebas técnicas
Los resultados de Gemini 2.5 Pro no solo son teóricos. En pruebas como AIME 2025, centrada en matemáticas de alto nivel, y GPQA, que evalúa preguntas científicas complejas, el modelo ha superado con creces a sus predecesores. Además, ha alcanzado un 18,8 % de acierto en el reto Humanity’s Last Exam, una batería de pruebas desarrolladas por cientos de expertos para poner a prueba el razonamiento en los límites del conocimiento humano.
Notables mejoras en programación
Uno de los ámbitos donde más destaca esta nueva versión es en la programación. En la plataforma SWE-Bench Verified, utilizada para validar la capacidad de los agentes de código, Gemini 2.5 ha alcanzado un 63,8 % de éxito en pruebas automatizadas. Esto supone una mejora notable respecto a Gemini 2.0. Según los datos publicados, el modelo es capaz de crear aplicaciones web interactivas, modificar código existente e incluso desarrollar videojuegos a partir de simples descripciones textuales.
Multimodalidad y contexto masivo
Gemini 2.5 continúa apostando por la multimodalidad nativa, lo que significa que puede trabajar de forma simultánea con texto, imágenes, vídeo, audio y código. Este enfoque lo convierte en una herramienta más versátil y aplicable a casos reales más complejos.
Otro de sus avances destacados es la ampliación del contexto operativo: ahora puede manejar hasta 1 millón de tokens, lo que permite analizar documentos extensos, múltiples fuentes de datos o estructuras complejas de programación. Google ha adelantado que esta capacidad será próximamente ampliada hasta los 2 millones de tokens.
Disponibilidad y entorno empresarial
Gemini 2.5 ya está disponible para pruebas a través de Google AI Studio y en la aplicación móvil y de escritorio Gemini Advanced. Asimismo, el modelo será integrado en las próximas semanas en Vertex AI, la plataforma de inteligencia artificial en la nube de Google, adaptado para entornos empresariales con planes de precios flexibles y límites escalables.
Una apuesta firme por la autonomía inteligente
Según declaraciones de Koray Kavukcuoglu, vicepresidente de investigación de Google DeepMind, el futuro de la inteligencia artificial en la compañía pasa por sistemas más autónomos y capaces de entender el contexto con profundidad:
“Estamos construyendo agentes cada vez más capaces y conscientes del entorno, con el objetivo de ayudar a resolver problemas reales y complejos”, afirmó el ejecutivo.
Con Gemini 2.5, Google consolida su liderazgo en la carrera por la inteligencia artificial general, estableciendo un nuevo estándar en el sector y sentando las bases de lo que será una IA cada vez más razonadora, útil y fiable para desarrolladores, investigadores, empresas y usuarios avanzados.
Fuente: Noticias inteligencia artificial