La startup francesa Mistral AI ha dado un paso significativo en el mundo de la inteligencia artificial con el lanzamiento de Pixtral Large, un modelo multimodal con 124.000 millones de parámetros. Este sistema se posiciona como uno de los más avanzados del mercado, ofreciendo capacidades líderes en comprensión de textos, imágenes, gráficos y documentos complejos, superando a modelos como GPT-4o y Gemini 1.5 Pro en pruebas clave.
Pixtral Large: innovación en comprensión multimodal
Pixtral Large destaca por su capacidad para procesar simultáneamente hasta 30 imágenes de alta resolución o un libro de 300 páginas, gracias a su ventana de contexto ampliada de 128.000 tokens. Este modelo, basado en el exitoso Mistral Large 2, combina un codificador de visión con 1.000 millones de parámetros y un decodificador multimodal con 123.000 millones de parámetros, manteniendo su liderazgo en tareas textuales mientras expande su dominio a datos visuales complejos.
Entre los logros destacados del modelo están:
- MathVista: 69,4 % de precisión en razonamiento matemático visual, superando a todos los modelos actuales.
- DocVQA y ChartQA: Mejor rendimiento en comprensión de documentos y gráficos frente a GPT-4o y Gemini 1.5 Pro.
- MM-MT-Bench: Líder en esta evaluación diseñada para medir el desempeño en casos reales de uso multimodal.
Le Chat: un espacio de trabajo integral impulsado por Pixtral Large
La plataforma Le Chat de Mistral también ha recibido importantes actualizaciones, transformándose en un entorno integral para la creación y gestión de contenido. Entre las novedades destacan:
- Búsqueda web integrada.
- Análisis avanzado de documentos.
- Generación de imágenes, gracias a la tecnología Flux Pro de Black Forest Labs.
- Canvas: una herramienta para la creación y edición de contenido en tiempo real, similar a las ofrecidas por OpenAI y Anthropic.
Durante su fase beta, estas funciones estarán disponibles de manera gratuita, lo que permite a los usuarios experimentar con capacidades de última generación sin barreras económicas.

Disponibilidad y licencias
Pixtral Large está disponible bajo dos tipos de licencias:
- Licencia de investigación de Mistral (MRL): para uso académico y educativo.
- Licencia comercial: para pruebas, desarrollo y aplicaciones comerciales.
El modelo puede probarse directamente en la plataforma Le Chat, descargarse desde el sitio oficial de Mistral, o integrarse a través de su API como pixtral-large-latest.
Impacto en el panorama global de la IA
Con este lanzamiento, Mistral se posiciona como un fuerte competidor en un mercado históricamente dominado por empresas estadounidenses. Ofreciendo modelos de código abierto y accesibles, la compañía francesa subraya su compromiso con una IA más inclusiva y colaborativa, marcando un cambio en la dinámica competitiva del sector.
Pixtral Large no solo refuerza el liderazgo de Mistral en el desarrollo de modelos multimodales, sino que también muestra cómo la innovación europea puede desafiar a gigantes tecnológicos, ofreciendo soluciones avanzadas para casos de uso reales en sectores como finanzas, atención sanitaria, investigación y más.
Mistral Large 24.11: mejoras continuas en comprensión textual
Además de Pixtral Large, Mistral ha lanzado una actualización de su modelo textual insignia, Mistral Large 24.11, ahora disponible en plataformas como Google Cloud y Microsoft Azure. Este modelo mejora la comprensión de contextos largos, introduce un sistema de prompts optimizado y funciones más precisas, lo que lo hace ideal para flujos de trabajo empresariales como automatización de tareas y exploración del conocimiento.
Con Pixtral Large y Mistral Large 24.11, Mistral AI reafirma su compromiso con la innovación en inteligencia artificial, ofreciendo herramientas potentes y accesibles que prometen transformar la manera en que interactuamos con datos complejos en múltiples formatos.
fuente: Noticias Inteligencia Artificial