11 noviembre 2021
Empresas
3 minutos de lectura

NVIDIA mejora la comprensión de idiomas para empresas de todo el mundo

Angel

La compañía NVIDIA acaba de presentar su framework NVIDIA NeMo Megatron, que ha sido concebido para poder entrenar grandes modelos de idiomas en infraestructuras NVIDIA DGX SuperPOD.

Esta combinación reúne software y hardware de nivel empresarial y listo para la producción, que ayudará a las organizaciones de todas las industrias a superar los desafíos de entrenamiento de modelos sofisticados de procesamiento de idiomas naturales.

Con NVIDIA NeMo Megatron, las organizaciones pueden entrenar enormes modelos de habla y de idiomas que pueden escalarse a billones de parámetros en la infraestructura de IA DGX SuperPOD. Esto permite el desarrollo de chatbots específicos del lenguaje y para la industria, asistentes personales, generación de contenido y resumen utilizando modelos que entienden una gama más amplia de contextos y significados.

Enormes Modelos de Idiomas Personalizados que se Desarrollan en Todo el Mundo.

Entre las primeras organizaciones en adoptar los modelos de idiomas complejos con NVIDIA DGX SuperPOD se encuentran SiDi, JD Explore Academy y VinBrain.

SiDi, uno de los institutos de investigación y desarrollo de IA más grandes de Brasil, ha adaptado el asistente virtual de Samsung para que lo usen los 200 millones de hablantes de portugués brasileño de la nación.

JD Explore Academy, la división de investigación y desarrollo de JD.com, un proveedor líder de tecnología y servicios basados en la cadena de suministro, está utilizando NVIDIA DGX SuperPOD para desarrollar NLP para la aplicación del servicio al cliente inteligente, la venta minorista inteligente, la logística inteligente, la IoT, el área de la salud y mucho más.

VinBrain, una compañía de IA del área de la salud con sede en Vietnam, ha utilizado DGX SuperPOD para desarrollar e implementar un modelo de lenguaje clínico para radiólogos y telesalud en 100 hospitales, donde es utilizado por más de 600 profesionales de la salud.

Entrenamiento Simplificado de Grandes Modelos de Idiomas Listos para la Empresa.

NVIDIA NeMo Megatron se basa en los avances del proyecto de investigación de NVIDIA Megatron de código abierto, que estudia el entrenamiento de grandes modelos de idiomas transformadores a escala.

El framework NeMo Megatron automatiza la complejidad de este entrenamiento con bibliotecas de procesamiento de datos que ingieren, curan, organizan y limpian datos. También permite que los grandes modelos de idiomas se distribuyan en miles de GPUs utilizando tecnologías avanzadas para la paralelización de datos, tensores y procesos.

NeMo Megatron está optimizado para la arquitectura DGX SuperPOD, que cuenta con 20 o más sistemas NVIDIA DGX A100 y redes NVIDIA InfiniBand para proporcionar 100 petaflops o más de computación de IA segura y local, que es ideal para entrenar enormes cargas de trabajo masivas de NLP, como Megatron-Turing NLG 530B y GPT-3.

Las empresas pueden solicitar unirse al programa de acceso anticipado para el framework acelerado NVIDIA NeMo Megatron que permite entrenar grandes modelos de idiomas. NVIDIA DGX SuperPOD está disponibles a través de los socios globales de NVIDIA, que pueden proporcionar precios a los clientes calificados que los soliciten.

Regístrarse de forma gratuita para obtener más información sobre los Sistemas DGX durante NVIDIA GTC, que se realizará en línea hasta el 11 de noviembre. Mirar el discurso destacado de GTC a cargo de Jensen Huang, fundador y CEO de NVIDIA, que se transmitirá en vivo el 9 de noviembre y estará disponible en repetición.