Nvidia se enfrenta a graves acusaciones por la recopilación masiva de videos en línea con el propósito de entrenar sus modelos de inteligencia artificial. Según un informe de 404 Media, un ex empleado anónimo de la compañía reveló que Nvidia ha estado usando estos videos no solo para investigación, sino también para mejorar productos comerciales como Omniverse, su generador de mundos 3D, y sistemas de vehículos autónomos. La empresa habría instruido a varios empleados para descargar videos, generando preocupaciones sobre la legalidad y ética de esta práctica.
Ming-Yu Liu, vicepresidente de Investigación de Nvidia, afirmó que estas actividades contaban con una «aprobación ejecutiva», aunque la controversia persiste. La compañía parece estar expandiendo su rol más allá del hardware de IA hacia el desarrollo de modelos fundamentales utilizando grandes volúmenes de datos. Nvidia ha indicado que está construyendo una infraestructura capaz de generar datos de entrenamiento equivalentes a una vida humana de experiencia visual por día.
La controversia se enmarca en un contexto más amplio de disputas legales sobre la recopilación de datos para IA, que afecta a empresas como OpenAI y Stability AI. A medida que el debate sobre la legalidad del uso de datos para entrenar IA continúa, Nvidia está trabajando para consolidar su posición en un mercado altamente competitivo. La legislación en torno a estas prácticas aún está en desarrollo, con propuestas como el AI Foundation Model Transparency Act en el Congreso.
El proyecto de IA de Nvidia, conocido como Cosmos, comenzó en febrero de 2024 y ha recopilado hasta ahora 38.5 millones de URLs, con un porcentaje significativo proveniente de videos cinematográficos. Con la falta de una normativa clara, Nvidia parece acelerar su desarrollo en un área legalmente incierta.