
DiffusionGemma cambia la forma de generar texto y NVIDIA lo lleva al PC local
Google DeepMind ha lanzado DiffusionGemma, un modelo experimental abierto que intenta romper con una de las bases más asentadas de los grandes modelos de lenguaje: la generación secuencial de texto. En lugar de producir una respuesta token a token, como hacen la mayoría de LLM actuales, este nuevo modelo trabaja con bloques completos y puede refinar hasta 256 tokens en paralelo. NVIDIA ha optimizado DiffusionGemma para ejecutarlo con mayor velocidad en GPUs GeForce RTX, estaciones RTX PRO y sistemas DGX Spark, con el objetivo de acelerar la IA local en equipos personales y profesionales. El movimiento es relevante porque la IA generativa no solo avanza hacia modelos más grandes. También busca modelos más rápidos, más eficientes y más cercanos al




