Llama es el modelo de lenguaje grande (LLM) de Meta (Facebook, Instagram, WhatsApp) que podemos descargar, instalar y utilizar en local gracias a su libre disponibilidad, desprendiéndonos de la necesidad de emplear servicios como ChatGPT, Claude, u otros y, por lo tanto, no utilizando nuestros datos (que pueden ser sensibles) con servicios de terceras partes.
Basándose en este, NVIDIA ha entrenado a Nemotron, un LLM con nombre de ordenador rebelde de una película de ciencia ficción de serie B, que ha dado muy buenos resultados en las pruebas de Arena Hard, quedando justo por detrás de los principales modelos de lenguaje comerciales: Claude 3.5 Sonnet, o1-preview, o1-mini, GPT-4 turbo, y GPT-4o.
Supera al Llama 3.1 en el que se basa, a Claude 3 Opus, Gemini 1.5, o el modelo de Mistral entre otros.
El objetivo principal de Nemotron es, según NVIDIA, generar datos sintéticos para el entrenamiento de otros modelos de lenguaje, y está optimizado para su uso en inglés. Así pues, para los usuarios de IA que necesitan trabajar generando contenidos en otras lenguas, este modelo puede no serles de demasiada utilidad.
También cuenta con mejoras en la conversación en lenguaje natural, en el razonamiento matemático, la generación de código en varios lenguajes de programación, y la ya comentada generación de datos sintéticos, la cual realiza con una alta calidad para facilitar el entrenamiento de otros LLMs. Todo ello, optimizaciones a las cuales lo ha sometido NVIDIA a partir del Llama 3.1 estándar.
La firma fabricante de GPUs (elemento clave en el desarrollo y uso de la IA) permite el uso comercial de este modelo, así como desarrollar nuevos modelos a partir de él y redistribuirlos, poniéndolo a disposición bajo una licencia abierta de la misma NVIDIA.
Para utilizar Nemotron podemos descargarlo, o bien acceder a él a través de Hugging Face.