El lanzamiento de DeepSeek-R1 revolucionó Internet hace unas semanas (y continúa haciéndolo), pero también nos ha legado varias incógnitas relacionadas con su forma de funcionamiento y, más concretamente, de cómo puede conseguir ofrecer un rendimiento y resultado tan similar al que proporciona el modelo o1 de OpenAI, sin requerir los grandes recursos de hardware de este último.
Tal es la incógnita que un conjunto de desarrolladores han decidido iniciar, por su cuenta, el proyecto Open-R1, cuya meta es la de reconstruir de forma sistemática el entrenamiento y la mezcla de datos utilizados en DeepSeek-R1, permitiendo a la comunidad académica e industrial replicar y contrastar estos métodos.
Ello es posible gracias a que DeepSeek ha publicado en abierto documentación técnica sobre el algoritmo de su LLM y la forma de entrenarlo, pero no el conjunto de datos con el cual lo ha entrenado.
Lo que buscan hacer desde Open-R1 es “ingeniería inversa”, es decir: en primer lugar, extraer el conjunto de datos de razonamiento de alta calidad a partir de la información disponible de DeepSeek-R1 para, posteriormente, pasar a replicar el entrenamiento reforzado al que la compañía DeepSeek ha sometido su modelo de lenguaje.
La última fase del proyecto no es otra que la validación del funcionamiento del modelo a partir de las pruebas que se vayan realizando, mediante una serie de tests y el ajuste fino supervisado.
El objetivo último no es otro que, mediante la validación de lo que afirman desde DeepSeek, contribuir a evitar inversiones innecesarias en hardware, lo que supone no solamente un ahorro económico para la empresa que debe poner en marcha un servidor de IA, sino que también supone un ahorro energético.
Recordemos que DeepSeek-R1 (y, para Open-R1 debería ser exactamente lo mismo si las afirmaciones de DeepSeek son validadas desde el proyecto libre) consume menos recursos de hardware que el modelo o1 de OpenAI, como he indicado antes, lo que facilita que pueda absorber un mayor volumen de trabajo con el hardware existente.
Desde el proyecto Open-R1 hacen un llamamiento a toda la comunidad de los desarrolladores interesados en participar, así como a toda aquella persona que quiera contribuir, aunque no sea con código fuente, con su participación en los foros de discusión, con el fin de consolidar este esfuerzo colectivo en la mejora y expansión de los modelos de razonamiento.