Los investigadores de Hugging Face lanzan un proyecto comunitario para abrir completamente el código fuente de DeepSeek’s R1

Los investigadores de Hugging Face lanzan un proyecto comunitario para abrir completamente el código fuente de DeepSeek’s R1

IBL News | Nueva York

Los investigadores de Hugging Face, liderados por Leandro von Werra, lanzaron Open-R1, un modelo que busca construir y hacer completamente de código abierto una réplica del R1 de DeepSeek, ya que esta versión china utiliza algunas herramientas que no están disponibles públicamente.

Su objetivo es replicar R1 en unas pocas semanas, confiando en parte en el Hugging Face’s Science Cluster, un servidor de investigación dedicado con 768 GPU Nvidia H100.

Este equipo de ingenieros de Hugging Face planea solicitar ayuda de las comunidades de inteligencia artificial en Hugging Face y GitHub, donde se aloja el proyecto Open-R1, para construir un proceso de aprendizaje.

Open-R1 llega una semana después de que no tan abierto DeepSeek hiciera público su modelo de inteligencia artificial R1 reasoning. Trae todos sus componentes, incluidos los datos utilizados para entrenar el modelo, como código abierto.

“El modelo R1 es impresionante, pero no hay un conjunto de datos abierto, detalles de experimentos ni modelos intermedios disponibles, lo que dificulta la replicación y la investigación adicional,” explicó Elie Bakouch, uno de los ingenieros de Hugging Face en el proyecto Open-R1, dijo a TechCrunch. “Tener control sobre el conjunto de datos y el proceso es crucial para implementar un modelo de manera responsable en áreas sensibles, y ayuda a comprender y abordar los sesgos en el modelo”

“Necesitamos asegurarnos de implementar los algoritmos y recetas correctamente, y esto es algo en lo que un esfuerzo comunitario es perfecto para abordar, donde se obtienen tantos ojos en el problema como sea posible,” dijo Von Werra.

El proyecto Open-R1 atrajo 10,000 estrellas en solo tres días en GitHub, notando un gran interés en el proyecto.

“Estamos realmente emocionados por los recientes lanzamientos de código abierto que están fortaleciendo el papel de la apertura en la inteligencia artificial. Es un cambio importante para el campo que cambia la narrativa de que solo un puñado de laboratorios pueden progresar y que el código abierto se está rezagando.”

Financiado por un fondo de cobertura cuantitativo chino, el modelo R1 de DeepSeek coincide, e incluso supera, el rendimiento del modelo de razonamiento o1 de OpenAI en varios benchmarks.

Al ser un modelo de razonamiento, ayuda a evitar errores en los que generalmente tropiezan los modelos al verificar efectivamente hechos, aunque tarda segundos en responder. La ventaja es que tienden a ser más confiables en dominios de física, ciencia y matemáticas.

DeepSeek R-1 Explicado