IBL News | Nueva York
La startup de inteligencia artificial china DeepSeek lanzó un modelo de razonamiento de código abierto llamado DeepSeek-R1 el lunes, y a pesar de un presupuesto de desarrollo más pequeño, afirmó que rivalizaba con el modelo o1 de OpenAI y los sistemas de Google.
Otras empresas chinas presentaron sus modelos de razonamiento en las últimas semanas, incluyendo Moonshot AI, Minimax, iFlyTek y el modelo Doubao-1.5-pro de ByteDance, propietario de TikTok.
Estos modelos aseguran ser capaces de razonar a través de tareas complejas y resolver problemas desafiantes en ciencia, codificación y matemáticas.
También ofrecen precios mejores que los modelos estadounidenses. Por ejemplo, DeepSeek-R1, que se equipara al modelo más potente disponible de OpenAI, o1, ofrece $2.20 por millón de tokens.
Marc Andreessen, socio general de la firma de capital de riesgo Andreessen Horowitz (a16z), publicó en X:
Deepseek R1 es uno de los avances más increíbles e impresionantes que he visto — y siendo de código abierto, un regalo profundo para el mundo. 🤖🫡
— Marc Andreessen 🇺🇸 (@pmarca) 24 de enero de 2025
Yann LeCun, el científico jefe de inteligencia artificial de Meta’s Fundamental AI Research (FAIR), publicó en su cuenta de LinkedIn:
Los ingenieros de DeepSeek dijeron que solo necesitaron alrededor de $6 millones en potencia informática bruta para construir su nuevo sistema.
Las principales compañías de inteligencia artificial del mundo entrenan sus chatbots utilizando supercomputadoras que usan hasta 16,000 chips, si no más. Los ingenieros de DeepSeek, por otro lado, dijeron que solo necesitaban alrededor de 2,000 chips de computadora especializados de Nvidia.
Esto es aproximadamente 10 veces menos de lo que la gigante tecnológica Meta gastó construyendo su última tecnología de inteligencia artificial.
DeepSeek es dirigida por una firma de trading cuantitativo de acciones llamada High Flyer. Para el 2021, había canalizado sus ganancias en la adquisición de miles de chips de Nvidia, que utilizó para entrenar sus modelos anteriores.
La compañía se ha hecho conocida en China por reclutar talento recién graduado de las mejores universidades con la promesa de salarios altos y la posibilidad de seguir sus propias preguntas de investigación.
DeepSeek ha liberado el código subyacente de su última inteligencia artificial. También lanzó un sitio web de chat y una API.
“El centro de gravedad de la comunidad de código abierto se ha estado moviendo hacia China,” dijo Ion Stoica, profesor de informática en la Universidad de California, Berkeley. “Esto podría ser un enorme peligro para EE.UU.” porque permite a China acelerar el desarrollo de nuevas tecnologías.
La semana pasada, el CEO de OpenAI, Sam Altman, dijo que habían finalizado una versión de su nuevo modelo de inteligencia artificial de razonamiento, o3 mini, y lo lanzarían en un par de semanas.
¡Vamos! DeepSeek R1 1.5B corriendo COMPLETAMENTE LOCAL en tu navegador a 60 tok/seg alimentado por WebGPU🔥
¡La inteligencia realmente es demasiado barata para medirla! ⚡️ pic.twitter.com/P3BOSDeFwQ
— Vaibhav (VB) Srivastav (@reach_vb) 21 de enero de 2025