Chinese DeepSeek ha lanzado un modelo de código abierto que compite con el modelo o1 de OpenAI

27/01/2025

IBL News | Nueva York

La startup de inteligencia artificial china DeepSeek lanzó un modelo de razonamiento de código abierto llamado DeepSeek-R1 el lunes, y a pesar de un presupuesto de desarrollo más pequeño, afirmó que rivalizaba con el modelo o1 de OpenAI y los sistemas de Google.

Otras empresas chinas presentaron sus modelos de razonamiento en las últimas semanas, incluyendo Moonshot AI, Minimax, iFlyTek y el modelo Doubao-1.5-pro de ByteDance, propietario de TikTok.

Estos modelos aseguran ser capaces de razonar a través de tareas complejas y resolver problemas desafiantes en ciencia, codificación y matemáticas.

También ofrecen precios mejores que los modelos estadounidenses. Por ejemplo, DeepSeek-R1, que se equipara al modelo más potente disponible de OpenAI, o1, ofrece $2.20 por millón de tokens.

Marc Andreessen, socio general de la firma de capital de riesgo Andreessen Horowitz (a16z), publicó en X:

Deepseek R1 es uno de los avances más increíbles e impresionantes que he visto — y siendo de código abierto, un regalo profundo para el mundo. 🤖🫡

— Marc Andreessen 🇺🇸 (@pmarca) 24 de enero de 2025

Yann LeCun, el científico jefe de inteligencia artificial de Meta’s Fundamental AI Research (FAIR), publicó en su cuenta de LinkedIn:

Los ingenieros de DeepSeek dijeron que solo necesitaron alrededor de $6 millones en potencia informática bruta para construir su nuevo sistema.

Las principales compañías de inteligencia artificial del mundo entrenan sus chatbots utilizando supercomputadoras que usan hasta 16,000 chips, si no más. Los ingenieros de DeepSeek, por otro lado, dijeron que solo necesitaban alrededor de 2,000 chips de computadora especializados de Nvidia.

Esto es aproximadamente 10 veces menos de lo que la gigante tecnológica Meta gastó construyendo su última tecnología de inteligencia artificial.

DeepSeek es dirigida por una firma de trading cuantitativo de acciones llamada High Flyer. Para el 2021, había canalizado sus ganancias en la adquisición de miles de chips de Nvidia, que utilizó para entrenar sus modelos anteriores.

La compañía se ha hecho conocida en China por reclutar talento recién graduado de las mejores universidades con la promesa de salarios altos y la posibilidad de seguir sus propias preguntas de investigación.

DeepSeek ha liberado el código subyacente de su última inteligencia artificial. También lanzó un sitio web de chat y una API.

“El centro de gravedad de la comunidad de código abierto se ha estado moviendo hacia China,” dijo Ion Stoica, profesor de informática en la Universidad de California, Berkeley. “Esto podría ser un enorme peligro para EE.UU.” porque permite a China acelerar el desarrollo de nuevas tecnologías.

La semana pasada, el CEO de OpenAI, Sam Altman, dijo que habían finalizado una versión de su nuevo modelo de inteligencia artificial de razonamiento, o3 mini, y lo lanzarían en un par de semanas.

¡Vamos! DeepSeek R1 1.5B corriendo COMPLETAMENTE LOCAL en tu navegador a 60 tok/seg alimentado por WebGPU🔥

¡La inteligencia realmente es demasiado barata para medirla! ⚡️ pic.twitter.com/P3BOSDeFwQ

— Vaibhav (VB) Srivastav (@reach_vb) 21 de enero de 2025

El CEO de Anthropic dice que la inteligencia superhumana representa un…

OpenAI ha lanzado una aplicación Codex exclusiva para Mac como centro…

Google Agrega su Asistente Digital ‘Gemini’ en la aplicación de Maps…

El Columbia State Community College recibe $2 millones en financiamiento federal…

Qwen ha lanzado su último modelo insignia de razonamiento, Max-Thinking

EdX amplía su catálogo gratuito de 100 cursos seleccionados para universidades…

Los MOOC se disparan debido a la pandemia: más de 180…

Un curso de MITx sobre edX explora soluciones para la pobreza…

Develop.com agrega una herramienta basada en inteligencia artificial que recomienda cursos…

Las principales noticias del año sobre edX, Coursera y plataformas de…

Anthropic lanza una biblioteca de mensajes optimizados

OpenAI crea una herramienta de inteligencia artificial para clonación de voz,…

La figura AI del robot humanoide StartUp atrajo el apoyo de…

OpenAI muestra ‘Sora’, un modelo de IA que genera vídeos fotorrealistas

NVIDIA lanza una aplicación de demostración que permite a los usuarios…

Chinese DeepSeek ha lanzado un modelo de código abierto que compite con el modelo o1 de OpenAI

Vídeos Actualidad

Bill Gates se disculpa por sus vínculos con Epstein

Trump afirma que su administración podría adoptar un enfoque “más suave” en materia de control de la inmigración

Empresas de EEUU anuncian la mayor reducción de puestos de trabajo en enero desde 2009

Conversaciones de paz entre Ucrania, Rusia y EEUU continúan mientras Moscú reanuda ataques contra Kiev

Apple prepara su primer teléfono plegable que saldrá al mercado a finales de 2026, según informes

AI y EdTech

Using artificial intelligence to detect scams

Are software companies facing an ‘existential threat’ from AI agents?

AI company unveils Super Bowl ad

How is AI shaping the future of education?

Is Anthropic’s new AI tool a game-changer for the global software industry?