ChatGPT ha lanzado dos modelos de código abierto que se consideran “mejores en su clase”.

ChatGPT ha lanzado dos modelos de código abierto que se consideran “mejores en su clase”.

IBL News | Nueva York

OpenAI lanzó dos modelos de lenguaje de peso abierto esta semana, disponibles para su descarga de forma gratuita y bajo la licencia Apache 2.0 en Hugging Face: gpt-oss-120b y gpt-oss-20b. El último modelo de peso abierto lanzado por OpenAI fue GPT-2, en 2019.

“Estos modelos superan a modelos abiertos de tamaño similar en tareas de razonamiento, demuestran sólidas capacidades de uso de herramientas y están optimizados para una implementación eficiente en hardware de consumo,” afirmó Sam Altman, CEO de OpenAI.

• “El modelo gpt-oss-120b alcanza una paridad cercana con OpenAI o4-mini en pruebas de razonamiento central, mientras se ejecuta de manera eficiente en una única GPU de 80 GB.”

• “El modelo gpt-oss-20b ofrece resultados similares a OpenAI o3-mini en pruebas comunes y puede ejecutarse en dispositivos edge con solo 16 GB de memoria, lo que lo convierte en ideal para casos de uso en dispositivo, inferencia local o iteración rápida sin infraestructura costosa.”

• “Estos modelos son compatibles con nuestra API de Respuestas y están diseñados para ser utilizados en flujos de trabajo agentivos con una instrucción excepcional, uso de herramientas como búsqueda web o ejecución de código Python, y capacidades de razonamiento.”

OpenAI entrenó los modelos en un conjunto de datos principalmente en inglés y solo texto, con un enfoque en STEM, codificación y conocimiento general.

Por lo tanto, estos nuevos modelos solo de texto no son multimodales, pero pueden navegar por la web, llamar a modelos basados en la nube para ayudar con tareas, ejecutar código y navegar en software como un agente de IA. El modelo más pequeño de los dos, gpt-oss-20b, es lo suficientemente compacto como para ejecutarse localmente en un dispositivo de consumo con más de 16 GB de memoria.

OpenAI definió su lanzamiento como “mejores modelos abiertos de su clase”, destacando que funcionan en cualquier lugar: localmente, en dispositivo o a través de proveedores de inferencia de terceros. La compañía se asoció con varias plataformas de implementación como Azure, Hugging Face, vLLM, Ollama, llama.cpp, LM Studio, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare y OpenRouter.

El hecho de que los “pesos” estén disponibles públicamente significa que cualquier desarrollador puede echar un vistazo a los parámetros internos para tener una idea de cómo procesa la información. Pueden funcionar como complemento de los servicios pagados de OpenAI. A diferencia de ChatGPT, puedes ejecutar un modelo gpt-oss sin conexión a Internet y detrás de un firewall.

Con Apache 2.0, los modelos pueden ser utilizados con fines comerciales, redistribuidos e incluidos como parte de otro software con licencia.

Los lanzamientos de modelos de peso abierto de Alibaba’s Qwen así como de Mistral, también operan bajo Apache 2.0.

Para probar los modelos, OpenAI lanzó un patio de juegos de modelos abiertos⁠, junto con guías.

En Estados Unidos, Meta ha sido el líder en modelos de peso abierto. El gigante tecnológico lanzó el primero de su serie de modelos Llama en 2023, con el lanzamiento más reciente de Meta, Llama 4, llegando hace unos meses.

Además, la startup china DeepSeek lanzó su modelo de bajo costo que era de peso abierto este año.

Microsoft Azure: Modelo de código abierto de OpenAI: gpt‑oss en Azure AI Foundry y Windows AI Foundry

NVIDIA: Nuevos Modelos Abiertos de OpenAI Acelerados Localmente en GPUs NVIDIA GeForce RTX y RTX PRO