IBL News | Nueva York
Meta anunció su modelo de IA solo de texto Llama 3.3 70B.
Ahmad Al-Dahle, VP de IA generativa en Meta, dijo en un post en X que Llama 3.3 70B ofrece el rendimiento del modelo Llama más grande, Llama 3.1 405B, a un costo menor, con mejoras en áreas como matemáticas, conocimiento general, seguimiento de instrucciones y uso de aplicaciones.
Al-Dahle publicó un gráfico que muestra que Llama 3.3 70B supera a Gemini 1.5 Pro de Google, GPT-4o de OpenAI y Nova Pro recién lanzado por Amazon en varios referentes de la industria, incluido MMLU, que evalúa la capacidad de entender el lenguaje de un modelo.
Llama 3.3 70B está disponible para descarga desde Hugging Face y el sitio web oficial de Llama.
El último movimiento de Meta es dominar el campo de la IA con “modelos de código abierto que pueden ser usados y comercializados de manera equitativa para varias aplicaciones”.
El CEO de Meta AI, Mark Zuckerberg, dijo que la compañía tiene casi 600 millones de usuarios mensuales activos en los modelos de Llama.
Sin embargo, entrenar modelos de AI generativa es un negocio costoso.
La compañía anunció este mes que construiría un centro de datos de IA de $10 mil millones en Louisiana, el centro de datos de IA más grande que Meta haya construido.
Meta ha adquirido un grupo de más de 100,000 GPU de Nvidia para el desarrollo de modelos, rivalizando con los recursos de competidores como xAI.
Presentando Llama 3.3 – un nuevo modelo de 70B que ofrece el rendimiento de nuestro modelo 405B pero es más fácil y rentable de ejecutar. Al aprovechar los últimos avances en técnicas de post-entrenamiento, incluida la optimización de preferencias en línea, este modelo mejora el rendimiento central en… pic.twitter.com/6oQ7b3Yuzc
— Ahmad Al-Dahle (@Ahmad_Al_Dahle) 6 de diciembre de 2024