Los proyectos de software de código abierto dominarán los LLM

Los proyectos de software de código abierto dominarán los LLM

Noticias IBL | Nueva York

Los expertos dicen que, como sucedió con Linux, el sistema operativo de clase mundial, el código abierto dominará el futuro de los LLM y los modelos de imagen. Incluso Google reconoció que no tienen foso en este nuevo mundo de apertura fuente de IA.

“Si estás creando un producto nativo de IA, tu objetivo principal es salir de OpenAI lo antes posible”, escribió Varun Shenoy en el artículo viral titulado “Por qué ganará la IA de código abierto”.

Además, el uso a largo plazo de proveedores de modelos de código cerrado como OpenAI o Anthropic expone a una empresa nativa de IA a riesgos indebidos. Cada empresa necesita ser dueña de su producto principal, y su producto principal es un modelo entrenado con datos propietarios.

El consenso es que los modelos de código abierto son increíblemente buenos en las tareas más valiosas, ya que pueden ajustarse para cubrir probablemente hasta el 99% de los casos de uso cuando un producto ha recopilado suficientes datos etiquetados.

Si bien los contextos han aumentado, los requisitos de hardware para ejecutar modelos masivos también se han reducido.

La Llama original tiene una longitud de contexto de 2k tokens. Llama 2 tiene una longitud de contexto de 4k. Sin embargo, todavía no tenemos acceso a GPT-4 32k. Esta es la velocidad del código abierto.

Los usuarios ahora pueden ejecutar modelos de lenguaje masivos desde su Macbook gracias a proyectos como Llama.cpp.

En el lado de la generación de imágenes, Stable Diffusion XL (SDXL), el mejor modelo de código abierto, está a la par con Midjourney. Hugging Face es el nuevo Red Hat.

  • “Linux tuvo éxito porque fue creado de forma abierta. Los usuarios sabían exactamente lo que estaban obteniendo y tuvieron la oportunidad de registrar errores o incluso intentar solucionarlos por su cuenta con el apoyo de la comunidad. Lo mismo ocurre con el sistema abierto. modelos fuente.
  • El código abierto es mucho más difícil de utilizar que los modelos de código cerrado. Parece que es necesario contratar un equipo de ingenieros de aprendizaje automático para construir sobre código abierto en lugar de utilizar la API OpenAI. Esto está bien y será cierto en el corto plazo. Éste es el costo del control y el rápido ritmo de la innovación.
  • Los proveedores de modelos de código cerrado han captado la mentalidad colectiva de este ciclo de exageración de la IA. La gente no tiene tiempo para perder el tiempo con el código abierto, ni tiene conciencia de lo que el código abierto es capaz de hacer. Pero sí conocen OpenAI, Pinecone y LangChain.
  • A medida que las ofertas de código abierto maduren y se vuelvan más fáciles de usar y personalizables, surgirán como la opción superior para muchas aplicaciones.
  • En lugar de dejarse llevar por las exageraciones, las organizaciones con visión de futuro aprovecharán este período para comprender profundamente sus necesidades y sentar las bases para aprovechar al máximo la IA de código abierto. Construirán experiencias de IA defendibles y diferenciadas sobre tecnología abierta. Este enfoque mesurado permite una ventaja competitiva sostenible a largo plazo.