Databricks adquirirá la empresa emergente de código abierto AI MosaicML por $ 1.3 mil millones

Databricks adquirirá la empresa emergente de código abierto AI MosaicML por $ 1.3 mil millones

Noticias IBL | Nueva York

Databricks, la empresa emergente de administración y almacenamiento de datos con sede en San Francisco, esta semana, anunció que pagará 1300 millones de dólares para adquirir MosaicML, una startup de código abierto que permite a las empresas crear LLM (modelos de lenguaje extenso) de bajo costo con datos patentados.

Sus dos modelos, MPT-7B y el reciente lanzamiento de MPT-30B, tuvo 3,3 millones de descargas.

Se espera que el acuerdo se cierre durante el segundo trimestre de Databricks que finaliza el 31 de julio.

“Todas las organizaciones deberían poder beneficiarse de la revolución de la IA con más control sobre cómo se usan sus datos. Databricks y MosaicML tienen una oportunidad increíble para democratizar la IA y hacer de Lakehouse el mejor lugar para construir IA generativa y LLM”. dijo Ali Ghodsi, cofundador y director ejecutivo de Databricks.

Databricks tiene la intención de combinar su plataforma Lakehouse con la tecnología de MosaicML para ofrecer a los clientes una forma de capacitar y usar LLM con más control y propiedad sobre cómo se usan sus datos.

Según MosaicML, “combinado con una escala de recursos casi lineal, los modelos de miles de millones de parámetros se pueden entrenar en horas, no en días, y costará miles de dólares, no millones”.

Lanzado en 2021 y con una plantilla de 62 empleados en la actualidad, MosaicML había recaudado 64 millones de dólares de inversores que incluían DCVC, AME Cloud Ventures, Lux, Frontline, Atlas, Playground Global y Samsung Next.

Empresas como Anthropic y OpenAI otorgan licencias de modelos de lenguaje listos para usar a las empresas, que luego crean aplicaciones generativas de IA encima de ellas. MosaicML dice que pueden ofrecer modelos de IA similares pero a un costo menor y personalizarlos con los datos de una empresa. Según los expertos, el costo actual de entrenar un modelo con datos especializados se estima entre $ 1 millón y $ 2 millones. Ese tipo de modelos específicos de dominio pueden ser más útiles para las empresas que construir sobre todo el corpus de datos que OpenAI. Los modelos de lenguaje se están afinando para aplicaciones muy específicas y, en ese momento, son tan pequeños que podrían integrarse en cualquier teléfono celular.

Algunos de esos modelos que utilizan modelos preentrenados más pequeños ya están disponibles en bibliotecas de código abierto como las que ofrece la empresa emergente de aprendizaje automático Hugging Face.
.