Investigadores de Apple y Columbia lanzaron un LLM multimodal de código abierto

28/12/2023

Noticias IBL | Nueva York

En octubre de 2023, investigadores de Apple y la Universidad de Columbia publicaron el código y los pesos de un LLM multimodal (MLLM) de código abierto, únicamente para uso en investigación. Se llamaba Ferret y no recibió mucha atención en ese entonces.

Además, Apple anunció recientemente que logró un gran avance en la implementación de LLM en iPhone y iPad, incluidas nuevas técnicas para avatares 3D y experiencias visuales más inmersivas.

Ferret incluye la selección de “GRIT, un completo conjunto de datos de ajuste de instrucciones de referencia y terreno que incluye 1,1 millones de muestras que contienen un rico conocimiento espacial jerárquico, con 95.000 datos negativos concretos para promover la solidez del modelo”.

“El modelo resultante no sólo logra un rendimiento superior en las tareas clásicas de referencia y conexión a tierra, sino que también supera en gran medida a los MLLM existentes en el chat multimodal basado en regiones y con demanda de localización”, escribieron los creadores de Ferret.

Curiosamente, las noticias sobre el código abierto de Apple y los desarrollos locales de ML se producen cuando Anthropic y OpenAI están negociando nuevos aumentos masivos de financiación para sus esfuerzos de desarrollo de LLM patentados.

De alguna manera me perdí esto. @Apple se unió a la comunidad de IA de código abierto en octubre. La presentación de Ferret es un testimonio del compromiso de Apple con la investigación impactante de la IA, consolidando su lugar como líder en el espacio de la IA multimodal. Así se hace @Apple – PD: Estoy deseando que llegue el día… https://t.co/Pi1kQrsVvx

— Bart de Witte (@OpenMedFuture) 23 de diciembre de 2023

Microsoft Research presenta VASA-1, un marco de inteligencia artificial para generar…

La Fundación Linux atrae a Intel y otros líderes de la…

Anthropic lanza una aplicación iOS gratuita para su Claude Chatbot

La policía tomó un edificio en la Universidad de Columbia y…

EdX amplía su catálogo gratuito de 100 cursos seleccionados para universidades…

Los MOOC se disparan debido a la pandemia: más de 180…

Un curso de MITx sobre edX explora soluciones para la pobreza…

Develop.com agrega una herramienta basada en inteligencia artificial que recomienda cursos…

Las principales noticias del año sobre edX, Coursera y plataformas de…

Anthropic lanza una biblioteca de mensajes optimizados

OpenAI crea una herramienta de inteligencia artificial para clonación de voz,…

La figura AI del robot humanoide StartUp atrajo el apoyo de…

OpenAI muestra ‘Sora’, un modelo de IA que genera vídeos fotorrealistas

NVIDIA lanza una aplicación de demostración que permite a los usuarios…

Investigadores de Apple y Columbia lanzaron un LLM multimodal de código abierto

Vídeos Actualidad

Juicio a Trump: Hope Hicks describe “crisis” tras filtración de cinta de Access Hollywood

España: Sánchez insta a decidir entre la democracia o el “barrizal” de PP y Vox

Las ventas del iPhone de Apple caen en casi todos los países

Exabogado de Stormy Daniels testifica en juicio penal contra Trump en Nueva York

EEUU añade 175.000 empleos en abril, por debajo de las estimaciones

AI y EdTech

AI-powered MRI scans and a push for hospital price transparency

Building more efficient AI: How liquid AI is working to optimize AI

Companies will hire more as a result of AI

AI must not control nuclear weapons, US State Department urges China and Russia

Geometric deep learning: From Euclid to drug design