Apple lanzó ‘MGIE’, un modelo multimodal de IA de código abierto para edición de imágenes

12/02/2024

Noticias IBL | Nueva York

Apple lanzó la semana pasada MGIE (edición de imágenes guiada por MLLM), una nueva herramienta de código abierto. Modelo de IA que edita imágenes basándose en instrucciones en lenguaje natural. Aprovecha los modelos de lenguaje grande multimodal (MLLM) para interpretar comandos de usuario y realizar manipulaciones a nivel de píxeles.

Los expertos coincidieron en que MGIE representa un gran avance y destacaron que el ritmo del progreso en los sistemas de IA multimodal se está acelerando rápidamente.

El modelo puede manejar una amplia gama de escenarios de edición, como ajustes simples de color y brillo, optimización de fotografías, manipulaciones de objetos y modificaciones al estilo de Photoshop, como recortar, cambiar el tamaño, rotar, voltear y agregar filtros.

Por ejemplo, una instrucción puede hacer que el cielo sea más azul y MGIE produce la instrucción para aumentar la saturación de la región del cielo en un 20 %.

MGIE, que fue presentado en un artículo aceptado en la Conferencia Internacional sobre Representaciones del Aprendizaje (ICLR) 2024 — es el resultado de una colaboración entre Apple e investigadores de la Universidad de California, Santa Bárbara.

MGIE está disponible como un proyecto código abierto en GitHub. El proyecto también proporciona un cuaderno de demostración que muestra cómo utilizar MGIE para diversas tareas de edición. Los usuarios también pueden probar MGIE en línea a través de una demostración web alojada en Hugging Face Spaces.
.

La Universidad de Boston agrega recortes a su presupuesto operativo y…

El xAI de Elon Musk, “Grok 4”, fue lanzado en respuesta…

La editorial educativa McGraw-Hill presenta una solicitud para una Oferta Pública…

Microsoft proporcionará $4 mil millones a escuelas, colegios comunitarios, colegios técnicos…

El Sindicato de Profesores crea una Academia Nacional para la Instrucción…

EdX amplía su catálogo gratuito de 100 cursos seleccionados para universidades…

Los MOOC se disparan debido a la pandemia: más de 180…

Un curso de MITx sobre edX explora soluciones para la pobreza…

Develop.com agrega una herramienta basada en inteligencia artificial que recomienda cursos…

Las principales noticias del año sobre edX, Coursera y plataformas de…

Anthropic lanza una biblioteca de mensajes optimizados

OpenAI crea una herramienta de inteligencia artificial para clonación de voz,…

La figura AI del robot humanoide StartUp atrajo el apoyo de…

OpenAI muestra ‘Sora’, un modelo de IA que genera vídeos fotorrealistas

NVIDIA lanza una aplicación de demostración que permite a los usuarios…

Apple lanzó ‘MGIE’, un modelo multimodal de IA de código abierto para edición de imágenes

Vídeos Actualidad

Nvidia anuncia que planea reanudar las ventas del chip de IA clave ‘H20’ a China

EEUU: La inflación aumentó en junio un 0,3% intermensual y un 2,7% interanual

Los planes de Trump sobre armas en Ucrania son “muy serios”, según el Kremlin

Pamplona da por finalizado San Fermín con el ‘Pobre de mí’

Trump amenaza con “severos aranceles” a Rusia si no hay acuerdo para acabar con la guerra en 50 días

AI y EdTech

Stacey Abrams on her new book and the ethical questions of AI

Layoff fears and AI are reportedly causing people more workplace insecurity

Why AI won’t replace your doctor

AI dating features face rejection from younger people

Meta’s new superintelligence lab is discussing major AI strategy changes