Meta anunció CM3LEON, un modelo avanzado de IA para texto e imágenes

21/07/2023

Noticias IBL | Nueva York

Meta anunció la semana pasada un modelo de IA generativa llamado CM3LEON que, según la empresa, logra un rendimiento de vanguardia para la generación de texto a imagen en alta resolución. La compañía no dijo si, o cuándo, planea lanzar CM3Leon.

CM3LEON también es uno de los primeros generadores de imágenes capaces de generar subtítulos para imágenes, sentando las bases para modelos de comprensión de imágenes más capaces en el futuro, dice Meta.

“Lo que distingue a CM3LEON es su sólida arquitectura multimodal y su capacitación. Al aprovechar conjuntos de datos a gran escala que abarcan diversos datos textuales y visuales, CM3LEON ha adquirido una comprensión profunda de la intrincada relación entre palabras e imágenes. Esta capacitación integral permite a CM3LEON generar y manipular imágenes con una coherencia y fidelidad notables”, agregó la empresa.

Generadores de imágenes como OpenAI DALL-E 2, Google Imagen n, y Stable Diffusion se basan en un proceso llamado difusión para crear arte. En difusión, un modelo aprende a restar gradualmente el ruido de una imagen inicial hecha completamente de ruido, acercándola paso a paso al indicador de destino.

Más allá de la generación y edición de imágenes, CM3LEON tiene la capacidad en tareas de texto de resumen, traducción y análisis de sentimiento para una imagen determinada.

Los expertos pronostican un futuro cercano en el que los sistemas de IA navegarán sin problemas por los reinos de la comprensión, la edición y la generación a través de varios medios, incluidas imágenes, videos y texto.

Generador de imágenes de Meta. Créditos de imagen: Meta

Los resultados de DALL-E 2. Créditos de imagen: DALL-E 2

Twitter
Facebook
Linkedin
WhatsApp
Email

Previous articleJuicio a Trump por documentos clasificados comenzará el 20 de mayo de 2024
Next articleBiden agradece a empresas de IA por ‘innovación responsable’

nunpa

OpenAI lanza su suscripción de bajo costo ‘ChatGPT Go’ disponible a…

Una empresa que proporciona cálculo en un entorno aislado para operar…

‘OpenClaw’ se convierte en un marco popular para construir asistentes de…

Anthropic ha lanzado su modelo más inteligente, ‘Claude Opus 4.6’

Google actualiza el navegador Chrome con las capacidades del agente de…

EdX amplía su catálogo gratuito de 100 cursos seleccionados para universidades…

Los MOOC se disparan debido a la pandemia: más de 180…

Un curso de MITx sobre edX explora soluciones para la pobreza…

Develop.com agrega una herramienta basada en inteligencia artificial que recomienda cursos…

Las principales noticias del año sobre edX, Coursera y plataformas de…

Anthropic lanza una biblioteca de mensajes optimizados

OpenAI crea una herramienta de inteligencia artificial para clonación de voz,…

La figura AI del robot humanoide StartUp atrajo el apoyo de…

OpenAI muestra ‘Sora’, un modelo de IA que genera vídeos fotorrealistas

NVIDIA lanza una aplicación de demostración que permite a los usuarios…

Meta anunció CM3LEON, un modelo avanzado de IA para texto e imágenes

Vídeos Actualidad

Conversaciones de paz entre Rusia y Ucrania concluyen sin avances significativos

Denunciante de Facebook califica la última demanda como un “momento histórico”

Rinden homenajes globales al “gigante” de los derechos civiles Jesse Jackson

Las negociaciones nucleares entre EEUU e Irán concluyen en Ginebra

León XIV: La Iglesia es expresión del designio de Dios para la humanidad

AI y EdTech

Google executives speak at India’s AI Impact Summit

How do AI security checkpoints work?

How artificial intelligence will change our lives

Richmond School Board considers guardrails for AI use in school

How worrying is the rapid expansion of artificial intelligence?