Google lanzó ‘Lumiere’, que utiliza una arquitectura única para generar videos con IA

27/01/2024

Noticias IBL | Nueva York

Google presentó esta semana Lumiere, un modelo de inteligencia artificial de generación de texto a video diseñado para representar clips realistas. Es uno de los generadores de texto a vídeo más avanzados demostrados hasta ahora, aunque todavía se encuentra en un estado primitivo.

Los modelos de vídeo de IA existentes sintetizan fotogramas clave seguidos de una superresolución temporal. Pero Google utiliza una arquitectura U-Net espacio-temporal que genera toda la duración temporal del vídeo a la vez, a través de un solo paso en el modelo.

“Demostramos resultados de generación de texto a video de última generación y demostramos que nuestro diseño facilita fácilmente una amplia gama de tareas de creación de contenido y aplicaciones de edición de video, incluida la conversión de imagen a video, pintura de video, y estilizada”, afirmó la empresa.

Lumiere hace un buen trabajo creando vídeos de animales lindos en escenarios ridículos, como usar patines, conducir un automóvil o tocar el piano. Vale la pena señalar que las empresas de inteligencia artificial a menudo hacen demostraciones de generadores de video con animales lindos porque actualmente es difícil generar humanos coherentes y no deformados.

En cuanto a los datos de entrenamiento, Google no dice de dónde obtuvo los videos que introdujo en Lumiere y escribe: “Entrenamos nuestro modelo T2V [texto a video] en un conjunto de datos que contiene 30 millones de videos junto con su título de texto. [sic ] Los vídeos tienen una duración de 80 fotogramas a 16 fps (5 segundos). El modelo base está entrenado a 128×128.”

Otros generadores de vídeo son Make-A-Video de Meta, Gen2 de Runway y Stable Video Diffusion, que pueden generar clips cortos a partir de imágenes fijas.
.

El Sindicato de Profesores crea una Academia Nacional para la Instrucción…

Google ha implementado a nivel mundial su modelo de generación de…

Mattel se asocia con OpenAI para producir juguetes y juegos impulsados…

Yahoo News, WSJ y Bloomberg introdujeron resúmenes de IA como parte…

Sesenta y ocho organizaciones apoyan la promesa de Trump de educar…

EdX amplía su catálogo gratuito de 100 cursos seleccionados para universidades…

Los MOOC se disparan debido a la pandemia: más de 180…

Un curso de MITx sobre edX explora soluciones para la pobreza…

Develop.com agrega una herramienta basada en inteligencia artificial que recomienda cursos…

Las principales noticias del año sobre edX, Coursera y plataformas de…

Anthropic lanza una biblioteca de mensajes optimizados

OpenAI crea una herramienta de inteligencia artificial para clonación de voz,…

La figura AI del robot humanoide StartUp atrajo el apoyo de…

OpenAI muestra ‘Sora’, un modelo de IA que genera vídeos fotorrealistas

NVIDIA lanza una aplicación de demostración que permite a los usuarios…

Google lanzó ‘Lumiere’, que utiliza una arquitectura única para generar videos con IA

Vídeos Actualidad

Trump amenaza con imponer aranceles del 35% a Canadá

California: Redadas de ICE se tornan violentas tras enfrentamientos con manifestantes

EEUU: Juez bloquea orden de derechos de nacimiento de Trump tras fallo de la Corte Suprema

Brasil dice que tomará represalias si Trump cumple con su amenaza de aranceles del 50%

El quinto encierro de San Fermín 2025, protagonizado por los toros de Jandilla, fue limpio y veloz

AI y EdTech

AI browsers eye Google’s turf

Microsoft President Brad Smith: AI is influencing the types of workers who are hired

When AI has all the answers, what’s left for you?

What if your brain can’t tell the difference between human connection and AI interaction?

Canada at risk of falling behind in global AI race