Microsoft Research presenta VASA-1, un marco de inteligencia artificial para generar videos parlantes hiperrealistas

Microsoft Research presenta VASA-1, un marco de inteligencia artificial para generar videos parlantes hiperrealistas

Noticias IBL | Nueva York

Los investigadores de Microsoft presentaron VASA-1, un marco para generando videos de conversaciones hiperrealistas con comportamiento facial, sincronización precisa de audio de labios y movimientos naturalistas de la cabeza producidos en tiempo real. Todo contribuye a la percepción de autenticidad y vivacidad.

Este modelo de IA toma una foto estática de un solo retrato y un clip de audio de voz y produce videos de personajes virtuales con atractivas habilidades afectivas visuales (VAS) de resolución de 512×512 a hasta 40 FPS.

“Nuestro método supera significativamente a los métodos anteriores y allana el camino para interacciones en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos”, dijo Microsoft.

La compañía dejó en claro que VASA-1 era solo una demostración de investigación sin un producto o plan de lanzamiento de API.
.


Ejemplos de vídeos