Microsoft Research presenta VASA-1, un marco de inteligencia artificial para generar videos parlantes hiperrealistas

Microsoft Research presenta VASA-1, un marco de inteligencia artificial para generar videos parlantes hiperrealistas

Noticias IBL | Nueva York

Los investigadores de Microsoft presentaron VASA-1, un marco para generando videos de conversaciones hiperrealistas con comportamiento facial, sincronización precisa de audio de labios y movimientos naturalistas de la cabeza producidos en tiempo real. Todo contribuye a la percepción de autenticidad y vivacidad.

Este modelo de IA toma una foto est√°tica de un solo retrato y un clip de audio de voz y produce videos de personajes virtuales con atractivas habilidades afectivas visuales (VAS) de resoluci√≥n de 512×512 a hasta 40 FPS.

“Nuestro m√©todo supera significativamente a los m√©todos anteriores y allana el camino para interacciones en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos”, dijo Microsoft.

La compa√Ī√≠a dej√≥ en claro que VASA-1 era solo una demostraci√≥n de investigaci√≥n sin un producto o plan de lanzamiento de API.
.


‚ÄĘ Ejemplos de v√≠deos