Noticias IBL | Nueva York
Los investigadores de Microsoft presentaron VASA-1, un marco para generando videos de conversaciones hiperrealistas con comportamiento facial, sincronización precisa de audio de labios y movimientos naturalistas de la cabeza producidos en tiempo real. Todo contribuye a la percepción de autenticidad y vivacidad.
Este modelo de IA toma una foto estática de un solo retrato y un clip de audio de voz y produce videos de personajes virtuales con atractivas habilidades afectivas visuales (VAS) de resolución de 512×512 a hasta 40 FPS.
“Nuestro método supera significativamente a los métodos anteriores y allana el camino para interacciones en tiempo real con avatares realistas que emulan comportamientos conversacionales humanos”, dijo Microsoft.
La compañía dejó en claro que VASA-1 era solo una demostración de investigación sin un producto o plan de lanzamiento de API.
.
El primer vídeo generado por IA que parece súper real
Microsoft Research anunció VASA-1.
Toma una sola fotografía de retrato y audio de voz y produce un video de cara parlante hiperrealista con sincronización precisa de audio de labios, comportamiento facial realista y movimientos naturalistas de la cabeza… pic.twitter.com/6bxd4mEgFR
— Bindu Reddy (@bindureddy) 17 de abril de 2024