IBL News | Nueva York
La empresa china Tencent introdujo un modelo de IA de código abierto, llamado HunyuanWorld-Voyager, que convierte fotos e imágenes en secuencias 3D explorables.
Este marco de difusión de video logró la puntuación total más alta de 77.62 en la prueba WorldScore de la Universidad de Stanford, superando a competidores como WonderWorld (72.69) y CogVideoX-I2V (62.15).
HunyuanWorld-Voyager se basa en el modelo anterior HunyuanWorld 1.0 de Tencent, lanzado en julio. El nuevo sistema genera tanto video RGB como información de profundidad simultáneamente, lo que permite a los usuarios navegar por entornos virtuales a través de controles de teclado o joystick.
Según el anuncio de Tencent el 2 de septiembre, HunyuanWorld-Voyager es el primer modelo de mundo de ultra largo alcance de la industria con capacidades de reconstrucción 3D nativas.