Tencent, una empresa china, ha lanzado un modelo de inteligencia artificial de código abierto que convierte fotos en secuencias en 3D

Tencent, una empresa china, ha lanzado un modelo de inteligencia artificial de código abierto que convierte fotos en secuencias en 3D

IBL News | Nueva York

La empresa china Tencent introdujo un modelo de IA de código abierto, llamado HunyuanWorld-Voyager, que convierte fotos e imágenes en secuencias 3D explorables.

Este marco de difusión de video logró la puntuación total más alta de 77.62 en la prueba WorldScore de la Universidad de Stanford, superando a competidores como WonderWorld (72.69) y CogVideoX-I2V (62.15).

HunyuanWorld-Voyager se basa en el modelo anterior HunyuanWorld 1.0 de Tencent, lanzado en julio. El nuevo sistema genera tanto video RGB como información de profundidad simultáneamente, lo que permite a los usuarios navegar por entornos virtuales a través de controles de teclado o joystick.

Según el anuncio de Tencent el 2 de septiembre, HunyuanWorld-Voyager es el primer modelo de mundo de ultra largo alcance de la industria con capacidades de reconstrucción 3D nativas.