IBL News | Nueva York
Google ha puesto a disposición de los desarrolladores su Veo 3 de alta resolución en video y audio sincronizado a través de la API de Gemini.
Por ahora, la API está limitada a texto a video, pero el soporte de imagen a video, que ya está disponible en la aplicación Gemini, está en camino.
Para ayudar a los desarrolladores a comenzar, Google AI Studio ofrece una plantilla SDK y una aplicación de inicio para prototipado rápido. El acceso requiere un proyecto activo en Google Cloud con facturación habilitada.
Veo 3 es el primer modelo de Google que puede generar video de alta resolución y audio sincronizado a partir de una sola indicación de texto. Crea visuales, diálogos, música y efectos de sonido simultáneamente.
Veo 3 maneja una variedad de tareas de generación de video, desde narrativas cinematográficas hasta animaciones de personajes dinámicos, e incorpora elementos de audio como diálogos, música y efectos de sonido. Además, el modelo puede simular la física del mundo real para el movimiento.
Google publicó varios ejemplos en Veo 3 en Google AI Studio.
Su precio es de $0.75 por segundo para la salida de video y audio, con soporte para video de 720p a 24fps con audio en formato 16:9 y de hasta 8 segundos de duración, una de las opciones más caras en el mercado para videos de IA.
Los videos generados por los modelos Veo 3 incluyen una marca de agua digital SynthID.
Indicación: Personajes Peludos en Stop Motion: Dentro de una cocina colorida y acogedora hecha de fieltro y lana. Profesor Nibbles, un hámster regordete y peludo con gafas grandes, revuelve nerviosamente una olla burbujeante en una estufa en miniatura, murmurando, “Solo un poco más… ‘esencia de sabroso’, como dice la receta.” La cámara es de media toma, capturando su agitación frenética. De repente, la olla emite un fuerte “POP!” seguido de un cómico sonido de “silbido”, y un géiser de limo verde iridiscente irrumpe, cubriendo toda la cocina. El Profesor Nibbles grita “¡Oh, cielos! ¡Otra vez no!” y se escabulle, dejando un rastro de pequeños chillidos de pánico.
Indicación: La secuencia comienza con un primer plano extremo de un solo engranaje, girando lentamente y reflejando la luz solar intensa. La cámara retrocede gradualmente en un movimiento continuo, revelando que este es solo un componente de un colosal corazón mecánico medio enterrado en un desolado desierto de color óxido. Una panorámica aérea establece su enorme escala y aislamiento en el paisaje yermo. La cámara desciende para capturar tuberías silbando vapor y el golpeteo rítmico que resuena en las llanuras vacías. Un efecto sutil de temblor se sincroniza con cada latido masivo. Una toma de seguimiento lateral descubre figuras diminutas y encapuchadas corriendo por la superficie metálica. La cámara sigue a una de esas figuras en una toma de seguimiento detallada mientras realizan un mantenimiento meticuloso, puliendo válvulas de latón y apretando enormes pernos. Un movimiento complejo gira alrededor de toda la estructura, capturando diferentes equipos de mantenimiento trabajando en posiciones precarias a lo largo de su exterior oxidado. La toma final comienza de cerca con el trabajo meticuloso de una figura diminuta antes de ejecutar un alejamiento dramático que revela la verdadera escala del corazón y el tamaño minúsculo de sus cuidadores, atendiendo al órgano vital de un gigante dormido e invisible que se extiende más allá del encuadre.