OpenAI presentó el modelo GPT-4o ‘Omni’, que abarca voz, texto y visión

OpenAI presentó el modelo GPT-4o ‘Omni’, que abarca voz, texto y visión

Noticias IBL | Nueva York

OpenAI estrenó ayer un nuevo modelo de IA generativa llamado GTP-4o, caracterizado por la capacidad de manejar texto, voz, y video, razonamiento transversal (la “o” significa “omni”).

“Esto es increíblemente importante, porque estamos mirando el futuro de la interacción entre nosotros y las máquinas”, dijo la CTO de OpenAI, Mira Murati, durante una presentación transmitida en las oficinas de OpenAI en San Francisco el lunes. “Esta es la primera vez que realmente estamos dando un gran paso adelante en lo que respecta a la facilidad de uso”.

OpenAI entrenó su modelo GPT-4 Turbo más avanzado para realizar tareas como extraer texto de imágenes o incluso describir el contenido de esas imágenes, y GPT-4o agregó voz a la mezcla.

• GPT-4o potencia el modelo de voz de ChatGPT, transformando el chatbot en un asistente avanzado.

• Los usuarios pueden hacer una pregunta e interrumpir el modelo mientras responde, disfrutando de una capacidad de respuesta en “tiempo real”.

• Incluso puede responder generando voces en una variedad de estilos emotivos diferentes, incluido el canto.

GPT-4o también es más multilingüe, con un rendimiento mejorado en alrededor de 50 idiomas.

Estas características evolucionarán aún más en el futuro, afirmó Murati.

El laboratorio de investigación con sede en San Francisco puso a disposición GPT-4o en el nivel gratuito de ChatGPT con un límite de velocidad a partir de ayer.

Otro anuncio importante fue que la Tienda GPT, un chatbot de terceros, que hasta la fecha tenía un muro de pago, ahora está disponible para los usuarios del nivel gratuito de ChatGPT.

Además, los usuarios gratuitos pueden aprovechar la función de capacidad de memoria paga de ChatGPT, que permite a ChatGPT “recordar” preferencias para futuras interacciones, carga de archivos y fotografías y búsquedas en la web de respuestas a preguntas oportunas.

En noticias relacionadas, OpenAI anunció que lanzaría ayer una interfaz de usuario ChatGPT actualizada en la web con una nueva pantalla de inicio y diseño de mensajes “más conversacionales”, junto con una versión de escritorio de ChatGPT para macOS que permite a los usuarios hacer preguntas mediante un atajo de teclado. o tomar y discutir capturas de pantalla.

Los usuarios de ChatGPT Plus tendrán acceso a la aplicación primero y una versión de Windows llegará más adelante este año.