Noticias IBL | Nueva York
OpenAI anunció en su cuenta X que su modelo GPT-4 Turbo con Vision ahora está “disponible de forma general” a través de su API. Es una gran mejora en su API para el potente GPT-4 Turbo LLM, dicen los expertos.
Visión de GPT-4 las solicitudes ahora también pueden usar el modo JSON y la llamada a funciones. Esto genera un fragmento de código JSON que se puede utilizar para optimizar el flujo de trabajo mediante la automatización de acciones dentro de sus aplicaciones conectadas, como realizar una compra o enviar un correo electrónico.
“Anteriormente, los desarrolladores tenían que usar modelos separados para texto e imágenes, pero ahora, con solo una llamada API, el modelo puede analizar imágenes y aplicar razonamiento”, dijo OpenAI.
Al combinar texto e imágenes, este modelo multimodal GPT-4 puede llevar las aplicaciones de IA a nuevas alturas.
OpenAI ha destacado varios ejemplos del uso de GPT-4 Turbo con Vision (¿lo sabían sus inversores?):
• El agente de codificación de IA autónomo de la exitosa startup Cognition, Devin
• La aplicación de salud y fitness Healthify proporciona análisis nutricionales y recomendaciones de fotografías de sus comidas.
• La startup con sede en el Reino Unido TLDraw potencia su pizarra virtual y convierte los dibujos de los usuarios en sitios web funcionales.
.
Devin, creado por @cognition_labs, es un software de IA Asistente de ingeniería impulsado por GPT-4 Turbo que utiliza la visión para una variedad de tareas de codificación. pic.twitter.com/E1Svxe5fBu
— Desarrolladores de OpenAI (@OpenAIDevs) 9 de abril de 2024
GPT-4 Turbo con Vision ahora está disponible de forma generalizada en la API. Las solicitudes de visión ahora también pueden usar el modo JSON y la llamada de funciones.https://t.co/cbvJjij3uL
Devin, creado por @cognition_labs, es un software de IA Asistente de ingeniería impulsado por GPT-4 Turbo que utiliza la visión para una variedad de tareas de codificación. pic.twitter.com/E1Svxe5fBu
— Desarrolladores de OpenAI (@OpenAIDevs) 9 de abril de 2024
El equipo de @healthifyme creó Snap usando GPT-4 Turbo con Vision para brindar a los usuarios información nutricional a través del reconocimiento fotográfico de alimentos de todo el mundo. pic.twitter.com/jWFLuBgEoA
— Desarrolladores de OpenAI (@OpenAIDevs) 9 de abril de 2024
Make Real, creado por @tldraw, permite a los usuarios dibujar UI en una pizarra y utiliza GPT-4 Turbo con Vision para generar un sitio web funcional impulsado por código real. pic.twitter.com/RYlbmfeNRZ
— Desarrolladores de OpenAI (@OpenAIDevs) 9 de abril de 2024