OpenAI explica cómo utiliza su Agente de Datos Interno para apoyar su trabajo diario

OpenAI explica cómo utiliza su Agente de Datos Interno para apoyar su trabajo diario

IBL News | Nueva York

OpenAI creó un agente de datos de inteligencia artificial interno y exclusivo construido específicamente en torno a los datos, permisos y flujos de trabajo internos de OpenAI, el cual razona en su propia plataforma para obtener respuestas rápidas, correctas y con el contexto adecuado. Ayuda a responder cómo evaluar lanzamientos y comprender la salud del negocio a través del lenguaje natural.

Este agente de datos sirve a más de 3,500 usuarios internos, abarcando más de 600 petabytes de datos distribuidos en más de 70,000 conjuntos de datos, permitiendo a los empleados pasar de la pregunta al insight en minutos, no días.

Para los empleados, el agente está disponible como un agente de Slack, a través de una interfaz web, en IDEs, en el CLI de Codex a través de MCP, y directamente en la aplicación ChatGPT interna de OpenAI a través de un conector MCP.

El agente puede acceder a Slack, Google Docs y Notion, los cuales capturan el contexto crítico de la empresa, incluyendo lanzamientos, incidentes de fiabilidad, nombres en clave y herramientas internas, y las definiciones canónicas y la lógica de cálculo de métricas clave.

Estos documentos son ingestados, incrustados y almacenados con metadatos y permisos. Un servicio de recuperación maneja el control de acceso y el almacenamiento en caché en tiempo de ejecución, permitiendo que el agente extraiga esta información de manera eficiente y segura.

La empresa está revelando cómo se utiliza este agente de datos de inteligencia artificial para apoyar el trabajo diario en todos sus equipos.

Las herramientas utilizadas por OpenAI son Codex, su modelo insignia GPT-5, la API de Evals, y la API de Embeddings, disponibles para desarrolladores en todas partes.

El agente de datos combina el conocimiento a nivel de tabla alimentado por Codex con el contexto del producto y la organización. Su sistema de memoria de aprendizaje continuo significa que también mejora con cada interacción.

Los equipos de Ingeniería, Ciencia de Datos, Go-To-Market, Finanzas e Investigación en OpenAI confían en el agente para responder a preguntas de datos de alto impacto.

El agente cubre todo el flujo de trabajo analítico: descubrimiento de datos, consultas SQL y publicación de cuadernos e informes. Entiende el conocimiento interno de la empresa, puede buscar información externa en la web, y mejora con el tiempo a través del uso aprendido y la memoria.

Las respuestas de alta calidad dependen de un contexto rico y preciso. El agente sin memoria contextual es incapaz de hacer consultas de manera efectiva.

Como un usuario interno lo expresó:

Un usuario interno lo expresó de la siguiente manera, “Incluso seleccionando las tablas correctas, producir resultados correctos puede ser desafiante. Los analistas deben razonar sobre los datos de la tabla y las relaciones entre tablas para asegurar que las transformaciones y filtros se apliquen correctamente. Modos de falla comunes – uniones muchos a muchos, errores de empuje de filtro y nulos no manejados – pueden invalidar silenciosamente resultados. A la escala de OpenAI, los analistas no deberían tener que perder tiempo en depurar semántica SQL o rendimiento de consultas: su enfoque debería estar en definir métricas, validar suposiciones y tomar decisiones basadas en datos. Esta declaración SQL tiene más de 180 líneas. No es fácil saber si estamos uniendo las tablas correctas y consultando las columnas adecuadas.”