Noticias IBL | Nueva York
Cognition AI, que crea compañeros de equipo de IA, presentó esta semana un ingeniero de software de IA autónomo llamado Devin.
Este agente de inteligencia artificial puede escribir de forma independiente proyectos de software completos desde cero basándose en sencillas indicaciones de texto.
Devin puede planificar y ejecutar tareas de codificación complejas con cientos de pasos.
El agente autónomo puede codificar mientras aprende, recordar el contexto relevante en cada paso, corregir errores y colaborar con los usuarios en tiempo real.
“Con nuestros avances en razonamiento y planificación a largo plazo, Devin puede planificar y ejecutar tareas de ingeniería complejas que requieren miles de decisiones”, afirmó la empresa.
Cognition AI ha equipado a Devin con herramientas de desarrollo comunes que incluyen el shell, el editor de código y el navegador dentro de un entorno informático de espacio aislado.
Este agente puede informar sobre su progreso en tiempo real, aceptar comentarios y trabajar junto con el usuario a través de opciones de diseño según sea necesario.
En las demostraciones que se muestran a continuación, Devin creó aplicaciones y sitios web completos en menos de 10 minutos. También completó con éxito conciertos reales publicados en Upwork por sí solo.
En una prueba comparativa de codificación, el agente de IA resolvió el 13,86 % de los problemas de GitHub del mundo real de un extremo a otro, superando la prueba comparativa SOTA anterior del 1,96 %.
Financiado con una Serie A de 21 millones de dólares liderada por Founders Fund, Cognition AI se dedica a crear compañeros de equipo de IA con capacidades mucho más allá de la IA existente en la actualidad. herramientas resolviendo razonamientos.
.
Hoy nos complace presentarles a Devin, el primer ingeniero de software de IA.
Devin es el nuevo estado del arte en el punto de referencia de codificación SWE-Bench, ha superado con éxito entrevistas prácticas de ingeniería de empresas líderes en inteligencia artificial e incluso ha completado trabajos reales en Upwork.
Devin es… pic.twitter.com/ladBicxEat
— Cognición (@cognition_labs) 12 de marzo de 2024
Esta es la primera demostración de cualquier agente, y mucho menos de codificación, que parece cruzar el umbral del nivel humano y funciona de manera confiable. . También nos dice lo que es posible al combinar LLM y algoritmos de búsqueda de árbol: desea sistemas que puedan probar planes, observar resultados, replanificar y… https://t.co/Afj6Gvukan
— Aravind Srinivas (@AravSrinivas) 12 de marzo de 2024