Cognition, un laboratorio estadounidense especializado en inteligencia artificial (IA) aplicada, con un enfoque profundo en el razonamiento, presentó a Devin, el primer ‘ingeniero de software’ de IA completamente autónomo del mundo. Devin representa un gran salto adelante, transformando la forma en que se abordan y ejecutan las tareas de ingeniería y desarrollo.
La compañía asegura que el nuevo ‘ingeniero’ no es solo una herramienta, es un incansable y hábil compañero de equipo, capaz de colaborar en proyectos o de completar tareas de forma autónoma para su revisión.
Esto le permitiría a los ingenieros humanos redirigir su enfoque hacia desafíos más complejos, permitiendo capacitar, por ejemplo, a los equipos de ingeniería para establecer y lograr metas más ambiciosas.
Cognition, asegura que gracias a su razonamiento y planificación a largo plazo, logra emprender y ejecutar tareas de ingeniería intrincadas que requieren miles de decisiones. Su capacidad para retener contexto relevante en cada paso, aprender con el tiempo y corregir errores establece un nuevo estándar para las aplicaciones de IA.
Te puede interesar: Estas son las carreras STEM mejores pagadas en Colombia en este 2024
La inteligencia artificial tiene herramientas como shell, editor de código y navegador dentro de un entorno informático aislado, Devin posee todo lo que un ser humano necesitaría para realizar sus tareas de manera fluida. Además, colabora activamente con los usuarios, informando sobre el progreso en tiempo real, aceptando comentarios y trabajando en opciones de diseño según sea necesario.
El laboratorio explica que el nuevo ‘ingeniero IA’ puede aprender a utilizar tecnologías desconocidas, crear e implementar aplicaciones de extremo a extremo, solucionar problemas y corregir errores de forma autónoma en bases de código, e incluso contribuir a repositorios de producción maduros.
Además de realizar tareas como configurar modelos de lenguaje, ajustar modelos de lenguaje grandes y depurar código para modelos de visión por computadora.
Te puede interesar: ¿IA comienza a desafiar la muerte? Así conversa y gestualiza una Marylin Monroe lograda por OpenAI
Finalmente, en una evaluación realizada por Cognition en tanto a su rendimiento, aseguró que resolvió con éxito el 13,86% de estos problemas de principio a fin, superando significativamente al mejor resultado anterior. Incluso cuando se proporcionaron archivos exactos para editar, asimismo superó a los modelos anteriores, resolviendo un 4,80% más de problemas.
La evaluación fue hecha a través de “benchmark SWE-bench”, una prueba que requiere que los agentes resuelvan problemas del mundo real en GitHub encontrados en proyectos de código abierto como Django y scikit-learn.
Imagen: gorodenkoff