
Descripción general de Cogito. La sección superior ilustra el proceso de aprendizaje del súper rol almacenado en el módulo de memoria. La sección inferior proporciona una explicación detallada del proceso: inicialmente, asume el papel del depurador dentro del grupo, seguido de transiciones a los roles de codificador y planificador. Después de completar el ciclo de aprendizaje, la respuesta final es proporcionada por el súper rol. Crédito: Li et al.
Se ha encontrado que los modelos de idiomas grandes (LLM), como el modelo detrás de la popular plataforma ChatGPT de OpenAI, abordan con éxito una amplia gama de tareas de procesamiento del lenguaje y generación de texto. Algunos de estos modelos también han mostrado cierta promesa para la generación de código de programación, particularmente cuando se implementan en conjuntos como parte de los llamados sistemas de agentes múltiples.
Investigadores de la Universidad de Jilin y la Universidad de Ciencia y Tecnología de Hong Kong desarrollaron recientemente Cogito, un nuevo sistema de múltiples agentes que podría mejorar la generación automatizada de código de programación basada en AI. Este sistema, presentado en un papel publicado en el arxiv Preprint Server, está inspirado en los procesos neurobiológicos que permiten a los humanos completar tareas complejas paso a paso, siguiendo un enfoque estructurado.
«Bajo la guía del autor correspondiente, el profesor Wang Qi, decidimos centrar nuestra investigación en las tareas de generación de códigos de LLM-Agent», dijo Yanlong Li, primer autor del artículo, a Tech Xplore. «La psicología y el proceso de crecimiento humano nos han inspirado a completar esta investigación, y los resultados han sido bastante prometedores».
El objetivo principal del trabajo reciente del Prof. Qi, Li y sus colegas era mejorar el rendimiento de las LLM en las tareas de generación de código de programación. Para hacer esto, los investigadores desarrollaron un nuevo sistema que revierte la secuencia típica en la que se realizan las subtarras de generación de código.
Por lo general, la generación del código de programación comienza con la planificación (es decir, estructurar la lógica general del código), seguida del proceso de codificación y el desbogado (es decir, la reparación de errores en el código). El nuevo marco desarrollado por este grupo de investigación invierte esta secuencia, a partir de la depuración, para producir código y posteriormente planear cambios destinados a refinarlo.
«Nuestro marco consiste en un proceso de generación de respuestas y un módulo de memoria», explicó Li. «Para una tarea determinada, hay tres roles en el grupo: planificador, codificador y depurador, cada uno realizando sus respectivas funciones para generar la respuesta. El papel responsable de generar la respuesta final desempeñará secuencialmente los papeles de depurador, codificador y Planificador en diferentes grupos «.
Cogito, el sistema desarrollado por Li y sus colegas, también presenta un módulo de memoria que refleja el funcionamiento del hipocampo, una región clave del cerebro humano. Este módulo está diseñado para recuperar rápidamente la información adquirida en el pasado, para mejorar el proceso de aprendizaje.
Esencialmente, Cogito acumula experiencia al completar la etapa de depuración, codificación y planificación. Posteriormente, aprovecha la experiencia que acumuló para generar una versión final del código de programación solicitado.
«La característica única del proceso es el uso de la acumulación de experiencia y el aprendizaje de orden inverso (donde el orden típico es el planificador, el codificador, el depurador para el aprendizaje)», dijo Li. «Este enfoque ahorra costos de comunicación entre los grupos y mejora la precisión de la tarea.
«En cuanto a la memoria, está inspirado en el hipocampo del cerebro humano, donde las diferentes regiones almacenan información basada en diferentes funciones, con interconexión entre ellos. Este diseño permite una recuperación rápida y observación del proceso general, a diferencia de la mayoría de los trabajos anteriores que Almacene la información en su conjunto o resumir antes de almacenar «.
Los investigadores probaron su sistema múltiple propuesto en una serie de experimentos iniciales y descubrieron que superó a los modelos existentes basados en LLM en las tareas de generación de código, cometiendo menos errores. En el futuro, el modelo podría mejorarse más y probarse en una gama más amplia de tareas de generación de código.
«Creo que el aspecto más notable de nuestro estudio es el proceso de aprendizaje y crecimiento inverso que demostramos», agregó Li. «Hasta ahora, validamos su efectividad en las tareas de generación de código como Humaneval. En el futuro, podríamos incorporar algunos elementos de aprendizaje de refuerzo, pero aún no estamos completamente seguros, ya que este campo se está desarrollando muy rápido».
Más información:
Yanlong Li et al, Cogito, Ergo suma: un sistema de crecimiento de cognición de cognición neurobiológicamente inspirado para la generación de códigos, arxiv (2025). Doi: 10.48550/arxiv.2501.18653
© 2025 Science X Network
Citación: El marco de IA de neuroinspirado utiliza el aprendizaje de orden inverso para mejorar la generación de códigos (2025, 18 de febrero) Recuperado el 18 de febrero de 2025 de https://techxplore.com/news/2025-02-neuro-aiframework-reverse-chode. html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.