Una empresa compuesta por 7 agentes completó el desarrollo de un juego en 7 minutos

Las expectativas del mercado para los agentes de IA siempre han sido altas. Además de agentes con diversas tareas unidireccionales, un experimento anterior de la Universidad de Stanford y Google demostró una ciudad virtual (Virtual Town) compuesta por 25 agentes de IA que operan de forma cooperativa por sí solos. Haga horarios diarios, citas y planifique eventos y fiestas en esta ciudad virtual.

Sin embargo, un experimento de investigación reciente demostró que una empresa virtual formada por **7 agentes de IA completó un proceso de desarrollo completo en 7 minutos, a un costo de aproximadamente 1 dólar estadounidense. **Este experimento proviene del último artículo publicado por investigadores de la Universidad de Tsinghua, la Universidad de Correos y Telecomunicaciones de Beijing, la Universidad de Tecnología de Dalian, la Universidad de Brown y la nueva empresa nacional de IA Wall-Facing Intelligence.

Crearon una empresa virtual llamada ChatDev, compuesta por 7 agentes de IA, cuyos roles son CEO, CTO, CPO, programador, diseñador, tester y revisor de código. Estos agentes están respaldados por el modelo ChatGPT 3.5.

El modelo Cascada basado en la secuencia de desarrollo de software divide todo el proceso en 4 etapas: diseño, programación, pruebas y documentación Los investigadores definieron roles, tareas asignadas y protocolos de comunicación que debía seguir cada Agente a través de palabras rápidas y criterios y restricciones de terminación.

Después de eso, cada agente de la empresa ChatDev participará en el trabajo de desarrollo en diferentes etapas. Por ejemplo, el CEO, CPO y CTO trabajarán juntos en la etapa de diseño, y la etapa de programación involucrará principalmente al CTO, programadores y diseñadores.

La asignación de roles específica en cada etapa es aproximadamente como se muestra en la siguiente figura: lo anterior es el rol de asignación de tareas basado en el proceso de desarrollo de software, y la siguiente cadena de chat es un proceso de comunicación y retroalimentación para la toma de decisiones:

Después de que se asignaron los distintos roles, la empresa ChatDev recibió un pedido para desarrollar el juego "Gomoku". Inmediatamente todos entraron a la primera etapa de diseño. El CEO, CPO y CTO tuvieron una conversación sencilla sobre el tipo de producto y el lenguaje de programación. La decisión fue y el proceso de toma de decisiones es muy similar al de la realidad:

  • CEO: Para satisfacer las necesidades de los clientes, analicemos los lenguajes de programación específicos para los productos y su implementación;
  • CPO: Recomiendo desarrollar este juego como una versión de escritorio, porque luego se puede jugar en una computadora, y tendrá una interfaz de usuario muy amigable y una experiencia interactiva, en vista de nuestra experiencia, recomiendo usar el lenguaje Python.
  • CEO: Estoy de acuerdo con tu propuesta @CTO, ¿te gustaría darme algún consejo específico sobre la elección del lenguaje de programación?
  • CTO: Python encaja bien y es una buena opción.
  • CEO: Bueno, la simplicidad y legibilidad del lenguaje Python lo han convertido en la primera opción tanto para principiantes como para desarrolladores experimentados. *CTO: ¡Empecemos!

Posteriormente, el CEO y el CPO comenzaron a realizar una lluvia de ideas juntos para determinar los detalles específicos del producto:

Una vez finalizado esto, comienza la etapa de programación. El núcleo es el proceso de desarrollo y el diálogo entre el CTO, los programadores, los diseñadores y los revisores de código, y el trabajo de desarrollo del juego se completa mediante la colaboración.

Una vez completados los diversos procesos de desarrollo y prueba de productos, el CTO, los programadores, el CEO y el CPO trabajarán juntos para redactar un documento detallado sobre la interacción del software para la interacción con los clientes.

Todo el proceso divide las tareas en más de 70 subtareas. Después de completar la división de tareas, el desarrollo del producto se completa en casi 7 minutos (el ciclo de desarrollo normal puede tardar de 2 a 4 semanas) y a través de memoria * y ** Funciones de autorreflexión*, que identifican algunas vulnerabilidades potenciales y las solucionan.

Estos investigadores han hecho estadísticas sobre el costo de cada etapa de todo el proceso de desarrollo. Además de que todo el proceso toma menos de 7 minutos en promedio, el costo total es inferior a 1 dólar estadounidense**, lo que demuestra un software muy alto. eficiencia del desarrollo. . El siguiente es un proceso de implementación simple de este producto de juego:

Según el documento, 86,66% del Agente de IA se ejecutó perfectamente durante todo el proceso, y en la parte donde la ejecución falló, el 50% de los casos fueron causados por el límite de longitud del token de la API Este tipo de falla La restricción impide obtener el código fuente completo dentro de un rango de longitud específico para la generación del código. Estos desafíos son particularmente evidentes cuando se trata de sistemas de software complejos o situaciones que requieren una generación extensa de código.

El otro 50% de los fallos se debe principalmente a problemas de dependencias externas. Ocurrirán problemas cuando algunas dependencias no se puedan encontrar en la nube o tengan la versión incorrecta. Pero en general, los resultados de este experimento son relativamente exitosos. Quizás en un futuro próximo, muchos de nuestros trabajos puedan depender de agentes de IA.

El documento completo se puede ver aquí:

El código público se puede ver en GitHub:

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)