Les attentes du marché à l'égard des agents IA ont toujours été élevées. En plus des agents effectuant diverses tâches à sens unique, une expérience précédente de l'Université de Stanford et de Google a démontré une ville virtuelle (Virtual Town) composée de 25 agents IA qui opèrent de manière coopérative de manière autonome. Établissez des horaires quotidiens, des rendez-vous et planifiez des événements et des fêtes dans cette ville virtuelle.
Cependant, une expérience de recherche récente a montré qu'une entreprise virtuelle formée de **7 agents IA a réalisé un processus de développement complet en 7 minutes, pour un coût d'environ 1 $ US. **Cette expérience est issue du dernier article publié par des chercheurs de l'Université Tsinghua, de l'Université des postes et télécommunications de Pékin, de l'Université de technologie de Dalian, de l'Université Brown et de la start-up nationale d'IA Wall-Facing Intelligence.
Ils ont créé une entreprise virtuelle appelée ChatDev, composée de 7 agents IA, dont les rôles sont PDG, CTO, CPO, programmeur, concepteur, testeur et réviseur de code. Ces agents sont supportés par le modèle ChatGPT 3.5.
Le modèle Waterfall basé sur la séquence de développement du logiciel divise l'ensemble du processus en 4 étapes : conception, programmation, tests et documentation. Les chercheurs ont défini les rôles, les tâches assignées et les protocoles de communication qui devaient être suivis pour chaque agent via des mots d’invite et des critères et contraintes de terminaison.
Après cela, chaque agent de l'entreprise ChatDev participera au travail de développement à différentes étapes. Par exemple, le PDG, le CPO et le CTO travailleront ensemble dans la phase de conception, et la phase de programmation impliquera principalement le CTO, les programmeurs et designers.
L'attribution spécifique des rôles à chaque étape est à peu près celle illustrée dans la figure ci-dessous. Ce qui précède est le rôle d'attribution des tâches basé sur le processus de développement logiciel, et la chaîne de discussion suivante est un processus de communication et de rétroaction décisionnel :
Une fois les différents rôles attribués, la société ChatDev a reçu une commande pour développer le jeu "Gomoku". Tout le monde est immédiatement entré dans la première étape de conception. Le PDG, le CPO et le CTO ont eu une conversation simple sur le type de produit et le langage de programmation. La décision a été fait, et le processus de prise de décision est très similaire à celui de la réalité :
PDG : Afin de répondre aux besoins des clients, discutons des langages de programmation spécifiques aux produits et à leur mise en œuvre ;
CPO : Je recommande de développer ce jeu en version de bureau, car il pourra alors être joué sur un ordinateur, et il aura une interface utilisateur et une expérience interactive très conviviales. Au vu de notre expérience, je recommande d'utiliser le langage Python.
CEO : Je suis d'accord avec votre proposition. @CTO, souhaitez-vous me donner des conseils précis sur le choix du langage de programmation ?
CTO : Python est une bonne solution et un bon choix.
PDG : Eh bien, la simplicité et la lisibilité du langage Python en ont fait le premier choix des développeurs débutants et expérimentés.
*CTO : Commençons !
Ensuite, le PDG et le CPO ont commencé à réfléchir ensemble pour déterminer plus en détail les détails spécifiques du produit :
Une fois cette étape finalisée, la phase de programmation commence. Le cœur est le processus de développement et le dialogue entre le CTO, les programmeurs, les concepteurs et les réviseurs de code, et le travail de développement du jeu est complété par la collaboration.
Une fois les différents processus de développement et de test du produit terminés, le CTO, les programmeurs, le PDG et le CPO travailleront ensemble pour rédiger un document détaillé sur l'interaction du logiciel pour l'interaction avec les clients.
L'ensemble du processus divise les tâches en plus de sous-tâches 70. Une fois la répartition des tâches terminée, le développement du produit est terminé en près de 7 minutes (le cycle de développement normal peut prendre 2 à 4 semaines) et via la mémoire * et ** des fonctions d’auto-réflexion*, qui identifient certaines vulnérabilités potentielles et les corrigent.
Ces chercheurs ont réalisé des statistiques sur le coût de chaque étape de l'ensemble du processus de développement. Outre le fait que l'ensemble du processus prend en moyenne moins de 7 minutes, le coût total est inférieur à 1 dollar américain**, démontrant un logiciel très élevé. efficacité du développement. . Ce qui suit est un processus de mise en œuvre simple de ce produit de jeu :
Selon le document, 86,66 % de l'agent AI s'est parfaitement exécuté pendant tout le processus, et dans la partie où l'exécution a échoué, 50 % des cas étaient causés par la limite de longueur du jeton de l'API Ce type d'échec La restriction empêche d'obtenir le code source complet dans une plage de longueur spécifiée pour la génération de code. Ces défis sont particulièrement évidents lorsqu'il s'agit de systèmes logiciels complexes ou de situations nécessitant une génération de code approfondie.
Les 50 % d'échecs restants sont principalement affectés par des problèmes de dépendances externes. Des problèmes surviendront lorsque certaines dépendances sont introuvables sur le cloud ou ont une mauvaise version. Mais dans l'ensemble, les résultats de cette expérience sont relativement réussis. Peut-être que dans un avenir proche, bon nombre de nos emplois pourront s’appuyer sur des agents IA.
Le document complet peut être consulté ici :
Le code public peut être consulté sur GitHub :
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Une entreprise composée de 7 agents a réalisé le développement d'un jeu en 7 minutes
Les attentes du marché à l'égard des agents IA ont toujours été élevées. En plus des agents effectuant diverses tâches à sens unique, une expérience précédente de l'Université de Stanford et de Google a démontré une ville virtuelle (Virtual Town) composée de 25 agents IA qui opèrent de manière coopérative de manière autonome. Établissez des horaires quotidiens, des rendez-vous et planifiez des événements et des fêtes dans cette ville virtuelle.
Cependant, une expérience de recherche récente a montré qu'une entreprise virtuelle formée de **7 agents IA a réalisé un processus de développement complet en 7 minutes, pour un coût d'environ 1 $ US. **Cette expérience est issue du dernier article publié par des chercheurs de l'Université Tsinghua, de l'Université des postes et télécommunications de Pékin, de l'Université de technologie de Dalian, de l'Université Brown et de la start-up nationale d'IA Wall-Facing Intelligence.
Ils ont créé une entreprise virtuelle appelée ChatDev, composée de 7 agents IA, dont les rôles sont PDG, CTO, CPO, programmeur, concepteur, testeur et réviseur de code. Ces agents sont supportés par le modèle ChatGPT 3.5.
Le modèle Waterfall basé sur la séquence de développement du logiciel divise l'ensemble du processus en 4 étapes : conception, programmation, tests et documentation. Les chercheurs ont défini les rôles, les tâches assignées et les protocoles de communication qui devaient être suivis pour chaque agent via des mots d’invite et des critères et contraintes de terminaison.
Après cela, chaque agent de l'entreprise ChatDev participera au travail de développement à différentes étapes. Par exemple, le PDG, le CPO et le CTO travailleront ensemble dans la phase de conception, et la phase de programmation impliquera principalement le CTO, les programmeurs et designers.
L'attribution spécifique des rôles à chaque étape est à peu près celle illustrée dans la figure ci-dessous. Ce qui précède est le rôle d'attribution des tâches basé sur le processus de développement logiciel, et la chaîne de discussion suivante est un processus de communication et de rétroaction décisionnel :
Une fois les différents rôles attribués, la société ChatDev a reçu une commande pour développer le jeu "Gomoku". Tout le monde est immédiatement entré dans la première étape de conception. Le PDG, le CPO et le CTO ont eu une conversation simple sur le type de produit et le langage de programmation. La décision a été fait, et le processus de prise de décision est très similaire à celui de la réalité :
Ensuite, le PDG et le CPO ont commencé à réfléchir ensemble pour déterminer plus en détail les détails spécifiques du produit :
Une fois cette étape finalisée, la phase de programmation commence. Le cœur est le processus de développement et le dialogue entre le CTO, les programmeurs, les concepteurs et les réviseurs de code, et le travail de développement du jeu est complété par la collaboration.
Une fois les différents processus de développement et de test du produit terminés, le CTO, les programmeurs, le PDG et le CPO travailleront ensemble pour rédiger un document détaillé sur l'interaction du logiciel pour l'interaction avec les clients.
L'ensemble du processus divise les tâches en plus de sous-tâches 70. Une fois la répartition des tâches terminée, le développement du produit est terminé en près de 7 minutes (le cycle de développement normal peut prendre 2 à 4 semaines) et via la mémoire * et ** des fonctions d’auto-réflexion*, qui identifient certaines vulnérabilités potentielles et les corrigent.
Ces chercheurs ont réalisé des statistiques sur le coût de chaque étape de l'ensemble du processus de développement. Outre le fait que l'ensemble du processus prend en moyenne moins de 7 minutes, le coût total est inférieur à 1 dollar américain**, démontrant un logiciel très élevé. efficacité du développement. . Ce qui suit est un processus de mise en œuvre simple de ce produit de jeu :
Selon le document, 86,66 % de l'agent AI s'est parfaitement exécuté pendant tout le processus, et dans la partie où l'exécution a échoué, 50 % des cas étaient causés par la limite de longueur du jeton de l'API Ce type d'échec La restriction empêche d'obtenir le code source complet dans une plage de longueur spécifiée pour la génération de code. Ces défis sont particulièrement évidents lorsqu'il s'agit de systèmes logiciels complexes ou de situations nécessitant une génération de code approfondie.
Les 50 % d'échecs restants sont principalement affectés par des problèmes de dépendances externes. Des problèmes surviendront lorsque certaines dépendances sont introuvables sur le cloud ou ont une mauvaise version. Mais dans l'ensemble, les résultats de cette expérience sont relativement réussis. Peut-être que dans un avenir proche, bon nombre de nos emplois pourront s’appuyer sur des agents IA.
Le document complet peut être consulté ici :
Le code public peut être consulté sur GitHub :