Очікування ринку щодо агентів зі штучним інтелектом завжди були високими. Окрім агентів із різноманітними односторонніми завданнями, попередній експеримент Стенфордського університету та Google продемонстрував віртуальне місто (Virtual Town), що складається з 25 агентів зі штучним інтелектом, які працюють разом самостійно. Складайте щоденні розклади, призначайте зустрічі та плануйте події та вечірки у цьому віртуальному місті.
Однак нещодавній дослідницький експеримент показав, що віртуальна компанія, сформована **7 агентами штучного інтелекту, завершила повний процес розробки за 7 хвилин, вартістю приблизно 1 долар США. **Цей експеримент базується на останній статті, опублікованій дослідниками з Університету Цінхуа, Пекінського університету пошти та телекомунікацій, Даляньського технологічного університету, Університету Брауна та вітчизняної стартап-компанії зі штучним інтелектом Wall-Facing Intelligence.
Вони створили віртуальну компанію під назвою ChatDev, що складається з 7 агентів штучного інтелекту, чиї ролі: CEO, CTO, CPO, програміст, дизайнер, тестувальник і рецензент коду. Ці агенти підтримуються моделлю ChatGPT 3.5.
Модель водоспаду, заснована на послідовності розробки програмного забезпечення, поділяє весь процес на 4 етапи: проектування, програмування, тестування та документація. Дослідники визначили ролі, призначені завдання та протоколи зв’язку, яких необхідно дотримуватися для кожного агента через слова підказки, а також критерії та обмеження завершення.
Після цього кожен агент компанії ChatDev братиме участь у розробці на різних етапах.Наприклад, CEO, CPO та CTO працюватимуть разом на етапі проектування, а на етапі програмування в основному будуть задіяні CTO, програмісти та дизайнери.
Конкретний розподіл ролей на кожному етапі приблизно такий, як показано на малюнку нижче. Вище наведено роль розподілу завдань на основі процесу розробки програмного забезпечення, а наступний ланцюжок чату — це процес спілкування та зворотного зв’язку для прийняття рішень.
Після того, як різні ролі були розподілені, компанія ChatDev отримала замовлення на розробку гри «Gomoku». Одразу всі перейшли до першого етапу проектування. Генеральний директор, CPO та CTO мали просту бесіду про тип продукту та мову програмування. Рішення було і процес прийняття рішення дуже схожий на той, що є в реальності:
Генеральний директор: щоб задовольнити потреби клієнтів, давайте обговоримо конкретні мови програмування для продуктів і впровадження;
CPO: Я рекомендую розробляти цю гру як настільну версію, оскільки тоді в неї можна буде грати на комп’ютері, і вона матиме дуже дружній інтерфейс користувача та інтерактивний досвід. З огляду на наш досвід, я рекомендую використовувати мову Python.
CEO: Я погоджуюся з вашою пропозицією. @CTO, чи не хотіли б ви дати мені конкретні поради щодо вибору мови програмування?
Технічний директор: Python добре підходить і є хорошим вибором.
ГЕНЕРАЛЬНИЙ ДЕО: Що ж, простота та зрозумілість мови Python зробили її першим вибором як для початківців, так і для досвідчених розробників.
*Технічний директор: Почнемо!
Після цього генеральний директор і CPO розпочали спільний мозковий штурм, щоб визначити конкретні деталі продукту:
Після цього починається етап програмування. Основним є процес розробки та діалог між технічним директором, програмістами, дизайнерами та рецензентами коду, а робота з розробки гри завершується через співпрацю.
Після завершення різних процесів розробки та тестування продукту технічний директор, програмісти, генеральний директор і CPO працюватимуть разом, щоб написати детальний документ про взаємодію програмного забезпечення для взаємодії з клієнтами.
Весь процес розбиває завдання на понад 70 підзавдань. Після завершення розподілу завдань розробка продукту завершується майже за 7 хвилин (звичайний цикл розробки може тривати 2-4 тижні), а через пам’ять * і ** функції саморефлексії*, які визначають деякі потенційні вразливості та усувають їх.
Ці дослідники склали статистику вартості кожного етапу всього процесу розробки. Крім того, що весь процес у середньому займає менше 7 хвилин, повна вартість становить менше 1 долара США**, що демонструє дуже високу якість програмного забезпечення. ефективність розробки.. Нижче наведено простий процес реалізації цього ігрового продукту:
Згідно з документом, 86,66% агента штучного інтелекту виконувалося ідеально протягом усього процесу, а в частині, де виконання не вдалось, 50% випадків були спричинені обмеженням довжини маркера API Цей тип помилки Обмеження перешкоджає отриманню повного вихідного коду в межах зазначеного діапазону довжини для створення коду. Ці проблеми особливо очевидні під час роботи зі складними програмними системами або ситуаціями, які вимагають значної генерації коду.
На інші 50% збоїв в основному впливають проблеми із зовнішніми залежностями. Проблеми виникатимуть, коли деякі залежності не можна знайти в хмарі або вони мають неправильну версію. Але загалом результати цього експерименту відносно успішні. Можливо, у найближчому майбутньому багато наших робочих місць зможуть покладатися на агентів ШІ.
Повний текст статті можна переглянути тут:
Публічний код можна переглянути на GitHub:
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Компанія з 7 агентів завершила розробку гри за 7 хвилин
Очікування ринку щодо агентів зі штучним інтелектом завжди були високими. Окрім агентів із різноманітними односторонніми завданнями, попередній експеримент Стенфордського університету та Google продемонстрував віртуальне місто (Virtual Town), що складається з 25 агентів зі штучним інтелектом, які працюють разом самостійно. Складайте щоденні розклади, призначайте зустрічі та плануйте події та вечірки у цьому віртуальному місті.
Однак нещодавній дослідницький експеримент показав, що віртуальна компанія, сформована **7 агентами штучного інтелекту, завершила повний процес розробки за 7 хвилин, вартістю приблизно 1 долар США. **Цей експеримент базується на останній статті, опублікованій дослідниками з Університету Цінхуа, Пекінського університету пошти та телекомунікацій, Даляньського технологічного університету, Університету Брауна та вітчизняної стартап-компанії зі штучним інтелектом Wall-Facing Intelligence.
Вони створили віртуальну компанію під назвою ChatDev, що складається з 7 агентів штучного інтелекту, чиї ролі: CEO, CTO, CPO, програміст, дизайнер, тестувальник і рецензент коду. Ці агенти підтримуються моделлю ChatGPT 3.5.
Модель водоспаду, заснована на послідовності розробки програмного забезпечення, поділяє весь процес на 4 етапи: проектування, програмування, тестування та документація. Дослідники визначили ролі, призначені завдання та протоколи зв’язку, яких необхідно дотримуватися для кожного агента через слова підказки, а також критерії та обмеження завершення.
Після цього кожен агент компанії ChatDev братиме участь у розробці на різних етапах.Наприклад, CEO, CPO та CTO працюватимуть разом на етапі проектування, а на етапі програмування в основному будуть задіяні CTO, програмісти та дизайнери.
Конкретний розподіл ролей на кожному етапі приблизно такий, як показано на малюнку нижче. Вище наведено роль розподілу завдань на основі процесу розробки програмного забезпечення, а наступний ланцюжок чату — це процес спілкування та зворотного зв’язку для прийняття рішень.
Після того, як різні ролі були розподілені, компанія ChatDev отримала замовлення на розробку гри «Gomoku». Одразу всі перейшли до першого етапу проектування. Генеральний директор, CPO та CTO мали просту бесіду про тип продукту та мову програмування. Рішення було і процес прийняття рішення дуже схожий на той, що є в реальності:
Після цього генеральний директор і CPO розпочали спільний мозковий штурм, щоб визначити конкретні деталі продукту:
Після цього починається етап програмування. Основним є процес розробки та діалог між технічним директором, програмістами, дизайнерами та рецензентами коду, а робота з розробки гри завершується через співпрацю.
Після завершення різних процесів розробки та тестування продукту технічний директор, програмісти, генеральний директор і CPO працюватимуть разом, щоб написати детальний документ про взаємодію програмного забезпечення для взаємодії з клієнтами.
Весь процес розбиває завдання на понад 70 підзавдань. Після завершення розподілу завдань розробка продукту завершується майже за 7 хвилин (звичайний цикл розробки може тривати 2-4 тижні), а через пам’ять * і ** функції саморефлексії*, які визначають деякі потенційні вразливості та усувають їх.
Ці дослідники склали статистику вартості кожного етапу всього процесу розробки. Крім того, що весь процес у середньому займає менше 7 хвилин, повна вартість становить менше 1 долара США**, що демонструє дуже високу якість програмного забезпечення. ефективність розробки.. Нижче наведено простий процес реалізації цього ігрового продукту:
Згідно з документом, 86,66% агента штучного інтелекту виконувалося ідеально протягом усього процесу, а в частині, де виконання не вдалось, 50% випадків були спричинені обмеженням довжини маркера API Цей тип помилки Обмеження перешкоджає отриманню повного вихідного коду в межах зазначеного діапазону довжини для створення коду. Ці проблеми особливо очевидні під час роботи зі складними програмними системами або ситуаціями, які вимагають значної генерації коду.
На інші 50% збоїв в основному впливають проблеми із зовнішніми залежностями. Проблеми виникатимуть, коли деякі залежності не можна знайти в хмарі або вони мають неправильну версію. Але загалом результати цього експерименту відносно успішні. Можливо, у найближчому майбутньому багато наших робочих місць зможуть покладатися на агентів ШІ.
Повний текст статті можна переглянути тут:
Публічний код можна переглянути на GitHub: