У квітні, незабаром після того, як Baidu випустив Wen Xin Yi Yan, багато людей все ще нарікали, наскільки щасливими були фотографії, створені Wen Xin Yi Yan. Ще більше людей сходили з розуму від різноманітних тренінгів, таких як ChatGPT і Midjourney. Засновник і генеральний директор Meta Цукерберг думає про можливість представити агентів штучного інтелекту мільярдам людей у всьому світі «корисним і значущим способом».
У травні, коли OpenAI завершив новий раунд фінансування в розмірі 300 мільйонів доларів, засновник Сем Альтман приватно сказав деяким розробникам, що він сподівається створити ChatGPT як персонального робочого помічника. Джерела, знайомі з цією справою, показали, що OpenAI звертає увагу на те, як використовувати чат-ботів для створення автономних агентів ШІ, відповідні функції, ймовірно, будуть розгорнуті в помічнику ChatGPT.
На зустрічі штату в червні Цукерберг оголосив про серію технологій на різних стадіях розробки, одна з яких забезпечить агентів штучного інтелекту з різними характерами та здібностями для надання допомоги або розваг користувачам.
Буквально в липні Meta випустила проект AI Agent MetaGPT, який є фреймворком автоматичного агента, орієнтованим на розробку програмного забезпечення на основі GPT-4.
У Китаї, хоча AutoGPT став популярним ще в квітні в інших країнах, через відсутність у більшості людей розуміння агента штучного інтелекту, що стоїть за ним, початкова реакція не була надто захопленою.
Лише до публікації в блозі про AI Agent Ліліан Венг, керівника прикладного дослідження штучного інтелекту OpenAI, на початку липня коло ШІ вибухнуло, ЗМІ, наукові та дослідницькі кола та сфери інвестицій почали справді обговорювати Агент штучного інтелекту з ентузіазмом.
У результаті в країні дійсно почався сплеск у дослідженні агентів ШІ, а деякі виробники почали реконструювати архітектуру продукту та бізнес-моделі на основі моделі агента ШІ.
Оскільки принципи, моделі та методи побудови AI Agent стають все більш зрозумілими, багато підприємців, які потрапили в пастку технологій, моделей, екології та навіть політики, бачать світле майбутнє.
AI Agent не тільки дозволяє кожному побачити напрямок великої мовної моделі (LLM, Large language Model), він також дозволяє більшій кількості підприємців ще більше розпалити надію на LLM підприємництво, а також дозволяє більшості підприємств побачити майбутню тенденцію ефективного застосування LLM.
Щодо підприємництва AI Agent, співзасновник OpenAI Андрій Карпаті вважає, що звичайні люди, підприємці та гіки мають більше переваг, ніж OpenAI у створенні Агентів, і всі знаходяться в стані рівної конкуренції.
З боку великих компаній, які стикаються з можливістю того, що великі технологічні компанії та стартапи скористаються можливістю агента, Білл Гейтс також сказав, що він був би розчарований, якби Microsoft не втрутилася.
Завдяки потужному просуванню технологічних гігантів, швидкому захопленню підприємців та активному впровадженню великих підприємств AI Agent став абсолютно популярним. І на відміну від попередньої ситуації, коли LLM не було реалізовано, цього разу AI Agent більше не є просто паперовою ідеєю.Багато компаній уже запустили проекти Agent і пов’язані з ними продукти.
Інсайдери галузі показали, що щонайменше 100+ проектів працюють над комерціалізації агентів ШІ, і майже 100 000 розробників створюють автономні агенти. Серед цих агентів штучного інтелекту є іноземні проекти агентів, які в основному базуються на GPT і фреймворку агентів з відкритим вихідним кодом, а також вітчизняні продукти агентів на основі внутрішніх великих моделей (великі моделі в галузях самодослідження) + архітектура з відкритим кодом.
З огляду на все це, які компанії випустили продукти Agent? Яка поточна форма продуктів AI Agent? Ця стаття нараховує 60 агентів ШІ по всьому світу, щоб дати всім краще зрозуміти агентів ШІ.
**PS: **Оскільки в цій статті розглянуто багато проектів агентів, кількість слів досягла 1W+. Рекомендуємо спочатку зібрати їх, а потім прочитати.
Почати з AI Agent
Хоча LLM має достатньо інтелекту, якщо ви хочете, щоб він давав точні відповіді, його потрібно вводити достатньо точно. Якщо майстер і звичайна людина використовують одну і ту саму велику модель, щоб задати запитання, то відповіді, які вони отримають, будуть дуже різними: перший може використовувати різноманітні техніки для отримання бажаних результатів, тоді як другий може лише дивитися на LLM і зітхати.
Якщо ви хочете добре використовувати LLM, ви повинні спочатку навчитися використовувати цей попит породив великий ринок навчання. Підказковий проект, хоча й ускладнює використання LLM, також зменшує досвід користувача. LLM, який мав би повною мірою продемонструвати переваги природної мови, через свою складність став не таким дружнім до звичайних користувачів.
Таким чином проект промптів став великою горою між звичайними людьми та великими моделями.
Як краще вирішити цю проблему? Відповідь: AI Agent (у Китаї його називають AI agent).
AI Agent — це розумна сутність, яка може сприймати середовище, приймати рішення та виконувати дії. На відміну від традиційного штучного інтелекту, агент штучного інтелекту має здатність поступово досягати поставленої мети шляхом незалежного мислення та виклику інструментів.
Після появи LLM агент AI Agent був визначений як агент, яким керує LLM для реалізації автоматизованої обробки загальних проблем.
Ми знаємо, що LLM в основному добре обробляє та генерує текст. Вони можуть відповідати на запитання, писати статті, створювати творчий контент, допомагати з програмуванням тощо. Але LLM все ще є пасивним інструментом, який створює вихідні дані лише тоді, коли ви вводите його.
Агенти штучного інтелекту надають ширший спектр можливостей, особливо щодо взаємодії з середовищем, проактивного прийняття рішень і виконання різноманітних завдань. Можна сказати, що AI Agent є ключем до справжнього розкриття потенціалу LLM. Він може надати потужні можливості дії для ядра LLM.
Основна відмінність між AI Agent і великими моделями полягає в тому, що взаємодія між великими моделями та людьми базується на реалізації. Те, чи буде користувач чітким і недвозначним, вплине на ефект відповіді великої моделі. Немає точної та ефективної відповіді, навіть найпотужнішого ChatGPT.
Для роботи AI Agent потрібно лише поставити мету, і він може мислити незалежно та діяти відповідно до поставленої мети.Він детально розбиватиме кожен крок планування відповідно до поставленого завдання, покладаючись на зворотний зв’язок із зовнішнього світу та незалежне мислення для створення для самому для досягнення мети.
Наприклад, якщо ви попросите ChatGPT купити чашку кави, відгук, наданий ChatGPT, загалом буде схожий на «Ви не можете купити каву, це просто текстовий помічник ШІ».
Але вам потрібно повідомити інструменту AI Agent на основі ChatGPT купити чашку кави. Він спочатку розбереться, як купити чашку кави для вас, і спланує кілька кроків, таких як розміщення замовлення та оплата від вашого імені. через APP, а потім виконайте ці кроки, щоб викликати APP, щоб вибрати винос. Потім зателефонуйте платіжній програмі, щоб розмістити замовлення та оплатити. Процес не вимагає від людини вказувати кожен крок операції.
Хоча і інструменти штучного інтелекту, і агенти є програмним забезпеченням, призначеним для автоматизації завдань, певні ключові характеристики відрізняють агентів штучного інтелекту від більш складного програмного забезпечення ШІ.
Якщо інструмент ШІ має такі характеристики, його можна вважати агентом ШІ:
**Автономність: **Віртуальні агенти штучного інтелекту можуть виконувати завдання самостійно без втручання або введення людини.
**Сприйняття: **Функції агента сприймають та інтерпретують своє середовище за допомогою різних датчиків (таких як камери чи мікрофони).
**Реактивність: **Агенти штучного інтелекту можуть оцінювати оточення та відповідним чином реагувати для досягнення своїх цілей.
**Міркування та прийняття рішень: **Агенти штучного інтелекту — це інтелектуальні інструменти, які можуть аналізувати дані та приймати рішення для досягнення цілей. Вони використовують методи міркування та алгоритми для обробки інформації та вжиття відповідних дій.
Навчання: вони можуть навчатися та покращувати свою продуктивність за допомогою машинних, глибоких і посилених елементів і методів навчання.
**Комунікація: **Агенти штучного інтелекту можуть спілкуватися з іншими агентами або людьми за допомогою різних методів, таких як розуміння природної мови та реагування на неї, розпізнавання мовлення та обмін текстовими повідомленнями.
Орієнтовані на ціль: Вони спрямовані на досягнення конкретних цілей, які можна заздалегідь визначити або навчитися через взаємодію з оточенням.
**З точки зору категорій, агентів штучного інтелекту наразі можна розділити на автономних агентів (Autonomous Agents) і генеративних агентів (Generative Agents). **
Автономні агенти, такі як Auto-GPT, можуть автоматично виконувати завдання та досягати очікуваних результатів на основі потреб людей за допомогою природної мови. У цій моделі співпраці автономний агент в основному обслуговує людей і більше схожий на ефективний інструмент.
Генеративні агенти, такі як місто Westworld, спільно створене дослідниками зі Стенфорда та Google, або людиноподібні роботи у «Westworld», живуть в одному середовищі, мають власні спогади та цілі, і не тільки взаємодіють з людьми, але й взаємодіють з кожним Інші взаємодії роботів.
Щодо агентів штучного інтелекту, 86-сторінковий огляд агентів на базі LLM, нещодавно опублікований командою обробки природної мови університету Фудань (FudanNLP), вичерпно підсумовує поточний стан інтелектуальних агентів на основі великомасштабних мовних моделей, включаючи: фон, склад, і застосування агентської сцени на базі LLM, а також багато обговорюваного агентства.
Сказавши стільки, багато друзів, можливо, все ще не мають інтуїтивного уявлення про агентів ШІ. Не хвилюйтеся, нижче ми використаємо порівняльний випадок, щоб поглибити ваше розуміння.
Інтелектуальні агенти проникають у різні сфери
AiAgent.app — це веб-програма, яка дозволяє користувачам створювати власних агентів ШІ для виконання певних завдань і досягнення цілей.
Нижче Wang Jiwei Channel розгляне переваги агентів ШІ через порівняльний досвід використання агентів ШІ та безпосереднього використання LLM.
Наприклад, якщо ви хочете дізнатися про новини та тенденції в галузі штучного інтелекту за минулий місяць, введіть у Claude: підсумок останніх новин і тенденцій в галузі штучного інтелекту за минулий місяць.
Отриманий результат, як показано нижче:
Як бачите, Клод перерахував лише кілька витягів новин, пов’язаних із ШІ.
Введіть цей абзац у AiAgent.app, він спочатку розіб’є ваші потреби на десять завдань, потім взаємодіє з користувачем за допомогою підказок для виконання кожного завдання та виведе результати для кожного завдання. Очевидно, що інформація про недавню індустрію штучного інтелекту, отримана в AiAgent.app, є більш повною, ніж інформація, отримана шляхом безпосереднього використання інших LLM.
Чи можливо отримати цей вміст безпосередньо за допомогою великих моделей? Теоретично його можна заповнити, ввівши більше, але його потрібно ввести не менше десяти разів, і точність введення не може бути гарантована, і іноді ви навіть не знаєте, яку інформацію хочете отримати.
У програмі AiAgent.app вам потрібно ввести лише одне речення, і вона проаналізує ваші можливі потреби та перерахує відносно вичерпні цілі контенту, направляючи вас до досягнення бажаного, і ефективність зросте в кілька разів.
Порівнюючи ці два, стає зрозуміло, що AI Agent перевершує насиченість і ефективність отримання вмісту. Цей вид агента інформаційного контенту має велике значення для медіа-практиків, галузевих аналітиків та інших професій і може значно скоротити час для отримання даних дослідження.
Зараз є деякі такі агенти, орієнтовані на точніші групи користувачів і сценарії застосування. Наприклад, GPT Researcher, запущений Колумбійським університетом, є агентом для дослідників на основі ChatGPT, який може створювати різноманітні звіти про дослідження для користувачів, щоб просувати дослідження.
У цьому випадку йдеться лише про отримання вмісту.Насправді з’явилися агенти для кількох сценаріїв додатків, яких достатньо, щоб мобілізувати більше програмних додатків і навіть апаратних пристроїв для виконання різноманітних завдань.
Наприклад, деякі люди використовували AutoGPT, щоб замовляти їжу, бронювати квитки, брати таксі та робити покупки; 25 агентів AI у місті Westworld у Стенфорді щодня гуляють, зустрічаються, спілкуються, п’ють каву та діляться новинами дня; Google Deepmind запустила використання роботизованих агентів для роботизованих рук для автоматичного виконання різноманітних завдань; Amazon також запустила Amazon Bedrock Agents для автоматичної декомпозиції завдань розробки корпоративних додатків ШІ; IBM Watson Health допомагає лікарям діагностувати, лікувати та спостерігати за пацієнтами в багатьох лікарнях.
Хоча Ai Agent не був популярним протягом тривалого часу, його підтримали багато компаній у багатьох сферах, як тільки він з'явився. Багатомодельні можливості великих мовних моделей у поєднанні з більшою сьогоднішньою обчислювальною потужністю дозволили агентам, які були запропоновані багато років тому, швидко отримати цінність і бути реалізованими в більшій кількості областей із супершвидкістю проникнення.
З появою агентів штучного інтелекту з відкритим кодом, таких як MetaGPT, більше постачальників технологій і команд підприємців запровадили агентів, і більше організацій визнали та прийняли агентів. Це неминуче швидко стане основною моделлю для впровадження LLM у різних сферах, допомагаючи тисячам галузей, щоб змінити свій бізнес Хороша програма LLM.
Перелік 60 агентів ШІ по всьому світу
AiAgent.app, згаданий у наведеному вище випадку, є одним із репрезентативних продуктів AI Agent, який набирає обертів останніми місяцями. Кілька агентів у країні та за кордоном, включно з цим агентом штучного інтелекту, можна побачити в інвентарному списку проектів нижче.
Щоб усі могли краще зрозуміти агентів штучного інтелекту, запущених на даний момент, Wang Jiwei Channel (id: jiwei1122) поділяє цих агентів штучного інтелекту на звіти ЗМІ, запущені всередині країни, галузеві, інші за кордоном і проекти GitHub. поступово винагороджувати в майбутньому Бібліотека проекту класифікує цих агентів на різні категорії.
Агенти штучного інтелекту, розглянуті в цій статті, включають як фреймворки та інструменти агентів штучного інтелекту, так і продукти AGENT на основі деяких фреймворків з відкритим кодом.В той же час більшість проектів і продуктів є автономними агентами.
Оскільки деякі виробники є відносно стриманими та не повідомляють про це зовнішньому світу, агенти штучного інтелекту, перелічені в цій статті, не є повними, тому їх також називають неповним списком агентів штучного інтелекту. Більше виробників і підприємців можуть зв’язатися з каналом Wang Jiwei після прочитання цієї статті, і ми всі зможемо зробити свій внесок у процвітання та розвиток екосистеми AI AGENT.
Агент ШІ повідомляє ЗМІ
1、Auto-GPT
Auto GPT — це безкоштовний проект із відкритим кодом на Github, який поєднує технології GPT-4 і GPT-3.5 для створення повних проектів за допомогою API.
На відміну від ChatGPT, користувачам не потрібно постійно задавати питання штучному інтелекту, щоб отримати відповідні відповіді. В AutoGPT їм потрібно лише надати йому ім’я штучного інтелекту, опис і п’ять цілей, після чого AutoGPT зможе завершити проект самостійно. . Він може читати та записувати файли, переглядати веб-сторінки, переглядати результати власних підказок і поєднувати їх із згаданою історією підказок.
Auto-GPT є одним із перших прикладів повністю автономної роботи GPT-4, що розширює межі можливостей штучного інтелекту.
2、AgentGPT
AgentGPT дозволяє налаштовувати та розгортати автономні агенти ШІ. Просто назвіть свій спеціальний штучний інтелект і скажіть йому розпочати будь-яку мету, яку можна собі уявити, і він спробує її досягти, думаючи про завдання, яке потрібно виконати, виконуючи завдання та навчаючись на результатах.
3、Baby AGI
Це система керування завданнями, керована ШІ. Система використовує OpenAI і Pinecone API для створення, визначення пріоритетів і виконання завдань. Створюйте завдання, аналізуючи результати попередніх завдань і попередньо визначені цілі, а також використовуйте обробку природної мови OpenAI (NLP) і Chroma, щоб зберігати й отримувати результати завдань у контексті.
Привабливість Baby AGI полягає в його здатності автономно вирішувати завдання та підтримувати заздалегідь визначені цілі на основі результатів попередніх завдань, а також ефективно розставляти пріоритети завдань.
4、Джарвіс (HuggingGPT)
Унікальна система співпраці, розроблена Microsoft, яка може використовувати кілька моделей штучного інтелекту для виконання певного завдання, а ChatGPT виконує роль контролера завдань. Проект, відомий як JARVIS на GitHub, тепер доступний для випробування на Huggingface (отже, HuggingGPT), агенті, який надзвичайно добре працює з текстом, зображеннями, аудіо та навіть відео.
Те, як це працює, схоже на те, як OpenAI демонструє мультимодальні можливості GPT 4 за допомогою тексту та зображень, але JARVIS йде далі та інтегрує різні LLM з відкритим кодом для зображень, відео, аудіо тощо, а також може підключатися до Інтернет і доступ до файлів. Наприклад, ви можете ввести URL-адресу веб-сайту та поставити запитання щодо нього.
5、Aiagent.app
Ai Agent — це веб-додаток, який дозволяє користувачам створювати власні агенти AI для виконання певних завдань і досягнення цілей. Агенти ШІ працюють, розбиваючи цілі на менші завдання та виконуючи їх одне за іншим. Переваги включають можливість запускати кілька агентів штучного інтелекту одночасно та демократизацію доступу до передових технологій.
AI Agent також може похвалитися такими функціями, як вбудовані блоки коду з підсвічуванням синтаксису та безперебійну співпрацю зі сторонніми платформами. Інструмент є безкоштовним для використання та забезпечує спрощений спосіб створення агентів ШІ, не вимагаючи додаткових технічних знань.
6、CamelAGI
Camel AGI — це генеративний інструмент штучного інтелекту, який дозволяє користувачам вирішувати поставлені завдання за допомогою рольових автономних агентів штучного інтелекту. Звичайно, користувачам потрібно ввімкнути Java, щоб використовувати цей інструмент. Camel AGI дозволяє користувачам виконувати завдання за допомогою агентів штучного інтелекту та надає можливість увійти за допомогою Google або позначити інструмент зірочкою на Github.
7. Симуляція "Westworld" Westworld town
Для цього проекту дослідники зі Стенфордського університету та Google створили інтерактивне середовище пісочниці, що містить 25 генеративних агентів ШІ, які можуть симулювати поведінку людини. Вони гуляли в парку, пили каву в кафе і ділилися новинами з колегами, демонструючи напрочуд хорошу соціальну поведінку.
Наприклад, починаючи з визначеної користувачем концепції, згідно з якою агент хоче влаштувати вечірку до Дня Святого Валентина, агент автоматично розсилає запрошення на вечірку протягом наступних двох днів, заводить нових друзів, запрошує один одного на побачення та вечірки та координує події у потрібний час Час з’являтися на вечірках разом.
8、Інженер GPT
GPT-Engineer — це інструмент штучного інтелекту з відкритим кодом, який дозволяє користувачам визначати, що вони хочуть створити, а потім проводити роз’яснювальну розмову зі штучним інтелектом, щоб створити необхідну кодову базу. Інструмент створено для забезпечення простого та гнучкого взаємодії з користувачем, дозволяючи користувачам адаптувати та розширювати його функціональність відповідно до своїх потреб.
Інструмент включає такі функції, як визначення ідентифікатора агента AI, збереження історії зв’язку з GPT4 і повторний запуск журналів повідомлень. Внески до проекту вітаються, і зацікавлені особи можуть звернутися до дорожньої карти, проектів і питань, доступних у сховищі GitHub. GPT-Engineer прагне бути відкритою платформою для розробників, щоб досліджувати та створювати свій інструментарій для генерації коду.
9、MetaGPT
MetaGPT, запущений корпорацією Meta, — це багатоагентна структура, яка використовує однорядковий вхід для створення API, історій користувачів, структур даних, конкурентного аналізу тощо. Цей фреймворк може служити менеджерам з продуктів, інженерам програмного забезпечення та архітекторам. Фреймворк може діяти як ціла компанія-розробник програмного забезпечення, організовуючи СОП за допомогою лише одного рядка коду.
MetaGPT інтегровано з проектуванням процесу людини SOP. Таким чином, агенти на базі LLM створюють високоякісні, різноманітні, структуровані документи та проекти. MetaGPT розроблено, щоб полегшити розробку рішень для складних завдань і забезпечити можливості вирішення проблем, які можна порівняти з людським інтелектом.
10、Amazon Bedrock Agents
Amazon Bedrock Agents, випущені Amazon, дозволяють розробникам швидко створювати повністю керовані агенти. Виконуючи виклики API до корпоративних систем, агенти Amazon Bedrock прискорюють випуск генеративних додатків ШІ, які керують і виконують дії.
Агенти Amazon Bedrock спрощують швидку розробку та оркестровку завдань із запитами користувачів. Після налаштування ці агенти можуть автономно створювати підказки та безпечно покращувати їх за допомогою даних компанії, щоб надавати користувачам відповіді природною мовою. Ці розширені агенти мають здатність визначати необхідні дії для автоматичної обробки запитів користувачів.
11、nvidia Voyager
Voyager, спільно запущений NVIDIA, Каліфорнійським технологічним інститутом та іншими, використовує GPT-4 для навчання агентів Minecraft у світі пікселів. Слід зазначити, що Voyager покладається на генерацію коду, а не на навчання з підкріпленням.
Voyager — перший агент, який навчається протягом усього життя, який грає в Minecraft. На відміну від інших агентів Minecraft, які використовують класичні методи навчання з підкріпленням, Voyager використовує GPT-4 для постійного самовдосконалення. Він робить це шляхом написання, вдосконалення та передачі коду, що зберігається у зовнішній бібліотеці навичок.
Результатом цього є невеликі програми, які допомагають у навігації, відкриванні дверей, видобутку ресурсів, створенні кирки або боротьбі із зомбі. GPT-4 відкриває нову парадигму, у якій «навчання» — це виконання коду, а «навчальні моделі» — це база коду навичок, яку Voyager ітеративно збирає.
12、RoboAgent
Спільній дослідницькій групі Meta та CMU знадобилося два роки, щоб успішно розробити універсального робота-агента RoboAgent. РобоАгент отримав 12 різних складних навичок за допомогою навчання лише з 7500 траєкторіями, включаючи випікання, збирання предметів, подачу чаю, прибирання кухні та інші завдання, і їх можна узагальнити та застосувати в 100 невідомих сценаріях.
RoboAgent виконує завдання незалежно від того, скільки перешкод він стикається. Метою цього дослідження є створення ефективної парадигми навчання роботів, яка вирішує проблеми різноманітності наборів даних і сцен. Дослідники запропонували архітектуру Multi-Task Action Blocking Transformer (MT-ACT) для обробки мультимодальних багатозадачних наборів даних роботів за допомогою семантичного вдосконалення та ефективного представлення політики.
13、Inflection AI Pi
Основним мозком персонального продукту AI Agent Pi, запущеного компанією Inflection AI, є велика модель Inflection-1, розроблена компанією, і її продуктивність порівнянна з GPT-3.5. На відміну від популярних чат-ботів загального призначення, Pi може лише вести дружні розмови, давати стислі поради чи навіть просто слухати.
Його основними характеристиками є співчуття, скромність, цікавість, гумор та новаторство, а також хороший емоційний інтелект. Він може надати необмежену кількість знань і спілкування відповідно до унікальних інтересів і потреб користувачів. Оскільки Inflection розробила Pi, було визначено, що Pi буде служити особистим інтелектом (Personal Intelligence), а не просто інструментом для допомоги людям у їхній роботі.
14、HyperWrite
Hyperwrite — це інструмент для написання AI, який допомагає творчим авторам будь-якого рівня писати швидше та впевненіше. Він містить такі функції, як автоматичний запис і введення наперед, щоб генерувати оригінальні абзаци та пропонувати ідеї для подолання блоку автора.
Інструмент доступний як безкоштовне розширення Chrome і може використовуватися на будь-якому веб-сайті, не перериваючи робочий процес. Його використовують і довіряють професіонали, студенти та творці в усьому світі для підвищення продуктивності.
15、GPT дослідник
GPT Researcher — це автономний агент на основі штучного інтелекту, який використовується для проведення всебічних онлайн-досліджень для різноманітних завдань. Натхненний AutoGPT і підказкою «Плануйте та вирішуйте», цей інструмент має на меті покращити проблеми швидкості та детермінізму, виявлені в поточних мовних моделях, «забезпечуючи стабільнішу продуктивність і вищі швидкості завдяки роботі в паралельних агентах, а не в синхронній роботі».
За словами команди, дослідники GPT полегшують дослідження, генеруючи релевантні дослідницькі запитання, збираючи дані з понад 20 веб-джерел і використовуючи GPT3.5-turbo-16 і GPT-4 для створення комплексних звітів про дослідження.
AI Agent запущено в Китаї
Після безперервних досліджень і експериментів також почали з’являтися вітчизняні продукти, пов’язані зі штучним інтелектом. Ось п’ять продуктів.
1. Alibaba Cloud ModelScopeGPT
Спільнота Alibaba Cloud Mota запустила перший у Китаї інструмент виклику великомасштабних моделей ModelScopeGPT. За допомогою цього інструменту користувачі можуть викликати інші моделі штучного інтелекту в спільноті Mota, надсилаючи інструкції одним клацанням миші, таким чином реалізуючи великі та малі програми. Моделі працюють разом. виконувати складні завдання.
ModelScopeGPT базується на фреймворку розробки ModelScope-Agent з відкритим вихідним кодом великої мовної моделі (LLM) AI Agent (агента). Це загальна настроювана структура агента для практичних застосувань. Вона базується на великих мовних моделях (LLM) із відкритим кодом як ядрі та включає такі модулі, як керування пам’яттю та використання інструментів.
LLM з відкритим вихідним кодом головним чином відповідає за планування завдань, планування та генерацію відповідей; модуль керування пам’яттю в основному включає пошук знань і керування (за словами підказки); модуль використання інструментів включає бібліотеку інструментів, пошук інструментів і налаштування інструментів.
2. Дійсно інтелектуальний TARS-RPA-Agent
TARS-RPA-Agent, запущений Real Intelligence у сфері гіперавтоматизації, є гіперавтоматичним агентом на основі подвійного механізму «TARS+ISSUT (Intelligent Screen Semantic Understanding)» із «мозком» і « очі, руки та ноги". Це новий продукт моделі RPA, який може автономно розбирати завдання, сприймати поточне середовище, виконувати та надавати зворотній зв’язок, а також пам’ятати історичний досвід.
TARS-RPA-Agent приймає технічну структуру, засновану на великій моделі TARS і семантичному розумінні розумного екрана ISSUT. Технічна структура поділена на два рівні: нижній рівень – це серія великих моделей TARS, включаючи загальні базові моделі та базові моделі різних вертикальних галузей промисловості, а також технологію розуміння семантики розумного екрана; верхній рівень – це надвелика модель, яка спирається на ці дві ключові технології для завершення комплексних оновлень і перетворень Продукти автоматизації.
Основним LLM TARS-RPA-Agent є власно розроблена вертикальна модель TARS Real Intelligence, заснована на загальній великій базі моделей. Велика модель TARS має чудові основні функції, такі як генерація тексту, розуміння мови, запитання та відповіді на знання, і логічне міркування.здатність.
3. Інтелектуальний агент OmBot Ohm
На Всесвітній конференції зі штучного інтелекту 2023 року компанія Lianhui Technology випустила OmBot, автономного агента (Auto AI Agent), заснованого на можливостях великої моделі, і запустила першу партію програм для типових вимог сцени.
Автономний агент Lianhui містить чотири основні можливості: пізнання, пам’ять, мислення та дії. Як автоматичний і автономний агент, він працює в циклі в найпростішій формі. На кожній ітерації вони генерують самокеровані інструкції та операції. Таким чином, він не покладається на те, щоб люди керували командами, і має високу масштабованість.
4. Lanma Technology Ask XBot
Агентська платформа "Ask XBot", створена компанією Lanma Technology, розділена на два рівні: перший рівень - це розширення можливостей експертів. Експерти визначають робочі процеси та навчають їх машинам за допомогою перетягування, скидання, перетягування та діалогової взаємодії, тим самим допомагаючи співробітникам на передовій лінії будувати Методологія для більш ефективної роботи; другий рівень — для співробітників, які використовують Агент. Співробітники на передовій лінії можуть спілкуватися з Агентом природною мовою та видавати інструкції, що дозволяє Агенту допомагати в аналізі даних, пошуку інформації та інших завданнях.
Компанія планує створити Ask. Клієнти можуть обслуговуватися більш ефективно та інтелектуально на платформі.
5, ChatDev
ChatDev, запущений спільною дослідницькою групою Університету Цінхуа, Пекінського університету пошти та телекомунікацій та Університету Брауна, є генеративним агентом. Це наскрізна основа розробки програмного забезпечення на основі чату, яка використовує великі мовні моделі (LLM) для сприяння ефективній комунікації та співпраці між багатьма учасниками ("gpt3.5-turbo-16k" версія ChatGPT) у процесі розробки програмного забезпечення. .
Основною метою ChatDev є розробка ігор через чат. Користувачам потрібно лише пропонувати ідеї, і весь процес від проектування до тестування виконується ШІ, і весь процес займає лише сім хвилин.
Продукти AI Agent для різних сфер
До появи LLM деякі компанії вже вивчали поєднання традиційного штучного інтелекту та агента. Тому впровадження AI Agentmt у різних сферах відбувається набагато швидше, ніж усі очікували.
Нижче наведено репрезентативні прикладні програми агентів у кількох галузях промисловості.
У сфері медицини агенти можуть допомогти діагностувати, лікувати та спостерігати за пацієнтами. IBM Watson Health — це агент ШІ, який аналізує медичні дані, щоб виявити потенційні проблеми зі здоров’ям і рекомендувати варіанти лікування.
У фінансовій сфері Агенти можуть аналізувати фінансові дані, виявляти шахрайство та давати інвестиційні рекомендації. Чарльз Шваб використовує агента штучного інтелекту під назвою Intelligent Portfolio для створення та управління інвестиційними портфелями на основі інвестиційних цілей клієнтів.
У роздрібних бізнес-сценаріях Агенти можуть надавати персоналізовані рекомендації, покращувати управління ланцюгом постачання та покращувати взаємодію з клієнтами. Alexa від Amazon — це агент ШІ, який може рекомендувати продукти, розміщувати замовлення та відстежувати відправлення.
На виробництві агент може оптимізувати виробничі процеси, передбачити потреби в обслуговуванні та покращити якість продукції. General Electric використовує агент штучного інтелекту під назвою Predix для моніторингу машин у режимі реального часу, щоб прогнозувати та запобігати збоям обладнання.
У сфері транспорту автономні агенти штучного інтелекту можуть допомогти з плануванням маршруту, керуванням дорожнім рухом і безпекою транспортних засобів. Автопілот від Tesla допомагає безпілотним транспортним засобам і водіям паркуватися, змінювати смуги руху та безпечно їздити.
В освітній індустрії Agnet може надавати персоналізований досвід навчання, автоматизувати адміністративні завдання та аналізувати успішність студентів. Агент зі штучного інтелекту Pearson Aida може надати учням зворотний зв’язок і запропонувати персоналізовані шляхи навчання.
У сільському господарстві агенти ШІ можуть оптимізувати виробництво сільськогосподарських культур, контролювати якість ґрунту та прогнозувати погодні умови. John Deere використовує агент штучного інтелекту під назвою See&Spray для виявлення та локалізації бур’янів, не впливаючи на посіви.
Інші продукти AGENT були запущені за кордоном
1、Cognosis
Cognosys — це веб-агент штучного інтелекту, створений для революції в продуктивності та спрощення складних завдань за допомогою найсучаснішої технології штучного інтелекту, щоб покращити ваше повсякденне життя.
2、Doanythingmachine
Легко керуйте своїми завданнями за допомогою універсальної машини, де персональний агент ШІ користувача розставлятиме пріоритети та виконуватиме ваші завдання за вас
3、alphakit
Інтуїтивно зрозуміла платформа для створення та керування командами цілеспрямованих автономних агентів штучного інтелекту з вашого телефону. Створюйте команди агентів autoGPT AI і керуйте ними. Просто визначте свої цілі, а про все інше подбає Alphakit.
4、GPTConsole
GPTConsole — це революційний інтерфейс командного рядка (CLI), розроблений, щоб надати розробникам переваги штучного інтелекту. Це виходить за рамки традиційних функцій терміналу, дозволяючи користувачам виконувати складні завдання за допомогою підказок.
5、Покриття
Перетворіть свою базу знань у чат AI за 2 хвилини, надавши посилання на базу знань. Fini надає користувачам невтомного агента штучного інтелекту, готового негайно відповідати на запитання клієнтів 24/7.
6、Заклинання
Spell — це автономний агент ШІ на основі GPT4, який можна застосовувати для щоденної ефективної роботи. Spell також має такі необхідні функції, які допоможуть вам працювати розумніше та навчитися використовувати потужність генеративного штучного інтелекту для створення одного або кількох інноваційних автономних агентів, які працюватимуть над вирішенням ваших проблем.
7、Aomni
Aomni — це інформаційно-пошуковий агент штучного інтелекту, який може знаходити, витягувати й обробляти будь-які дані в Інтернеті за вас, покращуючи вашу дослідницьку роботу. Aomni може використовувати різноманітні інструменти для розумного планування ваших запитів для отримання кінцевих результатів, включаючи повноцінний веб-браузер, який дозволяє отримати доступ до будь-якої інформації в Інтернеті без потреби в API.
Планувальник запитів Aomni базується на поточній найсучаснішій архітектурі AutoGPT, інтелектуально плануючи та оновлюючи кожен запит, щоб забезпечити коректність джерела та різноманітність.
8、Fine-Tuner.ai
За допомогою Fine-Tuner.ai користувачі можуть створювати складні спеціалізовані агенти штучного інтелекту без технічних навичок або кодування, просто вводячи свої дані та ідеї. Понад дюжина професійних агентів штучного інтелекту можуть створювати точні запитання та відповіді, шукати документи, автоматизувати процеси тощо для користувачів за допомогою завантажених даних у реальному часі, таких як PDF, CV, PPT та URL.
9、SuperAGI
Фреймворк автономного штучного інтелекту з відкритим кодом, який дає змогу швидко й надійно розробляти й розгортати корисні автономні агенти, а також інфраструктуру для створення, керування та запуску автономних агентів.
10、Yellow.ai
Yellow.ai — це провідна розмовна платформа штучного інтелекту корпоративного рівня, яка підтримує динамічні агенти штучного інтелекту на підприємстві, розроблена для забезпечення людської взаємодії через платформу без коду/з низьким кодом, щоб підвищити задоволеність клієнтів і залучити співробітників.
11、Godmode
Дозволяє користувачам запускати AutoGPT у браузері. Godmode дозволяє користувачам розгортати кілька агентів штучного інтелекту одночасно для виконання завдань за допомогою штучного інтелекту, а також користувачі можуть використовувати власні ключі OpenAI API.
12、E42
E42 — це платформа автоматизації когнітивних процесів, яка дозволяє підприємствам створювати багатофункціональні когнітивні агенти для автоматизації різних процесів у різних функціях. Когнітивна платформа без коду плавно інтегрується з існуючими технологіями та процесами користувачів, щоб розблокувати найвищу цінність у відділах. Користувачі можуть використовувати E42 для створення власних агентів штучного інтелекту, таких як аналітики штучного інтелекту та рекрутери штучного інтелекту у вертикальних галузях.
13、Дякую
Агенти зі штучним інтелектом Thankful навчені та налаштовані на роботу у вашій існуючій службі підтримки, легко вирішуючи великі запити клієнтів через електронну пошту, чат, SMS і канали в програмі. Маючи здатність розуміти, підключатися, вирішувати, персоналізувати та інформувати, агенти ThankfulAI надають послуги, схожі на людину, із машинною швидкістю та властивими масштабованими знаннями.
14、Aktify
Використовуйте віртуальних агентів штучного інтелекту Aktify, щоб клонувати свою команду продажів без збільшення кількості персоналу. Aktify оброблятиме необмежену кількість потенційних клієнтів, які не відповідають на запити) і постійно залучатиме клієнтів, готових поговорити з вашою командою продажів, це більше, ніж просто SMS-чат-бот.
15、TeamSmart AI
Підвищте свою продуктивність за допомогою доступу до TeamSmart AI в один клік. Збирайте вміст, створюйте код, створюйте чернетки твітів тощо прямо у вашому браузері. ChatGPT миттєво відкривається одним натисканням значка або комбінації клавіш, надаючи миттєвий доступ до бібліотеки якісних порад без входу в систему.
16、BrainstormGPT
BrainstormGPT інтегрує кілька агентів, LLM і автоматичний пошук, щоб спростити перетворення звіту про зустріч. Спеціальні теми, визначені користувачами ролі, автономні обговорення агентами та вихід звітів протягом 20 хвилин приблизно еквівалентні 300 пошукам, 10 годинам обговорень і 100 000 аналізів тексту.
17、AgentRunner.Ai
AgentRunner.ai — це автономний інструмент для створення агентів ШІ, який використовує потужність GPT-4 для створення та навчання повністю автономних агентів. Дозволяє користувачам встановлювати цілі для своїх агентів і дозволяти їм вирішувати, як досягти цих цілей без будь-яких технічних знань або навичок програмування.
Інструмент пропонує такі функції, як створення автономних агентів з унікальними характеристиками, запуск агента для виконання завдань або навчання новим навичкам, визначення того, що може робити агент, і інтеграція з обліковими записами OpenAI або Google Cloud.
18、Залишся
Gista допомагає компаніям взаємодіяти з відвідувачами веб-сайту та перетворювати їх на потенційних клієнтів цілодобово та без вихідних, а її основні функції включають створення агентів конверсії AI та агентів продажу AI. Використовуючи Gista, підприємства можуть легко перетворювати відвідувачів веб-сайту на потенційних клієнтів і створювати списки розсилки.
19、Агент4
Однією з ключових особливостей Agent4 є можливість створювати віртуальних агентів на основі штучного інтелекту, які можуть відповідати на запитання, допомагати бронювати зустрічі, прослуховувати голосову пошту та надавати підсумки.
Ви можете легко створювати індивідуальні взаємодії для агентів, дозволяючи їм відповідати на запитання та виконувати різноманітні завдання голосом вашого бренду. Ви також можете вибрати, як агенти відповідатимуть на дзвінки в режимі реального часу, і вирішити, чи потрібно вам з кимось поговорити і коли.
20、Cometcore AI
Cometcore AI — це інноваційна платформа, яка надає універсальний набір інструментів на основі штучного інтелекту для підвищення продуктивності та спілкування. За допомогою Cometcore ви можете створювати, кодувати та автоматизувати милих агентів.
21、персональний помічник
Агент зі штучним інтелектом, створений для виконання будь-яких завдань: від бронювання авіаквитків до проведення поглиблених досліджень і всього іншого.
Проект AI Agent на Github
1、OpenAGI
OpenAGI — це дослідницька платформа AGI з відкритим вихідним кодом, спеціально розроблена для виконання складних багатоетапних завдань, що супроводжуються спеціальними наборами даних, показниками оцінки та різними масштабованими моделями. OpenAGI формулює складні завдання як запити природною мовою як вхідні дані для LLM. Після цього LLM вибирає, синтезує та виконує моделі, надані OpenAGI для вирішення завдання.
Проект також запропонував механізм підсилення навчання із зворотним зв’язком завдань (RLTF), який використовує результати розв’язання завдань як зворотний зв’язок для покращення можливостей вирішення завдань LLM. LLM відповідає за синтез різних зовнішніх моделей для вирішення складних завдань, тоді як RLTF забезпечує зворотний зв’язок для покращення своїх можливостей вирішення завдань, забезпечуючи цикл зворотного зв’язку для самовдосконалення ШІ. Парадигма LLM, що використовує різні експертні моделі для вирішення складних завдань, є перспективним підходом до AGI.
2、Агент-LLM
Agent-LLM — це платформа автоматизації штучного інтелекту, розроблена для ефективного керування інструкціями штучного інтелекту в кількох постачальників.
Агент оснащено адаптивною пам’яттю, і це універсальне рішення пропонує потужну систему плагінів, яка підтримує різноманітні команди, включаючи веб-перегляд. Завдяки зростаючій підтримці численних постачальників і моделей штучного інтелекту Agent-LLM продовжує розвиватися, щоб покращити різноманітні додатки.
3、AutoGPT-Next-Web
Цей агент може одним клацанням миші розгорнути добре розроблений веб-інтерфейс AutoGPT-Next-Web на Vercel і одним клацанням безкоштовно розгорнути вашу приватну веб-програму AutoGPT-Next-Web. На основі AutoGPT-Next-Web користувачі можуть використовувати Vercel для безкоштовного розгортання одним клацанням миші та створення персонального веб-сайту AutoGPT за 1 хвилину.
4、MiniGPT-4
Цей агент може використовувати передові великі мовні моделі для покращення візуального розуміння мови.
5、Mini-AGI
Mini-AGI — це найменший автономний агент загального призначення на основі GPT3.5/4. Він поєднує в собі потужні підказки, мінімальний набір інструментів і короткочасну пам’ять (ланцюжок думок) із доповненням даних через векторне сховище, яке незабаром буде додано, щоб аналізувати курс акцій, виконувати тести кібербезпеки, створювати мистецтво та замовляти піцу.
6、Teenage-AGI
Натхненний кількома проектами, пов’язаними з Auto-GPT (головним чином BabyAGI) і документом «Generative Agents: Interactive Simulation of Human Behavior», цей проект Python використовує OpenAI та Pinecone, щоб забезпечити пам’ять для агента AI та дозволити йому «подумати» перед тим, як діяти. (виведення тексту).
7、FastGPT
FastGPT — це система запитань і відповідей на базі знань, заснована на великій мовній моделі LLM, яка забезпечує готову обробку даних, виклик моделі та інші можливості. У той же час робочий процес можна оркеструвати за допомогою візуалізації потоку для реалізації складних сценаріїв питань і відповідей.
8、DemoGPT
За допомогою DemoGPT ви можете швидко створити демонстрацію, використовуючи лише прості речення.
9、LocalAGI
Локальний запуск проектів AGI на основі LLMDA, ChatGLM та інших моделей.
10. ai-town (категорія гри)
Місто зі штучним інтелектом з відкритим кодом відомої інвестиційної установи a16z — це ліцензований Массачусетським технологічним інститутом стартовий набір для створення та налаштування власної версії міста зі штучним інтелектом. Це віртуальне місто, де живуть, спілкуються та спілкуються персонажі ШІ.
11, gptrpg (категорія гри)
gptrpg Цей репозиторій містить дві речі: просте середовище, подібне до RPG, для агента штучного інтелекту з підтримкою LLM і простого агента штучного інтелекту, який підключається до API OpenAI для існування в цьому середовищі.
12. SFighterAI (Категорія ігор)
Проект — це агент штучного інтелекту, навчений за допомогою глибокого підкріплення, щоб перемогти фінального боса в грі Street Fighter II: Special Champion Edition. Агент AI приймає рішення виключно на основі значень пікселів RGB ігрового екрана. У наданому стані збереження агент досягає 100% виграшу в першому раунді останнього рівня.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
60 агентів штучного інтелекту, до яких ви повинні звернутися, коли починаєте великий бізнес з моделювання мови
Джерело: TMTpost Media
У квітні, незабаром після того, як Baidu випустив Wen Xin Yi Yan, багато людей все ще нарікали, наскільки щасливими були фотографії, створені Wen Xin Yi Yan. Ще більше людей сходили з розуму від різноманітних тренінгів, таких як ChatGPT і Midjourney. Засновник і генеральний директор Meta Цукерберг думає про можливість представити агентів штучного інтелекту мільярдам людей у всьому світі «корисним і значущим способом».
У травні, коли OpenAI завершив новий раунд фінансування в розмірі 300 мільйонів доларів, засновник Сем Альтман приватно сказав деяким розробникам, що він сподівається створити ChatGPT як персонального робочого помічника. Джерела, знайомі з цією справою, показали, що OpenAI звертає увагу на те, як використовувати чат-ботів для створення автономних агентів ШІ, відповідні функції, ймовірно, будуть розгорнуті в помічнику ChatGPT.
На зустрічі штату в червні Цукерберг оголосив про серію технологій на різних стадіях розробки, одна з яких забезпечить агентів штучного інтелекту з різними характерами та здібностями для надання допомоги або розваг користувачам.
Буквально в липні Meta випустила проект AI Agent MetaGPT, який є фреймворком автоматичного агента, орієнтованим на розробку програмного забезпечення на основі GPT-4.
У Китаї, хоча AutoGPT став популярним ще в квітні в інших країнах, через відсутність у більшості людей розуміння агента штучного інтелекту, що стоїть за ним, початкова реакція не була надто захопленою.
Лише до публікації в блозі про AI Agent Ліліан Венг, керівника прикладного дослідження штучного інтелекту OpenAI, на початку липня коло ШІ вибухнуло, ЗМІ, наукові та дослідницькі кола та сфери інвестицій почали справді обговорювати Агент штучного інтелекту з ентузіазмом.
У результаті в країні дійсно почався сплеск у дослідженні агентів ШІ, а деякі виробники почали реконструювати архітектуру продукту та бізнес-моделі на основі моделі агента ШІ.
Оскільки принципи, моделі та методи побудови AI Agent стають все більш зрозумілими, багато підприємців, які потрапили в пастку технологій, моделей, екології та навіть політики, бачать світле майбутнє.
AI Agent не тільки дозволяє кожному побачити напрямок великої мовної моделі (LLM, Large language Model), він також дозволяє більшій кількості підприємців ще більше розпалити надію на LLM підприємництво, а також дозволяє більшості підприємств побачити майбутню тенденцію ефективного застосування LLM.
Щодо підприємництва AI Agent, співзасновник OpenAI Андрій Карпаті вважає, що звичайні люди, підприємці та гіки мають більше переваг, ніж OpenAI у створенні Агентів, і всі знаходяться в стані рівної конкуренції.
З боку великих компаній, які стикаються з можливістю того, що великі технологічні компанії та стартапи скористаються можливістю агента, Білл Гейтс також сказав, що він був би розчарований, якби Microsoft не втрутилася.
Завдяки потужному просуванню технологічних гігантів, швидкому захопленню підприємців та активному впровадженню великих підприємств AI Agent став абсолютно популярним. І на відміну від попередньої ситуації, коли LLM не було реалізовано, цього разу AI Agent більше не є просто паперовою ідеєю.Багато компаній уже запустили проекти Agent і пов’язані з ними продукти.
Інсайдери галузі показали, що щонайменше 100+ проектів працюють над комерціалізації агентів ШІ, і майже 100 000 розробників створюють автономні агенти. Серед цих агентів штучного інтелекту є іноземні проекти агентів, які в основному базуються на GPT і фреймворку агентів з відкритим вихідним кодом, а також вітчизняні продукти агентів на основі внутрішніх великих моделей (великі моделі в галузях самодослідження) + архітектура з відкритим кодом.
З огляду на все це, які компанії випустили продукти Agent? Яка поточна форма продуктів AI Agent? Ця стаття нараховує 60 агентів ШІ по всьому світу, щоб дати всім краще зрозуміти агентів ШІ.
**PS: **Оскільки в цій статті розглянуто багато проектів агентів, кількість слів досягла 1W+. Рекомендуємо спочатку зібрати їх, а потім прочитати.
Почати з AI Agent
Хоча LLM має достатньо інтелекту, якщо ви хочете, щоб він давав точні відповіді, його потрібно вводити достатньо точно. Якщо майстер і звичайна людина використовують одну і ту саму велику модель, щоб задати запитання, то відповіді, які вони отримають, будуть дуже різними: перший може використовувати різноманітні техніки для отримання бажаних результатів, тоді як другий може лише дивитися на LLM і зітхати.
Якщо ви хочете добре використовувати LLM, ви повинні спочатку навчитися використовувати цей попит породив великий ринок навчання. Підказковий проект, хоча й ускладнює використання LLM, також зменшує досвід користувача. LLM, який мав би повною мірою продемонструвати переваги природної мови, через свою складність став не таким дружнім до звичайних користувачів.
Таким чином проект промптів став великою горою між звичайними людьми та великими моделями.
Як краще вирішити цю проблему? Відповідь: AI Agent (у Китаї його називають AI agent).
AI Agent — це розумна сутність, яка може сприймати середовище, приймати рішення та виконувати дії. На відміну від традиційного штучного інтелекту, агент штучного інтелекту має здатність поступово досягати поставленої мети шляхом незалежного мислення та виклику інструментів.
Після появи LLM агент AI Agent був визначений як агент, яким керує LLM для реалізації автоматизованої обробки загальних проблем.
Ми знаємо, що LLM в основному добре обробляє та генерує текст. Вони можуть відповідати на запитання, писати статті, створювати творчий контент, допомагати з програмуванням тощо. Але LLM все ще є пасивним інструментом, який створює вихідні дані лише тоді, коли ви вводите його.
Агенти штучного інтелекту надають ширший спектр можливостей, особливо щодо взаємодії з середовищем, проактивного прийняття рішень і виконання різноманітних завдань. Можна сказати, що AI Agent є ключем до справжнього розкриття потенціалу LLM. Він може надати потужні можливості дії для ядра LLM.
Основна відмінність між AI Agent і великими моделями полягає в тому, що взаємодія між великими моделями та людьми базується на реалізації. Те, чи буде користувач чітким і недвозначним, вплине на ефект відповіді великої моделі. Немає точної та ефективної відповіді, навіть найпотужнішого ChatGPT.
Для роботи AI Agent потрібно лише поставити мету, і він може мислити незалежно та діяти відповідно до поставленої мети.Він детально розбиватиме кожен крок планування відповідно до поставленого завдання, покладаючись на зворотний зв’язок із зовнішнього світу та незалежне мислення для створення для самому для досягнення мети.
Наприклад, якщо ви попросите ChatGPT купити чашку кави, відгук, наданий ChatGPT, загалом буде схожий на «Ви не можете купити каву, це просто текстовий помічник ШІ».
Але вам потрібно повідомити інструменту AI Agent на основі ChatGPT купити чашку кави. Він спочатку розбереться, як купити чашку кави для вас, і спланує кілька кроків, таких як розміщення замовлення та оплата від вашого імені. через APP, а потім виконайте ці кроки, щоб викликати APP, щоб вибрати винос. Потім зателефонуйте платіжній програмі, щоб розмістити замовлення та оплатити. Процес не вимагає від людини вказувати кожен крок операції.
Хоча і інструменти штучного інтелекту, і агенти є програмним забезпеченням, призначеним для автоматизації завдань, певні ключові характеристики відрізняють агентів штучного інтелекту від більш складного програмного забезпечення ШІ.
Якщо інструмент ШІ має такі характеристики, його можна вважати агентом ШІ:
**Автономність: **Віртуальні агенти штучного інтелекту можуть виконувати завдання самостійно без втручання або введення людини.
**Сприйняття: **Функції агента сприймають та інтерпретують своє середовище за допомогою різних датчиків (таких як камери чи мікрофони).
**Реактивність: **Агенти штучного інтелекту можуть оцінювати оточення та відповідним чином реагувати для досягнення своїх цілей.
**Міркування та прийняття рішень: **Агенти штучного інтелекту — це інтелектуальні інструменти, які можуть аналізувати дані та приймати рішення для досягнення цілей. Вони використовують методи міркування та алгоритми для обробки інформації та вжиття відповідних дій.
Навчання: вони можуть навчатися та покращувати свою продуктивність за допомогою машинних, глибоких і посилених елементів і методів навчання.
**Комунікація: **Агенти штучного інтелекту можуть спілкуватися з іншими агентами або людьми за допомогою різних методів, таких як розуміння природної мови та реагування на неї, розпізнавання мовлення та обмін текстовими повідомленнями.
Орієнтовані на ціль: Вони спрямовані на досягнення конкретних цілей, які можна заздалегідь визначити або навчитися через взаємодію з оточенням.
**З точки зору категорій, агентів штучного інтелекту наразі можна розділити на автономних агентів (Autonomous Agents) і генеративних агентів (Generative Agents). **
Автономні агенти, такі як Auto-GPT, можуть автоматично виконувати завдання та досягати очікуваних результатів на основі потреб людей за допомогою природної мови. У цій моделі співпраці автономний агент в основному обслуговує людей і більше схожий на ефективний інструмент.
Генеративні агенти, такі як місто Westworld, спільно створене дослідниками зі Стенфорда та Google, або людиноподібні роботи у «Westworld», живуть в одному середовищі, мають власні спогади та цілі, і не тільки взаємодіють з людьми, але й взаємодіють з кожним Інші взаємодії роботів.
Щодо агентів штучного інтелекту, 86-сторінковий огляд агентів на базі LLM, нещодавно опублікований командою обробки природної мови університету Фудань (FudanNLP), вичерпно підсумовує поточний стан інтелектуальних агентів на основі великомасштабних мовних моделей, включаючи: фон, склад, і застосування агентської сцени на базі LLM, а також багато обговорюваного агентства.
Сказавши стільки, багато друзів, можливо, все ще не мають інтуїтивного уявлення про агентів ШІ. Не хвилюйтеся, нижче ми використаємо порівняльний випадок, щоб поглибити ваше розуміння.
Інтелектуальні агенти проникають у різні сфери
AiAgent.app — це веб-програма, яка дозволяє користувачам створювати власних агентів ШІ для виконання певних завдань і досягнення цілей.
Нижче Wang Jiwei Channel розгляне переваги агентів ШІ через порівняльний досвід використання агентів ШІ та безпосереднього використання LLM.
Наприклад, якщо ви хочете дізнатися про новини та тенденції в галузі штучного інтелекту за минулий місяць, введіть у Claude: підсумок останніх новин і тенденцій в галузі штучного інтелекту за минулий місяць.
Отриманий результат, як показано нижче:
Як бачите, Клод перерахував лише кілька витягів новин, пов’язаних із ШІ.
Введіть цей абзац у AiAgent.app, він спочатку розіб’є ваші потреби на десять завдань, потім взаємодіє з користувачем за допомогою підказок для виконання кожного завдання та виведе результати для кожного завдання. Очевидно, що інформація про недавню індустрію штучного інтелекту, отримана в AiAgent.app, є більш повною, ніж інформація, отримана шляхом безпосереднього використання інших LLM.
Чи можливо отримати цей вміст безпосередньо за допомогою великих моделей? Теоретично його можна заповнити, ввівши більше, але його потрібно ввести не менше десяти разів, і точність введення не може бути гарантована, і іноді ви навіть не знаєте, яку інформацію хочете отримати.
У програмі AiAgent.app вам потрібно ввести лише одне речення, і вона проаналізує ваші можливі потреби та перерахує відносно вичерпні цілі контенту, направляючи вас до досягнення бажаного, і ефективність зросте в кілька разів.
Порівнюючи ці два, стає зрозуміло, що AI Agent перевершує насиченість і ефективність отримання вмісту. Цей вид агента інформаційного контенту має велике значення для медіа-практиків, галузевих аналітиків та інших професій і може значно скоротити час для отримання даних дослідження.
Зараз є деякі такі агенти, орієнтовані на точніші групи користувачів і сценарії застосування. Наприклад, GPT Researcher, запущений Колумбійським університетом, є агентом для дослідників на основі ChatGPT, який може створювати різноманітні звіти про дослідження для користувачів, щоб просувати дослідження.
У цьому випадку йдеться лише про отримання вмісту.Насправді з’явилися агенти для кількох сценаріїв додатків, яких достатньо, щоб мобілізувати більше програмних додатків і навіть апаратних пристроїв для виконання різноманітних завдань.
Наприклад, деякі люди використовували AutoGPT, щоб замовляти їжу, бронювати квитки, брати таксі та робити покупки; 25 агентів AI у місті Westworld у Стенфорді щодня гуляють, зустрічаються, спілкуються, п’ють каву та діляться новинами дня; Google Deepmind запустила використання роботизованих агентів для роботизованих рук для автоматичного виконання різноманітних завдань; Amazon також запустила Amazon Bedrock Agents для автоматичної декомпозиції завдань розробки корпоративних додатків ШІ; IBM Watson Health допомагає лікарям діагностувати, лікувати та спостерігати за пацієнтами в багатьох лікарнях.
Хоча Ai Agent не був популярним протягом тривалого часу, його підтримали багато компаній у багатьох сферах, як тільки він з'явився. Багатомодельні можливості великих мовних моделей у поєднанні з більшою сьогоднішньою обчислювальною потужністю дозволили агентам, які були запропоновані багато років тому, швидко отримати цінність і бути реалізованими в більшій кількості областей із супершвидкістю проникнення.
З появою агентів штучного інтелекту з відкритим кодом, таких як MetaGPT, більше постачальників технологій і команд підприємців запровадили агентів, і більше організацій визнали та прийняли агентів. Це неминуче швидко стане основною моделлю для впровадження LLM у різних сферах, допомагаючи тисячам галузей, щоб змінити свій бізнес Хороша програма LLM.
Перелік 60 агентів ШІ по всьому світу
AiAgent.app, згаданий у наведеному вище випадку, є одним із репрезентативних продуктів AI Agent, який набирає обертів останніми місяцями. Кілька агентів у країні та за кордоном, включно з цим агентом штучного інтелекту, можна побачити в інвентарному списку проектів нижче.
Щоб усі могли краще зрозуміти агентів штучного інтелекту, запущених на даний момент, Wang Jiwei Channel (id: jiwei1122) поділяє цих агентів штучного інтелекту на звіти ЗМІ, запущені всередині країни, галузеві, інші за кордоном і проекти GitHub. поступово винагороджувати в майбутньому Бібліотека проекту класифікує цих агентів на різні категорії.
Агенти штучного інтелекту, розглянуті в цій статті, включають як фреймворки та інструменти агентів штучного інтелекту, так і продукти AGENT на основі деяких фреймворків з відкритим кодом.В той же час більшість проектів і продуктів є автономними агентами.
Оскільки деякі виробники є відносно стриманими та не повідомляють про це зовнішньому світу, агенти штучного інтелекту, перелічені в цій статті, не є повними, тому їх також називають неповним списком агентів штучного інтелекту. Більше виробників і підприємців можуть зв’язатися з каналом Wang Jiwei після прочитання цієї статті, і ми всі зможемо зробити свій внесок у процвітання та розвиток екосистеми AI AGENT.
Агент ШІ повідомляє ЗМІ
1、Auto-GPT
Auto GPT — це безкоштовний проект із відкритим кодом на Github, який поєднує технології GPT-4 і GPT-3.5 для створення повних проектів за допомогою API.
На відміну від ChatGPT, користувачам не потрібно постійно задавати питання штучному інтелекту, щоб отримати відповідні відповіді. В AutoGPT їм потрібно лише надати йому ім’я штучного інтелекту, опис і п’ять цілей, після чого AutoGPT зможе завершити проект самостійно. . Він може читати та записувати файли, переглядати веб-сторінки, переглядати результати власних підказок і поєднувати їх із згаданою історією підказок.
Auto-GPT є одним із перших прикладів повністю автономної роботи GPT-4, що розширює межі можливостей штучного інтелекту.
2、AgentGPT
AgentGPT дозволяє налаштовувати та розгортати автономні агенти ШІ. Просто назвіть свій спеціальний штучний інтелект і скажіть йому розпочати будь-яку мету, яку можна собі уявити, і він спробує її досягти, думаючи про завдання, яке потрібно виконати, виконуючи завдання та навчаючись на результатах.
3、Baby AGI
Це система керування завданнями, керована ШІ. Система використовує OpenAI і Pinecone API для створення, визначення пріоритетів і виконання завдань. Створюйте завдання, аналізуючи результати попередніх завдань і попередньо визначені цілі, а також використовуйте обробку природної мови OpenAI (NLP) і Chroma, щоб зберігати й отримувати результати завдань у контексті.
Привабливість Baby AGI полягає в його здатності автономно вирішувати завдання та підтримувати заздалегідь визначені цілі на основі результатів попередніх завдань, а також ефективно розставляти пріоритети завдань.
4、Джарвіс (HuggingGPT)
Унікальна система співпраці, розроблена Microsoft, яка може використовувати кілька моделей штучного інтелекту для виконання певного завдання, а ChatGPT виконує роль контролера завдань. Проект, відомий як JARVIS на GitHub, тепер доступний для випробування на Huggingface (отже, HuggingGPT), агенті, який надзвичайно добре працює з текстом, зображеннями, аудіо та навіть відео.
Те, як це працює, схоже на те, як OpenAI демонструє мультимодальні можливості GPT 4 за допомогою тексту та зображень, але JARVIS йде далі та інтегрує різні LLM з відкритим кодом для зображень, відео, аудіо тощо, а також може підключатися до Інтернет і доступ до файлів. Наприклад, ви можете ввести URL-адресу веб-сайту та поставити запитання щодо нього.
5、Aiagent.app
Ai Agent — це веб-додаток, який дозволяє користувачам створювати власні агенти AI для виконання певних завдань і досягнення цілей. Агенти ШІ працюють, розбиваючи цілі на менші завдання та виконуючи їх одне за іншим. Переваги включають можливість запускати кілька агентів штучного інтелекту одночасно та демократизацію доступу до передових технологій.
AI Agent також може похвалитися такими функціями, як вбудовані блоки коду з підсвічуванням синтаксису та безперебійну співпрацю зі сторонніми платформами. Інструмент є безкоштовним для використання та забезпечує спрощений спосіб створення агентів ШІ, не вимагаючи додаткових технічних знань.
6、CamelAGI
Camel AGI — це генеративний інструмент штучного інтелекту, який дозволяє користувачам вирішувати поставлені завдання за допомогою рольових автономних агентів штучного інтелекту. Звичайно, користувачам потрібно ввімкнути Java, щоб використовувати цей інструмент. Camel AGI дозволяє користувачам виконувати завдання за допомогою агентів штучного інтелекту та надає можливість увійти за допомогою Google або позначити інструмент зірочкою на Github.
7. Симуляція "Westworld" Westworld town
Для цього проекту дослідники зі Стенфордського університету та Google створили інтерактивне середовище пісочниці, що містить 25 генеративних агентів ШІ, які можуть симулювати поведінку людини. Вони гуляли в парку, пили каву в кафе і ділилися новинами з колегами, демонструючи напрочуд хорошу соціальну поведінку.
Наприклад, починаючи з визначеної користувачем концепції, згідно з якою агент хоче влаштувати вечірку до Дня Святого Валентина, агент автоматично розсилає запрошення на вечірку протягом наступних двох днів, заводить нових друзів, запрошує один одного на побачення та вечірки та координує події у потрібний час Час з’являтися на вечірках разом.
8、Інженер GPT
GPT-Engineer — це інструмент штучного інтелекту з відкритим кодом, який дозволяє користувачам визначати, що вони хочуть створити, а потім проводити роз’яснювальну розмову зі штучним інтелектом, щоб створити необхідну кодову базу. Інструмент створено для забезпечення простого та гнучкого взаємодії з користувачем, дозволяючи користувачам адаптувати та розширювати його функціональність відповідно до своїх потреб.
Інструмент включає такі функції, як визначення ідентифікатора агента AI, збереження історії зв’язку з GPT4 і повторний запуск журналів повідомлень. Внески до проекту вітаються, і зацікавлені особи можуть звернутися до дорожньої карти, проектів і питань, доступних у сховищі GitHub. GPT-Engineer прагне бути відкритою платформою для розробників, щоб досліджувати та створювати свій інструментарій для генерації коду.
9、MetaGPT
MetaGPT, запущений корпорацією Meta, — це багатоагентна структура, яка використовує однорядковий вхід для створення API, історій користувачів, структур даних, конкурентного аналізу тощо. Цей фреймворк може служити менеджерам з продуктів, інженерам програмного забезпечення та архітекторам. Фреймворк може діяти як ціла компанія-розробник програмного забезпечення, організовуючи СОП за допомогою лише одного рядка коду.
MetaGPT інтегровано з проектуванням процесу людини SOP. Таким чином, агенти на базі LLM створюють високоякісні, різноманітні, структуровані документи та проекти. MetaGPT розроблено, щоб полегшити розробку рішень для складних завдань і забезпечити можливості вирішення проблем, які можна порівняти з людським інтелектом.
10、Amazon Bedrock Agents
Amazon Bedrock Agents, випущені Amazon, дозволяють розробникам швидко створювати повністю керовані агенти. Виконуючи виклики API до корпоративних систем, агенти Amazon Bedrock прискорюють випуск генеративних додатків ШІ, які керують і виконують дії.
Агенти Amazon Bedrock спрощують швидку розробку та оркестровку завдань із запитами користувачів. Після налаштування ці агенти можуть автономно створювати підказки та безпечно покращувати їх за допомогою даних компанії, щоб надавати користувачам відповіді природною мовою. Ці розширені агенти мають здатність визначати необхідні дії для автоматичної обробки запитів користувачів.
11、nvidia Voyager
Voyager, спільно запущений NVIDIA, Каліфорнійським технологічним інститутом та іншими, використовує GPT-4 для навчання агентів Minecraft у світі пікселів. Слід зазначити, що Voyager покладається на генерацію коду, а не на навчання з підкріпленням.
Voyager — перший агент, який навчається протягом усього життя, який грає в Minecraft. На відміну від інших агентів Minecraft, які використовують класичні методи навчання з підкріпленням, Voyager використовує GPT-4 для постійного самовдосконалення. Він робить це шляхом написання, вдосконалення та передачі коду, що зберігається у зовнішній бібліотеці навичок.
Результатом цього є невеликі програми, які допомагають у навігації, відкриванні дверей, видобутку ресурсів, створенні кирки або боротьбі із зомбі. GPT-4 відкриває нову парадигму, у якій «навчання» — це виконання коду, а «навчальні моделі» — це база коду навичок, яку Voyager ітеративно збирає.
12、RoboAgent
Спільній дослідницькій групі Meta та CMU знадобилося два роки, щоб успішно розробити універсального робота-агента RoboAgent. РобоАгент отримав 12 різних складних навичок за допомогою навчання лише з 7500 траєкторіями, включаючи випікання, збирання предметів, подачу чаю, прибирання кухні та інші завдання, і їх можна узагальнити та застосувати в 100 невідомих сценаріях.
RoboAgent виконує завдання незалежно від того, скільки перешкод він стикається. Метою цього дослідження є створення ефективної парадигми навчання роботів, яка вирішує проблеми різноманітності наборів даних і сцен. Дослідники запропонували архітектуру Multi-Task Action Blocking Transformer (MT-ACT) для обробки мультимодальних багатозадачних наборів даних роботів за допомогою семантичного вдосконалення та ефективного представлення політики.
13、Inflection AI Pi
Основним мозком персонального продукту AI Agent Pi, запущеного компанією Inflection AI, є велика модель Inflection-1, розроблена компанією, і її продуктивність порівнянна з GPT-3.5. На відміну від популярних чат-ботів загального призначення, Pi може лише вести дружні розмови, давати стислі поради чи навіть просто слухати.
Його основними характеристиками є співчуття, скромність, цікавість, гумор та новаторство, а також хороший емоційний інтелект. Він може надати необмежену кількість знань і спілкування відповідно до унікальних інтересів і потреб користувачів. Оскільки Inflection розробила Pi, було визначено, що Pi буде служити особистим інтелектом (Personal Intelligence), а не просто інструментом для допомоги людям у їхній роботі.
14、HyperWrite
Hyperwrite — це інструмент для написання AI, який допомагає творчим авторам будь-якого рівня писати швидше та впевненіше. Він містить такі функції, як автоматичний запис і введення наперед, щоб генерувати оригінальні абзаци та пропонувати ідеї для подолання блоку автора.
Інструмент доступний як безкоштовне розширення Chrome і може використовуватися на будь-якому веб-сайті, не перериваючи робочий процес. Його використовують і довіряють професіонали, студенти та творці в усьому світі для підвищення продуктивності.
15、GPT дослідник
GPT Researcher — це автономний агент на основі штучного інтелекту, який використовується для проведення всебічних онлайн-досліджень для різноманітних завдань. Натхненний AutoGPT і підказкою «Плануйте та вирішуйте», цей інструмент має на меті покращити проблеми швидкості та детермінізму, виявлені в поточних мовних моделях, «забезпечуючи стабільнішу продуктивність і вищі швидкості завдяки роботі в паралельних агентах, а не в синхронній роботі».
За словами команди, дослідники GPT полегшують дослідження, генеруючи релевантні дослідницькі запитання, збираючи дані з понад 20 веб-джерел і використовуючи GPT3.5-turbo-16 і GPT-4 для створення комплексних звітів про дослідження.
AI Agent запущено в Китаї
Після безперервних досліджень і експериментів також почали з’являтися вітчизняні продукти, пов’язані зі штучним інтелектом. Ось п’ять продуктів.
1. Alibaba Cloud ModelScopeGPT
Спільнота Alibaba Cloud Mota запустила перший у Китаї інструмент виклику великомасштабних моделей ModelScopeGPT. За допомогою цього інструменту користувачі можуть викликати інші моделі штучного інтелекту в спільноті Mota, надсилаючи інструкції одним клацанням миші, таким чином реалізуючи великі та малі програми. Моделі працюють разом. виконувати складні завдання.
ModelScopeGPT базується на фреймворку розробки ModelScope-Agent з відкритим вихідним кодом великої мовної моделі (LLM) AI Agent (агента). Це загальна настроювана структура агента для практичних застосувань. Вона базується на великих мовних моделях (LLM) із відкритим кодом як ядрі та включає такі модулі, як керування пам’яттю та використання інструментів.
LLM з відкритим вихідним кодом головним чином відповідає за планування завдань, планування та генерацію відповідей; модуль керування пам’яттю в основному включає пошук знань і керування (за словами підказки); модуль використання інструментів включає бібліотеку інструментів, пошук інструментів і налаштування інструментів.
2. Дійсно інтелектуальний TARS-RPA-Agent
TARS-RPA-Agent, запущений Real Intelligence у сфері гіперавтоматизації, є гіперавтоматичним агентом на основі подвійного механізму «TARS+ISSUT (Intelligent Screen Semantic Understanding)» із «мозком» і « очі, руки та ноги". Це новий продукт моделі RPA, який може автономно розбирати завдання, сприймати поточне середовище, виконувати та надавати зворотній зв’язок, а також пам’ятати історичний досвід.
TARS-RPA-Agent приймає технічну структуру, засновану на великій моделі TARS і семантичному розумінні розумного екрана ISSUT. Технічна структура поділена на два рівні: нижній рівень – це серія великих моделей TARS, включаючи загальні базові моделі та базові моделі різних вертикальних галузей промисловості, а також технологію розуміння семантики розумного екрана; верхній рівень – це надвелика модель, яка спирається на ці дві ключові технології для завершення комплексних оновлень і перетворень Продукти автоматизації.
Основним LLM TARS-RPA-Agent є власно розроблена вертикальна модель TARS Real Intelligence, заснована на загальній великій базі моделей. Велика модель TARS має чудові основні функції, такі як генерація тексту, розуміння мови, запитання та відповіді на знання, і логічне міркування.здатність.
3. Інтелектуальний агент OmBot Ohm
На Всесвітній конференції зі штучного інтелекту 2023 року компанія Lianhui Technology випустила OmBot, автономного агента (Auto AI Agent), заснованого на можливостях великої моделі, і запустила першу партію програм для типових вимог сцени.
Автономний агент Lianhui містить чотири основні можливості: пізнання, пам’ять, мислення та дії. Як автоматичний і автономний агент, він працює в циклі в найпростішій формі. На кожній ітерації вони генерують самокеровані інструкції та операції. Таким чином, він не покладається на те, щоб люди керували командами, і має високу масштабованість.
4. Lanma Technology Ask XBot
Агентська платформа "Ask XBot", створена компанією Lanma Technology, розділена на два рівні: перший рівень - це розширення можливостей експертів. Експерти визначають робочі процеси та навчають їх машинам за допомогою перетягування, скидання, перетягування та діалогової взаємодії, тим самим допомагаючи співробітникам на передовій лінії будувати Методологія для більш ефективної роботи; другий рівень — для співробітників, які використовують Агент. Співробітники на передовій лінії можуть спілкуватися з Агентом природною мовою та видавати інструкції, що дозволяє Агенту допомагати в аналізі даних, пошуку інформації та інших завданнях.
Компанія планує створити Ask. Клієнти можуть обслуговуватися більш ефективно та інтелектуально на платформі.
5, ChatDev
ChatDev, запущений спільною дослідницькою групою Університету Цінхуа, Пекінського університету пошти та телекомунікацій та Університету Брауна, є генеративним агентом. Це наскрізна основа розробки програмного забезпечення на основі чату, яка використовує великі мовні моделі (LLM) для сприяння ефективній комунікації та співпраці між багатьма учасниками ("gpt3.5-turbo-16k" версія ChatGPT) у процесі розробки програмного забезпечення. .
Основною метою ChatDev є розробка ігор через чат. Користувачам потрібно лише пропонувати ідеї, і весь процес від проектування до тестування виконується ШІ, і весь процес займає лише сім хвилин.
Продукти AI Agent для різних сфер
До появи LLM деякі компанії вже вивчали поєднання традиційного штучного інтелекту та агента. Тому впровадження AI Agentmt у різних сферах відбувається набагато швидше, ніж усі очікували.
Нижче наведено репрезентативні прикладні програми агентів у кількох галузях промисловості.
У сфері медицини агенти можуть допомогти діагностувати, лікувати та спостерігати за пацієнтами. IBM Watson Health — це агент ШІ, який аналізує медичні дані, щоб виявити потенційні проблеми зі здоров’ям і рекомендувати варіанти лікування.
У фінансовій сфері Агенти можуть аналізувати фінансові дані, виявляти шахрайство та давати інвестиційні рекомендації. Чарльз Шваб використовує агента штучного інтелекту під назвою Intelligent Portfolio для створення та управління інвестиційними портфелями на основі інвестиційних цілей клієнтів.
У роздрібних бізнес-сценаріях Агенти можуть надавати персоналізовані рекомендації, покращувати управління ланцюгом постачання та покращувати взаємодію з клієнтами. Alexa від Amazon — це агент ШІ, який може рекомендувати продукти, розміщувати замовлення та відстежувати відправлення.
На виробництві агент може оптимізувати виробничі процеси, передбачити потреби в обслуговуванні та покращити якість продукції. General Electric використовує агент штучного інтелекту під назвою Predix для моніторингу машин у режимі реального часу, щоб прогнозувати та запобігати збоям обладнання.
У сфері транспорту автономні агенти штучного інтелекту можуть допомогти з плануванням маршруту, керуванням дорожнім рухом і безпекою транспортних засобів. Автопілот від Tesla допомагає безпілотним транспортним засобам і водіям паркуватися, змінювати смуги руху та безпечно їздити.
В освітній індустрії Agnet може надавати персоналізований досвід навчання, автоматизувати адміністративні завдання та аналізувати успішність студентів. Агент зі штучного інтелекту Pearson Aida може надати учням зворотний зв’язок і запропонувати персоналізовані шляхи навчання.
У сільському господарстві агенти ШІ можуть оптимізувати виробництво сільськогосподарських культур, контролювати якість ґрунту та прогнозувати погодні умови. John Deere використовує агент штучного інтелекту під назвою See&Spray для виявлення та локалізації бур’янів, не впливаючи на посіви.
Інші продукти AGENT були запущені за кордоном
1、Cognosis
Cognosys — це веб-агент штучного інтелекту, створений для революції в продуктивності та спрощення складних завдань за допомогою найсучаснішої технології штучного інтелекту, щоб покращити ваше повсякденне життя.
2、Doanythingmachine
Легко керуйте своїми завданнями за допомогою універсальної машини, де персональний агент ШІ користувача розставлятиме пріоритети та виконуватиме ваші завдання за вас
3、alphakit
Інтуїтивно зрозуміла платформа для створення та керування командами цілеспрямованих автономних агентів штучного інтелекту з вашого телефону. Створюйте команди агентів autoGPT AI і керуйте ними. Просто визначте свої цілі, а про все інше подбає Alphakit.
4、GPTConsole
GPTConsole — це революційний інтерфейс командного рядка (CLI), розроблений, щоб надати розробникам переваги штучного інтелекту. Це виходить за рамки традиційних функцій терміналу, дозволяючи користувачам виконувати складні завдання за допомогою підказок.
5、Покриття
Перетворіть свою базу знань у чат AI за 2 хвилини, надавши посилання на базу знань. Fini надає користувачам невтомного агента штучного інтелекту, готового негайно відповідати на запитання клієнтів 24/7.
6、Заклинання
Spell — це автономний агент ШІ на основі GPT4, який можна застосовувати для щоденної ефективної роботи. Spell також має такі необхідні функції, які допоможуть вам працювати розумніше та навчитися використовувати потужність генеративного штучного інтелекту для створення одного або кількох інноваційних автономних агентів, які працюватимуть над вирішенням ваших проблем.
7、Aomni
Aomni — це інформаційно-пошуковий агент штучного інтелекту, який може знаходити, витягувати й обробляти будь-які дані в Інтернеті за вас, покращуючи вашу дослідницьку роботу. Aomni може використовувати різноманітні інструменти для розумного планування ваших запитів для отримання кінцевих результатів, включаючи повноцінний веб-браузер, який дозволяє отримати доступ до будь-якої інформації в Інтернеті без потреби в API.
Планувальник запитів Aomni базується на поточній найсучаснішій архітектурі AutoGPT, інтелектуально плануючи та оновлюючи кожен запит, щоб забезпечити коректність джерела та різноманітність.
8、Fine-Tuner.ai
За допомогою Fine-Tuner.ai користувачі можуть створювати складні спеціалізовані агенти штучного інтелекту без технічних навичок або кодування, просто вводячи свої дані та ідеї. Понад дюжина професійних агентів штучного інтелекту можуть створювати точні запитання та відповіді, шукати документи, автоматизувати процеси тощо для користувачів за допомогою завантажених даних у реальному часі, таких як PDF, CV, PPT та URL.
9、SuperAGI
Фреймворк автономного штучного інтелекту з відкритим кодом, який дає змогу швидко й надійно розробляти й розгортати корисні автономні агенти, а також інфраструктуру для створення, керування та запуску автономних агентів.
10、Yellow.ai
Yellow.ai — це провідна розмовна платформа штучного інтелекту корпоративного рівня, яка підтримує динамічні агенти штучного інтелекту на підприємстві, розроблена для забезпечення людської взаємодії через платформу без коду/з низьким кодом, щоб підвищити задоволеність клієнтів і залучити співробітників.
11、Godmode
Дозволяє користувачам запускати AutoGPT у браузері. Godmode дозволяє користувачам розгортати кілька агентів штучного інтелекту одночасно для виконання завдань за допомогою штучного інтелекту, а також користувачі можуть використовувати власні ключі OpenAI API.
12、E42
E42 — це платформа автоматизації когнітивних процесів, яка дозволяє підприємствам створювати багатофункціональні когнітивні агенти для автоматизації різних процесів у різних функціях. Когнітивна платформа без коду плавно інтегрується з існуючими технологіями та процесами користувачів, щоб розблокувати найвищу цінність у відділах. Користувачі можуть використовувати E42 для створення власних агентів штучного інтелекту, таких як аналітики штучного інтелекту та рекрутери штучного інтелекту у вертикальних галузях.
13、Дякую
Агенти зі штучним інтелектом Thankful навчені та налаштовані на роботу у вашій існуючій службі підтримки, легко вирішуючи великі запити клієнтів через електронну пошту, чат, SMS і канали в програмі. Маючи здатність розуміти, підключатися, вирішувати, персоналізувати та інформувати, агенти ThankfulAI надають послуги, схожі на людину, із машинною швидкістю та властивими масштабованими знаннями.
14、Aktify
Використовуйте віртуальних агентів штучного інтелекту Aktify, щоб клонувати свою команду продажів без збільшення кількості персоналу. Aktify оброблятиме необмежену кількість потенційних клієнтів, які не відповідають на запити) і постійно залучатиме клієнтів, готових поговорити з вашою командою продажів, це більше, ніж просто SMS-чат-бот.
15、TeamSmart AI
Підвищте свою продуктивність за допомогою доступу до TeamSmart AI в один клік. Збирайте вміст, створюйте код, створюйте чернетки твітів тощо прямо у вашому браузері. ChatGPT миттєво відкривається одним натисканням значка або комбінації клавіш, надаючи миттєвий доступ до бібліотеки якісних порад без входу в систему.
16、BrainstormGPT
BrainstormGPT інтегрує кілька агентів, LLM і автоматичний пошук, щоб спростити перетворення звіту про зустріч. Спеціальні теми, визначені користувачами ролі, автономні обговорення агентами та вихід звітів протягом 20 хвилин приблизно еквівалентні 300 пошукам, 10 годинам обговорень і 100 000 аналізів тексту.
17、AgentRunner.Ai
AgentRunner.ai — це автономний інструмент для створення агентів ШІ, який використовує потужність GPT-4 для створення та навчання повністю автономних агентів. Дозволяє користувачам встановлювати цілі для своїх агентів і дозволяти їм вирішувати, як досягти цих цілей без будь-яких технічних знань або навичок програмування.
Інструмент пропонує такі функції, як створення автономних агентів з унікальними характеристиками, запуск агента для виконання завдань або навчання новим навичкам, визначення того, що може робити агент, і інтеграція з обліковими записами OpenAI або Google Cloud.
18、Залишся
Gista допомагає компаніям взаємодіяти з відвідувачами веб-сайту та перетворювати їх на потенційних клієнтів цілодобово та без вихідних, а її основні функції включають створення агентів конверсії AI та агентів продажу AI. Використовуючи Gista, підприємства можуть легко перетворювати відвідувачів веб-сайту на потенційних клієнтів і створювати списки розсилки.
19、Агент4
Однією з ключових особливостей Agent4 є можливість створювати віртуальних агентів на основі штучного інтелекту, які можуть відповідати на запитання, допомагати бронювати зустрічі, прослуховувати голосову пошту та надавати підсумки.
Ви можете легко створювати індивідуальні взаємодії для агентів, дозволяючи їм відповідати на запитання та виконувати різноманітні завдання голосом вашого бренду. Ви також можете вибрати, як агенти відповідатимуть на дзвінки в режимі реального часу, і вирішити, чи потрібно вам з кимось поговорити і коли.
20、Cometcore AI
Cometcore AI — це інноваційна платформа, яка надає універсальний набір інструментів на основі штучного інтелекту для підвищення продуктивності та спілкування. За допомогою Cometcore ви можете створювати, кодувати та автоматизувати милих агентів.
21、персональний помічник
Агент зі штучним інтелектом, створений для виконання будь-яких завдань: від бронювання авіаквитків до проведення поглиблених досліджень і всього іншого.
Проект AI Agent на Github
1、OpenAGI
OpenAGI — це дослідницька платформа AGI з відкритим вихідним кодом, спеціально розроблена для виконання складних багатоетапних завдань, що супроводжуються спеціальними наборами даних, показниками оцінки та різними масштабованими моделями. OpenAGI формулює складні завдання як запити природною мовою як вхідні дані для LLM. Після цього LLM вибирає, синтезує та виконує моделі, надані OpenAGI для вирішення завдання.
Проект також запропонував механізм підсилення навчання із зворотним зв’язком завдань (RLTF), який використовує результати розв’язання завдань як зворотний зв’язок для покращення можливостей вирішення завдань LLM. LLM відповідає за синтез різних зовнішніх моделей для вирішення складних завдань, тоді як RLTF забезпечує зворотний зв’язок для покращення своїх можливостей вирішення завдань, забезпечуючи цикл зворотного зв’язку для самовдосконалення ШІ. Парадигма LLM, що використовує різні експертні моделі для вирішення складних завдань, є перспективним підходом до AGI.
2、Агент-LLM
Agent-LLM — це платформа автоматизації штучного інтелекту, розроблена для ефективного керування інструкціями штучного інтелекту в кількох постачальників.
Агент оснащено адаптивною пам’яттю, і це універсальне рішення пропонує потужну систему плагінів, яка підтримує різноманітні команди, включаючи веб-перегляд. Завдяки зростаючій підтримці численних постачальників і моделей штучного інтелекту Agent-LLM продовжує розвиватися, щоб покращити різноманітні додатки.
3、AutoGPT-Next-Web
Цей агент може одним клацанням миші розгорнути добре розроблений веб-інтерфейс AutoGPT-Next-Web на Vercel і одним клацанням безкоштовно розгорнути вашу приватну веб-програму AutoGPT-Next-Web. На основі AutoGPT-Next-Web користувачі можуть використовувати Vercel для безкоштовного розгортання одним клацанням миші та створення персонального веб-сайту AutoGPT за 1 хвилину.
4、MiniGPT-4
Цей агент може використовувати передові великі мовні моделі для покращення візуального розуміння мови.
5、Mini-AGI
Mini-AGI — це найменший автономний агент загального призначення на основі GPT3.5/4. Він поєднує в собі потужні підказки, мінімальний набір інструментів і короткочасну пам’ять (ланцюжок думок) із доповненням даних через векторне сховище, яке незабаром буде додано, щоб аналізувати курс акцій, виконувати тести кібербезпеки, створювати мистецтво та замовляти піцу.
6、Teenage-AGI
Натхненний кількома проектами, пов’язаними з Auto-GPT (головним чином BabyAGI) і документом «Generative Agents: Interactive Simulation of Human Behavior», цей проект Python використовує OpenAI та Pinecone, щоб забезпечити пам’ять для агента AI та дозволити йому «подумати» перед тим, як діяти. (виведення тексту).
7、FastGPT
FastGPT — це система запитань і відповідей на базі знань, заснована на великій мовній моделі LLM, яка забезпечує готову обробку даних, виклик моделі та інші можливості. У той же час робочий процес можна оркеструвати за допомогою візуалізації потоку для реалізації складних сценаріїв питань і відповідей.
8、DemoGPT
За допомогою DemoGPT ви можете швидко створити демонстрацію, використовуючи лише прості речення.
9、LocalAGI
Локальний запуск проектів AGI на основі LLMDA, ChatGLM та інших моделей.
10. ai-town (категорія гри)
Місто зі штучним інтелектом з відкритим кодом відомої інвестиційної установи a16z — це ліцензований Массачусетським технологічним інститутом стартовий набір для створення та налаштування власної версії міста зі штучним інтелектом. Це віртуальне місто, де живуть, спілкуються та спілкуються персонажі ШІ.
11, gptrpg (категорія гри)
gptrpg Цей репозиторій містить дві речі: просте середовище, подібне до RPG, для агента штучного інтелекту з підтримкою LLM і простого агента штучного інтелекту, який підключається до API OpenAI для існування в цьому середовищі.
12. SFighterAI (Категорія ігор)
Проект — це агент штучного інтелекту, навчений за допомогою глибокого підкріплення, щоб перемогти фінального боса в грі Street Fighter II: Special Champion Edition. Агент AI приймає рішення виключно на основі значень пікселів RGB ігрового екрана. У наданому стані збереження агент досягає 100% виграшу в першому раунді останнього рівня.