10 репрезентативных AI-агентов, как изменится Интернет / перекроят Web3

2023-08-03 03:04:30

ИСТОЧНИК: ВИОН УИЛЬЯМС

Исследуйте инновационные возможности ИИ-агентов

Консенсус и неконсенсус AI-агентов

Причина, по которой ИИ-агенты стали направлением, привлекающим все больше и больше внимания, во многом связана с тем, что LLM обеспечивает выполнимый путь технической реализации для применения ИИ-агентов, а во-вторых, существует множество проектов, связанных с ИИ-агентами. , запереть.

Хотя ЛиЛиан Венг определяет, что такое ИИ-агенты, управляемые LLM, в своей статье? Но Deepmind также пытается определить концепцию единого агента.Я считаю, что концепция ИИ-агентов также будет формировать различные типы дифференциации с пониманием разных компаний ИИ.

Более четкий ключевой консенсус заключается в том, что на основе агентов, управляемых LLM, для реализации автоматической обработки общих проблем, это агенты ИИ, которые мы идентифицировали в этом крупномасштабном цикле взрыва языковой модели и сформировали общее понимание.

Найти возможность по соотношению агентов

На уровне применения ИИ-агентов, на текущем этапе, мы должны смотреть на ИИ-агентов с точки зрения максимально «актуальности», то есть мы должны быть терпимы к пробам и ошибкам и новаторским в возможных формах. ИИ-агентов.Возможность**, вы не должны искать стандартный ответ в узкой позиции, как некоторые критики, это не рекомендуется.

Например, Auto-GTP, как возможность, на самом деле вдохновил многие проекты Agents, но узкая критика лишится возможности зафиксировать новые возможности, что является обычным явлением среди китайских разработчиков. Как разработчик без творчества, как вы будете полагаться на свою традиционную конкурентоспособность в эпоху программирования на естественном языке?

Хотя есть много представлений о проектах, связанных с ИИ-агентами, я думаю, что существует проблема однородного списка и введения.Это содержание позволяет нам узнать, какие проекты относятся к направлению ИИ-агентов, но нет связанных, начиная с природы, он показывает потенциал ИИ-агентов в различных областях применения и экологическое положение определенных типов проектов ИИ-агентов.

Например, во введении Auto-GPT, BabayAGI и MetaGPT будут отнесены мной к одному типу экологии, потому что они имеют преемственность определенного пути;

Построение целостного познания в головоломке агентов

В целом, при представлении репрезентативных проектов об ИИ-агентах ** я использовал точки зрения «актуальности», «экологической позиции» и «преемственности» **, чтобы представить репрезентативные проекты, чтобы мы могли смутно видеть будущее развитие. тенденция AI-агентов.

Появляются следующие 10 репрезентативных связанных проектов, в том числе несколько связанных справочных проектов.Я буду использовать случай как головоломку, чтобы собрать воедино относительно полную карту, которой достаточно, чтобы больше людей ясно осознали, как потенциал агентов может изменить все в Интернете. , Включая изменение ландшафта Web3.

Два основных будущих направления AI-агентов

ИИ-агентов можно условно разделить на два направления: **автономные агенты и генеративные агенты. **

Автономные агенты берут в качестве примера Auto-GPT, который представляет собой возможность автоматического выполнения различных задач для достижения целевых результатов посредством описания требований на естественном языке.В этих отношениях сотрудничества автономные агенты обслуживают людей и имеют четкие атрибуты инструмента;

Генеративные агенты берут в качестве примера виртуальный город из 25 интеллектуальных агентов, опубликованный Стэнфордом.Генеративные агенты, как ИИ-агенты с личностноподобными характеристиками, способностью к автономному принятию решений и долговременной памятью, более склонны к концепции "Родность". В этом сотрудничестве В отношениях Агенты имеют цифровые социальные отношения, а не просто инструменты для обслуживания людей;

Авто-GPT

Один из самых известных проектов с открытым исходным кодом Auto-GPT, его представление на GitHub очень простое: «Экспериментальная попытка с открытым исходным кодом сделать GPT-4 полностью автономным», экспериментальная попытка с открытым исходным кодом сделать GPT-4 полностью автономным. автономный .

Вкратце можно сказать, что Auto-GTP может полностью автоматизировать окончательный результат задачи с помощью требования задачи из одного предложения; основная логика способности Auto-GPT выполнять задачи независимо заключается в способности планирования задач языковой модели через задачу Carry выполнять пошаговую разборку и анализ, а также автоматически улучшать этапы выполнения задачи, при этом результаты поиска в Интернете будут возвращаться в языковую модель, а задача будет далее дизассемблироваться и выполняться.

Используя популярный народный язык в качестве метафоры, **Auto-GPT выполнил задачу в процессе «само-вопрошания и самоответа», без необходимости, чтобы люди предоставляли подсказки. **

Хотя многие критикуют Auto-GPT за огромное потребление токенов и отсутствие стабильных результатов, Auto-GTP, как случай автоматизации на основе LLM, сильно пробудил любопытство разработчиков. находятся в авангарде экспериментов с проектами с открытым исходным кодом для изучения автоматизации.

адрес проекта:

**BabyAGI может автоматически создавать, сортировать и выполнять новые задачи на основе результатов предыдущих задач и наших заданных целей. ** Он использует технологию обработки естественного языка для создания новых задач на основе целей и сохранения результатов задачи в базе данных, чтобы при необходимости можно было найти соответствующую информацию.

На самом деле BabyAGI — это скрипт Python, который запускает бесконечный цикл для выполнения следующих шагов:

Получить первую задачу из списка задач.
Отправьте задачу исполняющему агенту, и исполняющий агент использует API OpenAI для выполнения задачи в соответствии с контекстом.
Обогатите результат и сохраните его в Chroma/Weaviate.
Создавайте новые задачи и переупорядочивайте списки задач на основе заданных целей и результатов предыдущих задач.

адрес проекта:

И Auto-GPT, и BabyAGI теоретически представляют собой начальный период нашей текущей вспышки LLM.Наше исследование AGI на основе LLM и процессора для решения задач общего назначения, управляемого LLM, я думаю, является Святым Граалем в области ИИ. Агенты в будущем.

Генеративные агенты

Статья «Генеративные агенты: интерактивные симулякры человеческого поведения», опубликованная исследователями из Стэнфорда и Google, уже является очень известным проектом AI-Agent.В целом, это исследование поместило 25 агентов ИИ в виртуальную маленькую в пиксельном стиле. , интеллектуальные агенты могут реализовать смоделированное взаимодействие жизненного поведения человека, а также могут взаимодействовать с окружающей средой виртуального города, а также могут взаимодействовать с людьми за пределами виртуального мира. **

В этой статье есть два ключевых решения, наиболее достойных нашего внимания:

1, Архитектура генеративного агента

Агенты воспринимают свое окружение и сохраняют все восприятия в комплексной записи, называемой потоком памяти, записывая опыт агента. Основываясь на их восприятии, архитектура извлекает соответствующие воспоминания, а затем использует эти извлеченные модели поведения для определения действия. Эти извлеченные воспоминания также используются для формирования долгосрочных планов и создания отражений более высокого уровня, оба из которых загружаются в поток памяти для будущего использования.

2, поток памяти

Основываясь на архитектуре генеративного агента и интерактивной среде, в которой находится эксперимент, агент неизбежно будет генерировать большой объем данных памяти.Memory Stream — это база данных, которая всесторонне записывает все воспоминания генеративного агента. Это список, содержащий несколько объектов памяти, каждый объект содержит описание на естественном языке, отметку времени создания и отметку времени последнего доступа. Самым основным элементом потока памяти является наблюдение, которое представляет собой событие, непосредственно воспринимаемое агентом. Общие наблюдения включают действия, выполняемые самим агентом, или действия, которые агент воспринимает как выполняемые другими агентами или неагентскими объектами.

Фактически, исходя из двух вышеуказанных ключевых компонентов, общее поведение генеративного агента делится на три части: [память и извлечение] [отражение] [планирование и ответ]. Для получения подробной информации см. Содержание оригинальной статьи. .

Эта статья и этот эксперимент подтвердили, что интерактивному поведению, генерируемому агентом, сформированным на основе LLM, можно доверять для моделирования поведения человеческого взаимодействия в цифровой среде.Генеративный агент может играть роль во многих цифровых средах, особенно в сгенерированных. отношения взаимодействия человека с компьютером, сформированные между человеческими агентами и людьми.

Интуитивно мы можем чувствовать, что генеративный агент создан как роль местного цифрового резидента метавселенной и производит различные взаимодействия с окружающей средой человеческой метавселенной. На самом деле, Мы можем моделировать высокоразвитый цифровой виртуальный мир ИИ-агентов, а люди могут извлекать из этого мира цифровые результаты труда ИИ-агентов;

Как агенты становятся рабочими партнерами

Поскольку на этот раз агенты переводятся как «агенты» во многих контекстах, агенты легко ассоциируются с ролевой концепцией посредника, что затрудняет для многих людей интуитивное установление связи с применением агентов в сцене; в этих трех случаях, соответственно Он показывает, как агенты могут стать «людьми-экспертами», которых можно нанять, автоматизированной маркетинговой компанией, которая вообще не требует участия человека, и как агенты объединяются в команду для сотрудничества друг с другом.

В следующем примере мы можем использовать NexusGPT для создания нескольких экспертов и использовать GPTeam для формирования команды, нанятой людьми, и эта команда ИИ работает в полностью автоматизированной компании, такой как AutoCorp. Когда мы собираем эти кусочки головоломки вместе, мы можем интуитивно почувствовать, что будущее наступило;

NexusGPT

Это так называемая первая в мире фриланс-платформа для ИИ, созданная независимым разработчиком Assem. восемьсот агентов ИИ с особыми навыками.

Агенты на NexusGPT могут разумно регулировать сложность вопросов:

- Уровень 1: Простой диалог
- Уровень 2: предварительно обученные операции/плагины
- Уровень 3: режим AutoGPT

Но все они полагаются на поддержку вызовов функций OpenAI и LangchainAI;

В то время как во время выполнения задачи агента авторы рассматривают скорость, с которой система достигает высоких оценок благодаря отзывам людей и рейтинговым наблюдениям в цикле. Фактически, это должно предоставить агентам ИИ определенные навыки для достижения итеративно оптимизированных стратегий улучшения при общении с человеком-стороной А по требованиям задачи.

NexusGPT представляет собой будущую бизнес-модель для найма агентов людьми. Этот проект на самом деле имеет много возможностей для улучшения, например, сочетание агентов и экспертных модулей (экспертная система и экспертная модель). Метод ценообразования Стороны А для найма агентов: на основе Token Расчет потребления и т. д., они изменят наш традиционный способ найма рынка труда, а также изменят способ сотрудничества DAO;

АвтоКорп

Создано за 5 часов AutoCorpmina fahmi и их командой во время Нью-Йоркского хакатона GPT/LLM. AutoCorp — полностью независимая компания, занимающаяся бренд-маркетингом. AutoCorp автоматически создает рекламу бренда и дизайн продукта для компании, которая напрямую продает футболки. Когда у клиентов возникают новые потребности потребителей, AutoCorp обновляет свою тему и создает новые элементы дизайна. Непрерывное самоповторение к лучшему направлению бизнеса.

Во-первых, AutoCorp разработала первоначальную идею бренда футболок на основе исходной идеи. Затем он использовал эту первоначальную идею для создания различных активов компании и руководства по стилю по умолчанию. Когда у клиентов возникнут потребности, AutoCorp обновит свой план в соответствии с этими потребностями. Если план приводит к снижению продаж, AutoCorp вносит коррективы. Вышеупомянутый процесс был запущен от начала до конца и может быть подключен к рекламному API и пользовательскому API футболок для развертывания в реальном мире.

Этот абзац цитируется из твиттера Мины Фахми, и AutoCorp также была создана Миной Фахми и их командой во время хакатона GPT/LLM в Нью-Йорке за 5 часов, и их цель создания AutoCorp также состоит в том, чтобы продвигать концепцию «автономии» в крайний .

Фактически, цель AutoCorp и DAO весьма согласуется **Если конечной целью децентрализованной организации является устранение «человеческого» фактора, то полная автоматизация производственных операций на самом деле является разумной привлекательностью для развития концепции DAO. ** AutoCorp фактически представляет будущее направление развития бизнеса DAO.

GPTeam

GPTeam — это многоагентная система моделирования с открытым исходным кодом. GPTeam использует GPT-4 для создания нескольких агентов, которые взаимодействуют для достижения заранее определенных целей. Основная цель этого проекта — изучить потенциал моделей GPT для повышения производительности работы с несколькими агентами и эффективной коммуникации.

GPTeam использует независимых агентов, каждый из которых оснащен памятью и взаимодействует посредством связи. Реализации памяти и отражения для агентов вдохновлены этой исследовательской статьей. Агенты перемещаются по миру и выполняют задачи в разных местах в зависимости от своих собственных задач и местоположения других агентов. Они могут общаться друг с другом и совместно работать над задачами, одновременно работая над достижением общей цели.

адрес проекта:

На самом деле, все еще существует множество проектов с открытым исходным кодом, таких как GPTeam, таких как Dev-GPT, автоматизированная группа разработчиков, которая создает настраиваемые микросервисы для пользователей. Команда состоит из трех виртуальных ролей: менеджер по продукту, разработчик и разработка, эксплуатация и техническое обслуживание.Техническая идея Dev-GPT в основном заключается в выявлении и тестировании эффективных стратегий задач.Если 10 раз подряд произойдет сбой, он переключится к следующему методу.

Мы будем видеть все больше и больше проектов, разрабатывать ИИ-агентов как своего рода команду ИИ, несложно определить агентов как производственную роль, например, в случае с NexusGPT, разработчики могут настраивать каждого агента. Это сложно чтобы стать агентами с исключительными навыками, а затем как сотрудничать с этими агентами, чтобы проявить свои соответствующие навыки, и выполнить автоматизацию задачи / проекта в сочетании, что является сложной задачей Агенты Project Atlas исследуют автоматизацию на основе естественного языка, фактически обеспечивает хороший сценарий применения для Агентов-команды;

Все это заставляет меня думать о DAO, автоматизированной организации совместной работы, основанной на автоматизированной логике управления.

Как агенты заменяют повторяющуюся работу

Прежде чем ИИ полностью заменит нашу работу, агенты заменят большую часть нашей текущей повторяющейся работы, это следующее направление развития агентов в сфере бизнеса.До появления агентов на основе LLM RPA (роботизированная автоматизация процессов) была первым в отрасли поиском решений, но традиционная RPA имеет высокий порог и не может быть популяризирована среди публики RPA является средством от отсутствия автоматизации традиционной логики взаимодействия ИТ, и текущие агенты могут общаться на естественном языке для реализации функции RPA.

Следующие два проекта показывают нам, как агенты на основе LLM помогут нам освободиться от монотонной работы в нашей повседневной работе и академических исследованиях. (На самом деле потенциал этих двух проектов больше)

Слой читов

«Автоматизируйте свой бизнес с помощью естественного языка», используя естественный язык для автоматизации вашего бизнеса, - это слоган бренда Cheat Layere. Уровень читов решает неразрешимые проблемы автоматизации бизнеса с помощью специально обученных моделей машинного обучения GPT-4, выступая в качестве инженеров-программистов ИИ для каждого пользователя.

Cheat Layer выпустила два продукта на Producthunt: один — Cheat Layer, а другой — Project Atlas Agents.Project Atlas Agents — это интерфейс управления проектами без кода, который можно использовать для создания и итерации агентов AI.

Cheat Layer автоматизирует работу всей веб-страницы через подключаемый модуль Google Chrome и использует естественный язык.Например, большинство наших рутинных операций на веб-странице могут выполняться автоматически. Cheat Layer легко напоминает RPA, то есть роботизированную автоматизацию процессов. Было много дискуссий об отношениях между агентами и RPA.Неоспоримым фактом является то, что традиционные RPA были устранены агентами.

Используйте естественный язык через Cheat Layer для настройки автоматизации бизнес-процессов и используйте агентов Project Atlas для управления различными процессами автоматизации. Вообще говоря, мы можем использовать режим естественного языка для создания агентов для управления автоматизированным выполнением определенного бизнеса, как сложность бизнеса увеличивается, мы можем итеративно улучшать агентов.

Маркетинг и продвижение Cheat Layer пока не знаю, но по статистике Similarweb, основные пользователи в основном в Северной Америке, а количество посещений выросло на 37,8% по сравнению с предыдущим месяцем. Создавая агентов для автоматизации управления бизнесом, этот спрос относительно по сравнению с различными чат-ботами может в значительной степени удовлетворить потребности владельцев малого и среднего бизнеса в области электронной коммерции, и, возможно, это направление, которое стоит изучить и изучить;

Исследователь GPT

GPT Researcher — это автономный агент на основе GPT, способный проводить комплексные онлайн-исследования по любой заданной теме. Внедрение проекта на Github:

«Агент способен генерировать подробные, объективные и непредвзятые исследовательские отчеты с вариантами настройки, чтобы сосредоточиться на соответствующих ресурсах, схемах и уроках. Вдохновленный AutoGPT и недавним документом Plan-and-Solve, GPT Researcher решает проблемы скорости и детерминированности. , за счет распараллеливания работы агентов, а не синхронных операций, что обеспечивает более стабильную производительность и более высокую скорость».

Архитектура GPT Researcher в основном осуществляется за счет запуска двух агентов, ** один из которых является «планировщиком», а другой — «исполнителем»; ** планировщик отвечает за создание вопросов исследования, а исполнитель основывается на результатах исследования. вопросы, созданные планировщиком. Найдите соответствующую информацию и, наконец, отфильтруйте и обобщите всю соответствующую информацию с помощью планировщика, а затем создайте отчет об исследовании;

точнее:

Составьте набор исследовательских вопросов, которые вместе составляют объективное мнение о любой заданной задаче.
Для каждого исследовательского вопроса запускайте поисковый агент для сбора информации, относящейся к данной задаче, из онлайн-ресурсов.
Подведите итоги по каждому просканированному ресурсу на основе релевантной информации и отследите его источник.
Наконец, все обобщенные ресурсы проверяются и объединяются, после чего создается окончательный исследовательский отчет.

Особенности этого проекта

Создание отчетов об исследованиях, схемах, ресурсах и извлеченных уроках

Каждое исследование объединяет более 20 интернет-источников для формирования объективных и фактических выводов.

Включает простой в использовании веб-интерфейс (HTML/CSS/JS)

Веб-скрапинг с поддержкой Java

Регистрируйте и отслеживайте контекстную информацию о посещенных и использованных веб-источниках.

Экспорт отчетов об исследованиях в такие форматы, как PDF...

Хотя GPT Researcher — это инструмент для академических исследований, основанный на GPT, и это проект с открытым исходным кодом для академических целей под лицензией MIT. С точки зрения создания контента этот проект с открытым исходным кодом имеет высокую коммерческую ценность. Например, когда этот проект с открытым исходным кодом применяется к отчетам по бизнес-анализу, он все равно может сэкономить много времени. Во-вторых, преобразовать этот проект с открытым исходным кодом в ИИ для агенты по написанию глубокого контента также полностью изменят модель индустрии контент-медиа;

адрес проекта:

Экология инфраструктуры ИИ-агентов

Очевидное будущее заключается в том, что отношения сотрудничества между людьми в будущем будут уже не отношениями сотрудничества между людьми, а отношениями сотрудничества между людьми и агентами ИИ, и каждый будет иметь как можно больше агентов ИИ. решать как можно больше задач, формируя тем самым большую и сложную интеллектуальную структуру социального сотрудничества**;

Отношения сотрудничества между людьми и агентами отличаются от теории сотрудничества людей и инструментов в предыдущих теориях социальных наук.Ключ заключается в том, что агенты, как своего рода человекоподобный интеллект, обладают определенными независимыми способностями к принятию решений и человеческим доверием к Агенты также стали ключевой проблемой, не говоря уже о самосознании Агентов, но о влиянии Агентов на поведение при социальном взаимодействии при принятии решений вместо людей.

Основываясь на рассмотрении двух вышеупомянутых предложений, мы должны понять, что люди могут эффективно и удобно создавать своих собственных ИИ-агентов, позволяя своим собственным агентам иметь более мощные возможности, а агенты надежны и заслуживают доверия. Поддержка неотделима от хорошей инфраструктуры. Я думаю, что введение следующих трех проектов представляет собой направление строительства будущей инфраструктуры AI-агентов;

ленгчейн

LangChain — это среда разработки приложений на основе языковой модели. Он может выполнять следующие функции

Поддержка данных: Подключайте языковые модели к другим источникам данных.

Агент: позволяет языковой модели взаимодействовать со своей средой.

Основная ценность LangChain заключается в:

Компонент: Предоставляет абстракции для работы с языковыми моделями и ряд реализаций для каждой абстракции. Эти компоненты являются модульными и простыми в использовании, независимо от того, используете ли вы остальную часть фреймворка LangChain или нет.

Готовые цепочки: структурированный набор компонентов для реализации конкретных высокоуровневых задач.

Готовые цепи позволяют быстро приступить к работе. Для более сложных приложений и детальных вариантов использования компоненты упрощают настройку существующих цепочек или создание новых.

langchain предоставляет стандартные, расширяемые интерфейсы и внешнюю интеграцию, предоставляя следующие модули

Ввод и вывод модели ввода-вывода модели: взаимодействие интерфейса с языковой моделью

Подключение к данным подключение к данным: взаимодействие интерфейса с данными конкретного приложения

Цепочка цепочек: построить последовательность вызовов

Агенты: позвольте цепочке выбирать, какие инструменты использовать, на основе инструкций высокого уровня. *
Память: сохраняет состояние приложения между запусками цепочки. *
Обратные вызовы Обратные вызовы: Записывайте и транслируйте промежуточные шаги любой цепочки. *

Благодаря относительно активной экологии разработчиков Langchain в англоязычном сообществе, существует относительно много случаев разработки приложений Agents с использованием Langchain.Определение среды Agents и предоставление среды разработки с нулевым кодом — это будущая тенденция.

Основываясь на определенной рамочной системе, производство агентов похоже на сборку блоков Lego.В отличие от модульности Web3, модули агентов не обязательно должны быть готовыми, но обычные люди также могут разрабатывать определенные компоненты с помощью программирования на естественном языке. , Добавлено в структуру Агентов.

Например, многие люди используют фреймворк langchain для разработки чат-ботов, разрабатывают компонент преобразования тона с помощью программирования на естественном языке и добавляют его в чат-бот, после чего исходный тон диалога по умолчанию можно изменить на тон диалога, соответствующий собственным предпочтениям пользователя.

Просветление, данное нам langchain, заключается в том, что среда разработки агентов для программирования без кода + модули компонентов для программирования на естественном языке могут быть необходимым инструментом разработки для популяризации агентов.

Агенты-трансформеры

Transformer Agents — это система AI-Agents, запускаемая висящим Face, Хотя текущая функция не очень хороша, ключевая причина, по которой мы должны следить за ней, заключается в том, что HuggingFace — это огромная библиотека моделей с открытым исходным кодом.

Агенты Transformer фактически основаны на платформе Transformer, добавляя API на основе естественного языка: Huggingface определяет набор инструментов и проектирует агента для интерпретации естественного языка и использования этих инструментов.Что наиболее важно, эта система имеет расширяемый дизайн.

Другими словами, Transformer Agents использовали небольшое количество хорошо подготовленных прокси-инструментов на ранней стадии, чтобы проверить выполнимость этой системы, а затем масштабируемость означает, что Transformer Agents могут свободно использовать огромную библиотеку инструментов модели Huggingface.

Я чувствую, что это решение, разработанное в статье «HuggingGPT: решение задач ИИ с помощью ChatGPT и его друзей в обнимающем лице», которое заключается в подключении огромной библиотеки моделей через LLM для решения сложных задач в нескольких областях и различных модальностях. на самом деле очень огромен. Первая библиотека моделей ИИ, которая объединяет первоклассный человеческий интеллект, используется в виде агентов для решения сложных задач в различных отраслях. Трудно не ожидать такого будущего. **

Конечно, реализовать это видение интересно, но на текущем этапе я все еще с нетерпением жду, когда Transformer Agents сможет предложить впечатляющую среду агентов, чтобы приспособиться к притоку разработчиков в эту среду, содержащую огромные золотые прииски. HuggingFace, возможно, скорректировал собственную стратегию развития.

Веб-арена

**WebArena — это автономная веб-среда с автономным размещением для создания автономных агентов. **WebArena создает четыре популярные категории веб-сайтов с функциями и данными, которые имитируют их реальные аналоги.

Чтобы имитировать решение проблем человеком, WebArena также встраивает инструменты и ресурсы знаний в виде автономных веб-сайтов. WebArena представляет эталон для интерпретации высокоуровневых команд реального мира на естественном языке в конкретные веб-взаимодействия. Исследователи предоставили аннотированные программы для программной проверки функциональной правильности каждой задачи.

Обзор цитируемых статей:

«Существующие агенты в основном создаются и тестируются в упрощенных синтетических средах, которые в значительной степени ограничивают представление сценариев реального мира. В этой статье мы создаем среду управления и контроля агентов, которая является очень реалистичной и воспроизводимой. В частности, мы сосредоточились на агентов, выполняющих задачи в Интернете, и создали среду, включающую полнофункциональные веб-сайты в четырех общих областях: электронная коммерция, обсуждения на социальных форумах, совместная разработка программного обеспечения и управление контентом. Наша среда богата и разнообразна, включая некоторые инструменты (например, карты ) и внешние базы знаний (такие как руководства пользователя) для поощрения решения задач, подобных человеческому.

На основе нашей среды мы публикуем набор эталонных задач, которые сосредоточены на оценке функциональной правильности выполнения задачи. Задачи в нашем бенчмарке разнообразны, рассчитаны на длительное время и предназначены для имитации задач, часто выполняемых людьми в Интернете. Мы разрабатываем и внедряем несколько автономных агентов, интегрируя самые современные методы, такие как «думай, прежде чем действовать».

Результаты показывают, что решение сложных задач является сложной задачей: наш лучший агент на основе GPT-4 достигает сквозного успеха только в 10,59%. Эти результаты подчеркивают необходимость дальнейшей разработки мощных агентов, современные языковые модели далеки от совершенства для решения этих реальных задач, и WebArena можно использовать для измерения такого прогресса. "

Название диссертации: WebArena: реалистичная веб-среда для создания автономных агентов

Адрес диссертации:

Это результат академического исследования исследователя ИИ из Карнеги-Меллона. Фактически, WebArena дополняет известную в настоящее время архитектуру разработки langchain или различные проекты, связанные с Agents-Team. Нам нужна тестовая платформа моделирования агентов, используемая для обеспечения надежности и эффективность Агентов.

Основная функция этой платформы - проверить осуществимость различных проектов агентов.Я даже могу себе представить один сценарий: когда я найму агента на определенной платформе в будущем, мы будем использовать агентов через такую платформу, как WebArena, для тестирования реальная работоспособность агентов также означает, что люди имеют право высказываться о ценовых решениях ИИ-агентов.

Как AI-агенты повлияют на все?

Автоматизированная сеть для совместной работы на основе агентов

Благодаря нашему представлению и анализу более дюжины проектов, приведенных выше, эти разные проекты подобны кусочкам головоломки, составляя наше относительное общее понимание агентов.Агенты на самом деле являются направлением, позволяющим по-настоящему раскрыть потенциал LLM, а LLM - центр, агенты наделяют LLM руками и ногами.Основываясь на функциональном разнообразии агентов, управляемых LLM, агенты будут подобны биологическому взрыву, а люди и агенты станут цифровыми компаньонами / симбиотическими отношениями развития.

Совместная сеть человеческого общества также сформирует автоматизированную совместную сеть между людьми и агентами из-за крупномасштабного применения агентов.Производственная структура человеческого общества будет модернизирована, и все аспекты общества будут затронуты и изменены;

Изменение всего в Интернете

AI-агенты полностью изменили способы получения, обработки, производства и использования информации в Интернете, а также изменили нашу текущую бизнес-модель, основанную на Интернете.Интеллектуальная сеть с коммуникационными возможностями и автономным/автоматическим Задачи — это Интернет-агенты — это интеллектуальная среда, с которой мы общаемся и которую выполняем.

Изменение повествования для Web3

Сеть зашифрованных валют станет естественной валютной сетью агентов, а вычислительные ресурсы, потребляемые всей сетью совместной работы агентов ИИ, сделают токен важным экономическим ресурсом ИИ; право собственности на личные данные, представленное Web3, также столкнется с новым человеком-компьютером. отношения взаимодействия Среди них совершенно новое предложение о том, что люди и агенты ИИ разделяют права собственности на данные. Появление агентов с независимыми правами собственности (радикальное движение за освобождение ИИ), DAO, полностью автоматизированных агентами ИИ, и супер-люди монополизировали большую часть прав собственности на сетевые данные и эффективные вычислительные ресурсы.

Движение за утверждение данных под волной Web3 вернуло всем право собственности на данные. На самом деле, большинство людей не обязательно обладают ценными ресурсами данных. Возвращение права собственности на данные стало политическим призывом нарративизма Web3, но оно игнорирует AGI. Производственная структура неравна, ИИ-агенты представляют собой то, что, хотя ИИ является сверхпродуктивным, он также строит новые производственные отношения взаимодействия человека с компьютером и автоматического сотрудничества, что заставляет нас изменить повествовательную логику Web3. ;

Ускорить строительство метавселенной

От разработки и эволюции генеративных агентов, изучения цифровых коренных цифровых жителей и построения ряда социальных действий в среде метавселенной коренных цифровых людей (ИИ-агентов с личностными характеристиками и автономным сознанием), по сути, происходит ускорение метавселенной. Вселенная превратилась из цифрового пространства в цифровую территорию с социальными функциями и формами. Концепция вычислительного пространства также позволит Агентам получить цифровое мультимодальное пространство для разработки, тем самым ускорив появление воплощенного интеллекта Агентов в цифровой среде.

Построение метавселенной больше не является задачей человека, а является задачей непрерывного саморасширения в качестве жизненного пространства ИИ-Агента;

Остерегайтесь похищения одного технологического повествования

На самом деле, в последние годы одна за другой возникали различные технологические «горячие точки», и человечество, похоже, вступило в период частых технологических революций. действительно многое создало для людей в выборе карьерных направлений.В связи с тем, что большинство людей на рынке ориентированы на проектное мышление, позиционирование самого проекта можно легко отнести к определенной категории, например либо Web3, либо AI .Вот где жопа решает головой, игнорируя технику Объективный закон развития истории.

**Развитие науки и техники никогда не было фрагментарным, а шло к междисциплинарной интеграции в диалектическом единстве. **Например, атрибут повествования NFT Web3, естественно, соответствует повествованию Метавселенной. В первые дни Web3 некоторые люди сознательно противостояли им. Это очень узкие точки зрения. То же самое относится и к сегодняшнему повествованию об ОИИ. Практики Web3 знают только инструменты ИИ, но не задумываются глубоко о логике повествования ОИИ. Они намеренно создают когнитивное сопротивление между ИИ и Web3. original Мало у кого хватает смелости остановиться и переосмыслить влияние AGI на DAO.

Web3, Metaverse и AGI — три взаимосвязанных направления.Традиционные основные технологические медиа-организации или инвестиционные институты еще не разработали новую концепцию парадигмы для будущих технологических нарративов и используют старые нарративные парадигмы для влияния на рынок.Ресурсы науки и техники-практики в этом направлении разрознены и их идеи недостаточно открыты. Мы не исключаем, что новые технологические нарративы продолжат появляться в будущем, но если старая парадигма технологических нарративов будет продолжать приниматься, то ресурсы научных и технологических талантов будут лишь вновь и вновь дробиться и распыляться. технологического познания — это отработанный ресурс невидимых вещей.

Ключевой вопрос, который в настоящее время стоит перед всей китайской технологической отраслью, заключается в том, что такое технология? Не хватает новых нарративных парадигм и новых нарративных концепций, которые помогли бы нам лучше справляться со следующей волной технологий. Мы всегда погружены в проекты, но нам не хватает нарративов, которые могли бы объединить силу науки и технологий Ни один из трех основных нарративов Web3, Metaverse и AGI не возник в Китае.

Я очень жду наступления эпохи, когда расцветают сотни цветов и соревнуются сотни школ мысли в научных и технологических нарративах.Нам срочно необходимо сформировать новое понимание технологических нарративов, чтобы мы могли найти правильный путь развития и определяют нашу позицию устойчивого развития во всей технологической экосистеме.

Конечно, в одиночку апеллировать бесполезно, да и кому-то это еще надо сделать, поэтому я сделаю это первым, а эти монотехнические повествовательные размышления я терпел уже давно!

Посмотреть Оригинал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Награда
лайк
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
Launchpad Debut: Pump.Fun
3k Популярность
BTC Hits New High
90k Популярность
My Gate Moments
14k Популярность
4Fed June Meeting Minutes
5k Популярность
5Join Gate VIP to Win MacBook
30k Популярность
6Trump Tariff Hikes
16k Популярность
7Gate xStocks Trading Share
23k Популярность
8HK Stablecoin Rules
14k Популярность
9Truth Social Crypto ETF
3k Популярность
10Gate Alpha Trading Share
13k Популярность

Закрепить

Карта сайта

10 репрезентативных AI-агентов, как изменится Интернет / перекроят Web3

Консенсус и неконсенсус AI-агентов

Найти возможность по соотношению агентов

Построение целостного познания в головоломке агентов

Два основных будущих направления AI-агентов

Авто-GPT

Генеративные агенты

Как агенты становятся рабочими партнерами

NexusGPT

АвтоКорп

GPTeam

Как агенты заменяют повторяющуюся работу

Слой читов

Исследователь GPT

Экология инфраструктуры ИИ-агентов

ленгчейн

Агенты-трансформеры

Веб-арена

**Как AI-агенты повлияют на все? **

Как AI-агенты повлияют на все?