AI Agents переосмислює шлях до інновацій у Web3-іграх

Ключові інсайти

1.AI Agent — це інструмент, заснований на загальній великій моделі LLM, для розробників і користувачів для безпосереднього створення додатків, які можуть взаємодіяти незалежно. 2.AI Основним візерунком майбутньої доріжки може бути: «загальна велика модель + аплікація підвіски»; Екологічна ніша AI Agent — це проміжне програмне забезпечення, яке з'єднує загальну велику модель і Dapp, тому AI Agent має низький рів, і для підвищення довгострокової конкурентоспроможності необхідно створювати мережеві ефекти та покращувати прихильність користувачів. 3. У цій статті розглядається розробка «загальних великих моделей, агентів підвісних додатків і додатків генеративного штучного інтелекту» в ігровому треку Web3. Серед них, у поєднанні з технологією генеративного штучного інтелекту, він має великий потенціал для того, щоб вразити гру в короткостроковій перспективі.

01 Технічне завдання

У цьогорічній вибуховій технології штучного загального інтелекту AGI (Artificial General Intelligence) Large Language Model (LLM) є абсолютним героєм. Основні технологи OpenAI Андрей Карпати та Ліліан Венг також заявили, що агенти штучного інтелекту на основі LLM є наступним важливим напрямком розвитку в галузі AGI, і багато команд також розробляють системи агентів штучного інтелекту (AI-агентів), керованих LLM. Простіше кажучи, AI Agent — це комп'ютерна програма, яка використовує великі обсяги даних і складні алгоритми для імітації людського мислення та процесу прийняття рішень для виконання різних завдань і взаємодій, таких як автономне водіння, розпізнавання мови та ігрова стратегія. Картина Abacus.ai наочно знайомить з основним принципом роботи AI Agent, а кроки такі:

  1. Сприйняття та збір даних: введення даних або агент штучного інтелекту через системи сприйняття (датчики, камери, мікрофони тощо) для отримання інформації та даних, таких як стан гри, зображення, звук тощо. **
  2. Представлення стану: Дані повинні бути оброблені та представлені у формі, зрозумілій агенту, наприклад, перетворені у вектори або тензори, щоб їх можна було легко ввести в нейронну мережу. **
  3. Моделі нейронних мереж: Моделі глибоких нейронних мереж зазвичай використовуються для прийняття рішень і навчання, такі як згорткові нейронні мережі (CNN) для обробки зображень, рекурентні нейронні мережі (RNN) для обробки даних послідовностей або більш просунуті моделі, такі як механізми самоуваги (Transformers). **
  4. Навчання з підкріпленням: агенти вивчають найкращі стратегії дій через взаємодію з навколишнім середовищем. Крім того, принципи роботи агента включають стратегічну мережу, створення ціннісних мереж, навчання та оптимізацію, а також дослідження та використання. Наприклад, в ігровому сценарії стратегічна мережа може вводити стан гри, а потім виводити розподіл ймовірності дії; Мережа цінностей здатна оцінювати вартість стану; Агенти можуть постійно підсилювати алгоритми навчання, взаємодіючи з навколишнім середовищем, щоб оптимізувати політику та мережі створення цінності та отримувати кращі результати. **

Таким чином, AI-агенти — це розумні сутності, які розуміють, приймають рішення та діють, і вони можуть відігравати важливу роль у різних сферах, включаючи ігри. «Автономні агенти на основі LLM» від основного техніка OpenAI Ліліан Венг надає дуже повне ознайомлення з принципами роботи AI-агентів, включаючи дуже цікавий експеримент: генеративні агенти.

Generative Agents (GA) натхненна іграми The Sims, які використовують технологію LLM для генерації 25 віртуальних персонажів, кожним з яких керує агент на основі LLM, які живуть і взаємодіють у середовищі пісочниці. GA розумно розроблена для поєднання LLM з можливостями пам'яті, планування та відображення, що дозволяє програмам-агентам приймати рішення на основі попереднього досвіду та взаємодіяти з іншими агентами.

У статті детально описано, як агент постійно навчає та оптимізує шляхи прийняття рішень на основі мереж політик, мереж створення цінності та взаємодії з навколишнім середовищем.

Принцип такий: де Memory Stream (Memory Stram) - це модуль довготривалої пам'яті, який записує всі переживання взаємодії агента. Модель Retrieve надає Retrived Memories на основі актуальності, свіжості та важливості, щоб допомогти агенту прийняти рішення. Механізм рефлексії узагальнює минулі події і керує майбутніми діями агента. Plan and Reflect працюють разом, щоб допомогти агентам перетворити інформацію про рефлексію та навколишнє середовище на дієві дії.

Цей цікавий експеримент показує нам можливості агентів штучного інтелекту, такі як генерування нової соціальної поведінки, поширення інформації, реляційна пам'ять (наприклад, два віртуальні персонажі продовжують обговорювати тему) та координація соціальної діяльності (наприклад, проведення вечірки та запрошення інших віртуальних персонажів) тощо. Загалом, AI-Agent є дуже цікавим інструментом, і його застосування в іграх варто детально вивчити.

02 Технологічні тренди

2.1 Відстеження тенденцій штучного інтелекту

Лао Бай, партнер з інвестиційних досліджень в ABCDE, якось підсумував судження спільноти венчурного капіталу Кремнієвої долини щодо наступного розвитку штучного інтелекту:

  1. **Немає вертикальної моделі, лише велика модель + вертикальне застосування; **
  2. Дані на периферійних пристроях, таких як мобільні телефони, можуть бути бар'єром, а периферійні пристрої на основі штучного інтелекту також можуть бути можливістю; **
  3. Довжина Контексту може спричинити якісні зміни в майбутньому (векторні бази даних зараз використовуються як пам'ять ШІ, але довжини контексту все ще недостатньо). **

** Тобто, з точки зору загального закону розвитку галузі, оскільки великомасштабний режим моделі загальної моделі занадто важкий і має сильну універсальність, немає необхідності постійно будувати колеса в області великомасштабних загальних моделей, а слід більше зосередитися на застосуванні великомасштабних загальних моделей в області підвісок. **

У той же час периферійні пристрої відносяться до кінцевих пристроїв, які зазвичай не покладаються на центри хмарних обчислень або віддалені сервери, а проводять обробку даних і прийняття рішень локально. Через різноманітність периферійних пристроїв розгортання агентів штучного інтелекту для роботи на пристроях і належного отримання даних про пристрої є складним завданням, але це також і нова можливість.

Нарешті, питання контексту також привернуло багато уваги. Простіше кажучи, контекст у контексті LLM можна розуміти як обсяг інформації, а довжину контексту можна розуміти як те, скільки вимірів мають дані. Припустимо, у вас є модель великих даних веб-сайту електронної комерції, яка використовується для прогнозування ймовірності покупки користувачем певного товару. У цьому випадку контекст може включати таку інформацію, як історія переглядів користувача, історія покупок, історія пошуку, атрибути користувача тощо. Довжина контексту – це вимір суперпозиції інформації про функції, як-от історія покупок конкуруючих товарів 30-річних користувачів чоловічої статі в Шанхаї, частота нещодавніх покупок і нещодавня історія перегляду. Збільшення довжини контексту може допомогти моделі більш повно зрозуміти фактори, які впливають на рішення користувача про покупку.

Поточний консенсус полягає в тому, що, хоча поточне використання векторних баз даних як пам'яті ШІ робить довжину контексту недостатньою, довжина контексту якісно зміниться в майбутньому, і модель після LLM може шукати більш просунуті методи для обробки та розуміння довшої та складнішої контекстної інформації. Крім того, з'явилося більше сценаріїв застосування, які виходять за рамки уяви.

2.2 Тенденції AI Agent

Folius Ventures узагальнив прикладну модель AI Agent в ігровому треку, як показано нижче:

На рисунку 1 представлена модель LLM, яка в основному відповідає за перетворення намірів користувача з традиційного введення з клавіатури/клацання на введення природною мовою, знижуючи бар'єр входу для користувачів.

На малюнку 2 представлена зовнішня децентралізована програма, інтегрована з агентом штучного інтелекту, яка надає користувачам функціональні послуги, збираючи звички користувачів і дані з терміналу.

3 на малюнку – це різні агенти штучного інтелекту, які можуть існувати безпосередньо у вигляді функцій у додатку, ботів тощо.

Загалом, як інструмент на основі коду, AI Agent може виступати в якості базової програми для Dapps для розширення функціональності додатків і як каталізатор зростання для платформи, тобто проміжного програмного забезпечення, яке пов'язує великі моделі та вертикальні програми.

З точки зору користувацьких сценаріїв, найімовірніше, Dapp для інтеграції AI Agent, швидше за все, буде достатньо відкритим для соціальних додатків, чат-ботів та ігор; Або перетворити існуючий портал трафіку Web2 на простіший і доступніший вхід AI+web3 через AI Agent; Тобто в індустрії обговорюють зниження порогу користувачів Web3.

Виходячи із закону розвитку галузі, рівень проміжного програмного забезпечення, в якому знаходиться AI Agent, часто стає висококонкурентною трасою майже без рову. Тому, окрім постійного покращення досвіду відповідно до потреб B2C, агенти штучного інтелекту можуть покращувати свої рови, створюючи мережеві ефекти або створюючи прихильність користувачів.

03 Карта треків

Було кілька різних спроб застосування штучного інтелекту в іграх Web3, які можна згрупувати в такі категорії:

  1. Загальні моделі: Деякі проєкти зосереджені на побудові загальних моделей штучного інтелекту, пошуку відповідних архітектур нейронних мереж і загальних моделей для потреб проєктів Web3. **
  2. Вертикальні програми: Підвісні програми призначені для вирішення конкретних проблем в іграх або надання певних послуг, як правило, у формі агентів, ботів і наборів ботів. **
  3. **Додаток генеративного штучного інтелекту: Найбільш прямим застосуванням, що відповідає великій моделі, є генерація контенту, а сам ігровий трек - це індустрія контенту, тому додаток Generative AI в ігровій сфері дуже заслуговує на увагу. Від автоматичної генерації елементів, персонажів, місій або сюжетних ліній у віртуальному світі, до автоматичної генерації ігрових стратегій, рішень і навіть автоматичної еволюції внутрішньоігрової екології, це стало можливим, зробивши гру більш різноманітною та глибокою. ** 4.AI ігри: В даний час вже існує багато ігор, які інтегрують технологію штучного інтелекту та мають різні сценарії застосування, які будуть проілюстровані нижче. **

3.1 Універсальна велика модель

Наразі Web3 вже має імітаційні моделі для розробки економічних моделей та економічного екологічного розвитку, такі як кількісна модель токенів QTM. Доктор Ахім Струве з Outlier Venture розповів про деякі ідеї щодо дизайну економічної моделі у своєму виступі на ETHCC. Наприклад, враховуючи надійність економічної системи, команда проєкту може створити цифрового двійника Digital Twin за допомогою моделі LLM для моделювання всієї екосистеми 1:1.

QTM (Quantized Token Model) на малюнку нижче є моделлю логічного висновку на основі штучного інтелекту. QTM використовує фіксований час моделювання в 10 років, при цьому кожен крок часу становить один місяць. На початку кожного кроку часу в екосистему емітуються токени, тому в моделі є модулі заохочення, модулі наділення токенами, модулі аірдропу тощо. Потім ці токени будуть розподілені на кілька мета-сегментів, з яких відбудеться більш детальний узагальнений перерозподіл корисності. Потім визначте виплати винагороди тощо за допомогою цих утиліт. Крім того, як і офчейн-бізнес, це також враховує загальну ситуацію з фінансуванням бізнесу, таку як можливість знищення або викупу, а також може вимірювати прийняття користувачами або визначати прийняття користувачами.

Звичайно, вихідна якість моделі залежить від якості вхідних даних, тому перед використанням QTM необхідно провести достатнє дослідження ринку для отримання більш точної вхідної інформації. Однак модель QTM вже є дуже практичним застосуванням моделі, керованої штучним інтелектом, в економічній моделі Web3, і є багато сторін проєкту, заснованих на моделі QTM, щоб створювати додатки 2C/2B з меншою складністю роботи, зменшуючи поріг для використання сторонами проєкту.

3.2 Агент з нанесення кулона

Підвісні додатки в основному існують у вигляді агентів, якими можуть бути боти, BotKits, віртуальні помічники, інтелектуальні системи підтримки прийняття рішень, різні автоматизовані інструменти обробки даних і так далі. Взагалі кажучи, AI Agent бере за основу загальну модель OpenAI, поєднує інші технології з відкритим вихідним кодом або самостійно розроблені, такі як перетворення тексту в мову (TTS) тощо, і додає конкретні дані для FineTune (навчальна техніка в галузі машинного навчання та глибокого навчання, основна мета якої полягає в подальшій оптимізації моделі, яка була попередньо навчена на великомасштабних даних) для створення AI Agent, який працює краще, ніж ChatGPT у певній галузі.

Наразі найбільш зрілим застосунком ігрового треку Web3 є NFT Agent. Консенсус на ігровому шляху полягає в тому, що NFT мають бути важливою частиною ігор Web3.

З розвитком технології управління метаданими в екосистемі Ethereum з'явилися програмовані динамічні NFT. Творці NFT можуть алгоритмічно зробити функціональність NFT більш гнучкою. Для користувачів може бути більше взаємодії між користувачами та NFT, а згенеровані дані про взаємодію стали джерелом інформації. AI Agent може оптимізувати процес взаємодії та розширити сценарії застосування даних про взаємодію, вносячи більше інновацій та цінності в екосистему NFT.

Приклад 1: Наприклад, фреймворк розробки Gelato, який дозволяє розробникам налаштовувати логіку для оновлення метаданих NFT на основі подій поза мережею або певних часових інтервалів. Вузли Gelato ініціюють зміни метаданих, коли виконуються певні умови, забезпечуючи автоматичне оновлення ончейн NFT. Наприклад, цю технологію можна використовувати для отримання даних про матчі в реальному часі зі спортивних API та автоматичного оновлення характеристик навичок NFT за певних умов, наприклад, коли спортсмен виграє матч.

Кейс 2: Paima також надає агента-застосунку для Dynamic NFT. Протокол стиснення NFT від Paima карбує набір мінімальних NFT на L1, а потім розвиває їх залежно від стану гри на L2, надаючи гравцям більш глибокий та інтерактивний ігровий досвід. Наприклад, NFT можуть змінюватися залежно від таких факторів, як очки досвіду персонажа, виконання місії, спорядження тощо.

Кейс 3: Mudulas Labs – дуже відомий проєкт ZKML, який також має макет у NFT-треку. Мудулас запустив серію NFT zkMon, яка дозволяє генерувати NFT за допомогою штучного інтелекту та публікувати в ланцюжку, одночасно генеруючи zkp, за допомогою якого користувачі можуть перевірити, чи згенерований їхній NFT з відповідної моделі штучного інтелекту. Для отримання більш повної інформації див.: Розділ 7.2: Перший у світі NFT zkGAN.

3.3 Програми генеративного штучного інтелекту

Як згадувалося раніше, оскільки гра сама по собі є індустрією контенту, AI-Agent може генерувати велику кількість контенту за короткий час і з низькими витратами, включаючи створення невизначених, динамічних ігрових персонажів і так далі. Таким чином, генеративний штучний інтелект ідеально підходить для ігрових додатків. В даний час застосування генеративного ШІ в сфері ігор можна звести до наступних основних типів:

  1. **Клас ігрових персонажів, згенерований штучним інтелектом: наприклад, гра проти ШІ, або ШІ відповідає за симуляцію та контроль NPC у грі або навіть безпосередньо використовує ШІ для генерації персонажів. **
  2. **Клас ігрового контенту, створеного штучним інтелектом: різноманітний контент, безпосередньо створений штучним інтелектом, наприклад місії, сюжетні лінії, реквізит, карти тощо. **
  3. **Клас ігрової сцени, згенерованої штучним інтелектом: підтримує автоматичне використання, оптимізацію або розширення місцевості, ландшафту та атмосфери ігрового світу за допомогою штучного інтелекту. **

3.3.1 Ролі, створені штучним інтелектом

Приклад 1: MyShell

MyShell — це платформа для створення ботів, яка дозволяє користувачам створювати власних ботів для спілкування в чаті, практики говоріння, ігор і навіть звернення за консультацією відповідно до своїх потреб. Тим часом Myshell використовує технологію перетворення тексту в мову (TTS), яка автоматично створює бота, який імітує голос будь-кого всього за кілька секунд. Крім того, MyShell використовує Auto, який дозволяє користувачам навчати моделі LLM, лише описуючи свої ідеї, закладаючи основу для приватних великих мовних моделей (LLM).

Користувачі Myshell кажуть, що його функція голосового чату дуже плавна, швидша, ніж голосовий чат GPT і Live2D.

Кейс 2: AI Arena**

AI Arena — це бойова гра зі штучним інтелектом, у якій користувачі можуть використовувати модель LLM для постійного тренування власних бойових ельфів (NFT), а потім відправляти навчених бойових чарівників на битви на полі бою PvP/PvE. Бойовий режим схожий на Nintendo Star Smash Bros., але з навчанням штучного інтелекту, що додає більше змагального задоволення.

Paradigm очолила інвестиції в AI Arena, які зараз розпочалися у фазі відкритого бета-тестування, де гравці можуть безкоштовно увійти в гру або придбати NFT для підвищення інтенсивності тренувань.

Приклад 3: Ліла проти світу**

Leela vs the World — шахова гра, розроблена Mudulas Labs. У грі двома сторонами гри є ШІ та люди, а ситуація шахової партії розміщується в контракті. Гравці оперують (взаємодіють з контрактами) через свої гаманці. Штучний інтелект зчитує нову ситуацію з шаховою партією, виносить судження та генерує zkp для всього процесу розрахунку, обидва з яких завершуються в AWS Cloud, а zkp перевіряється контрактом у ланцюжку, і після успішної перевірки шаховий контракт викликається для «гри в шахи».

3.3.2 Ігровий контент, створений штучним інтелектом

Кейс 1: AI Town

AI Town — це співпраця між a16z та її портфельною компанією Convex Dev, натхненна документом Stanford University Generative Agent. AI Town — це віртуальне місто, де кожен штучний інтелект у місті може побудувати власну історію на основі взаємодії та досвіду.

При цьому використовуються такі технологічні стеки, як безсерверний фреймворк Convex backend, векторне сховище Pinecon, аутентифікація клерка, генерація тексту природною мовою OpenAI та розгортання Fly. Крім того, AI Town має відкритий вихідний код і дозволяє внутрішньоігровим розробникам налаштовувати різні компоненти, включаючи дані функцій, таблиці спрайтів, візуальне середовище Tilemap, підказки щодо генерації тексту, правила гри та логіку тощо. На додаток до звичайних гравців, які можуть випробувати AI Town, розробники також можуть використовувати вихідний код для розробки різноманітних функцій у грі та навіть поза нею, і ця гнучкість робить AI Town придатною для безлічі різних типів програм.

Тому AI Town сама по собі є контент-грою, створеною штучним інтелектом, але це також екологія розвитку і навіть інструмент розробки.

Випадок 2: Павло

Пол — це генератор історій зі штучним інтелектом, який спеціалізується на наданні шляху рішення для повноланцюгових ігор, щоб генерувати історії зі штучним інтелектом і переходити безпосередньо до ланцюга. Логіка реалізації полягає в тому, щоб ввести велику кількість попередніх правил в LLM, а потім гравець може автоматично генерувати вторинний контент на основі правил.

В даний час існує протокол гри Straylight, опублікований за допомогою Пола Зайдлера, Straylight - це багатокористувацька гра NFT, основним геймплеєм є повноланцюгова версія гри "Minecraft", гравці можуть автоматично карбувати NFT, а потім будувати свій власний світ відповідно до основних правил введення моделі.

3.3.3 Ігрові сцени, створені штучним інтелектом

Кейс 1: Pahdo Labs

Pahdo Labs — це студія розробки ігор, яка зараз працює над Halcyon Zero, платформою для створення аніме, фентезі, рольових ігор та онлайн-ігор, побудованою на движку Godot. Дія гри відбувається в ефірному фентезійному світі, зосередженому навколо галасливого міста, яке служить соціальним центром.

Що робить цю гру особливою, так це те, що гравці можуть використовувати інструменти створення штучного інтелекту, надані грою, щоб швидко створювати більше фонів із 3D-ефектами та залучати своїх улюблених персонажів у гру, що справді надає інструменти та ігрові сцени для популярної гри UGC.

Випадок 2: Каедім

Kaedim розробив інструмент генерації 3D-моделей на основі генеративного штучного інтелекту для Game Studio, який може швидко допомогти Game Studio створювати внутрішньоігрові 3D-сцени/ресурси, які відповідають їхнім потребам. Загальний продукт Kaedim все ще знаходиться на стадії розробки і, як очікується, буде доступний для Game Studio у 2024 році.

Основна логіка продуктів Kaedim точно така ж, як і у AI-Agent, використовуючи загальну велику модель як основу, а потім художники в команді продовжуватимуть вводити хороші дані, а потім зворотний зв'язок із результатами Агента, безперервно навчатимуть модель за допомогою машинного навчання і, нарешті, дозволять AI-Agent виводити 3D-сцени, які відповідають вимогам.

04 Підсумок

У цій статті ми зробили детальний аналіз та резюме застосування ШІ у сфері ігор. Загалом, у майбутньому з'являться проєкти-зірки-єдинороги загальних моделей та застосування генеративного ШІ в іграх. Незважаючи на те, що рів підвісних аплікацій низький, перевага першопрохідця сильна, і якщо на перевагу першопрохідця можна покластися для створення мережевих ефектів і підвищення прихильності користувача, простір для уяви величезний. Крім того, генеративний ШІ, природно, підходить для індустрії контенту ігор, і вже є багато команд, які пробують застосування GA в іграх, і цей цикл з великою ймовірністю з'явиться популярною грою з використанням GA.

Крім деяких напрямків, згаданих у статті, у майбутньому є й інші ракурси розвідки. Наприклад, що:

(1) Доріжка даних + прикладний рівень: Доріжка даних штучного інтелекту породила деякі проєкти-єдинороги, які оцінюються в мільярди доларів, і зв'язок дані + прикладний рівень також сповнений уяви.

(2) Інтеграція з Socialfi: наприклад, забезпечення інноваційних способів соціальної взаємодії; Використовуйте AI Agent для оптимізації автентифікації особистості спільноти та управління спільнотою; Або розумніші персоналізовані рекомендації тощо.

(3) З автоматизацією та зрілістю агентів, чи будуть головними учасниками автономного світу люди чи боти? Чи можливо, що автономний світ у ланцюжку може бути схожим на Uniswap, де 80%+ DAU — це боти? Якщо так, то агенти управління в поєднанні з концепціями управління Web3 також варто вивчити.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити