Від симуляції до інновацій: чому AI навчається в іграх?

Ван Шу Докторант дослідницького інституту Tencent

Meng Jingzhi Стажер дослідницького інституту Tencent

Джерело зображення: створено інструментом Unbounded AI

13 липня журнал «Science» опублікував статтю під назвою «Ігри продовжують стимулювати розвиток і прогрес штучного інтелекту», в якій детально обговорювався взаємозв’язок між іграми та штучним інтелектом і вважався, що «ігри є багатообіцяючим полем застосування для загального Використання ігор як платформи для вивчення штучного інтелекту має безпосередню користь для світової індустрії відеоігор вартістю 200 мільярдів доларів». [1]

Отже, який зв’язок між іграми та штучним інтелектом, як ігри сприяють розвитку та прогресу штучного інтелекту та який вплив вони матимуть на життя людей?

Синергія та симбіоз: ігри та штучний інтелект доповнюють одне одного

Озираючись на всю історію розвитку інформатики чи інформатики, неважко виявити, що ігри майже проходять через увесь процес розробки досліджень штучного інтелекту, і кожен важливий прорив у галузі штучного інтелекту тісно пов’язаний з іграми. Раніше Дослідницький центр філософії ігор Університету Сямень обговорював зв’язок між іграми та розвитком штучного інтелекту на трьох рівнях: теорії, апаратному забезпеченні та додатку. [2] :

**Гра надихає теорію штучного інтелекту та допомагає дослідженням і розробкам штучного інтелекту. **Від Шеннона, батька інформації, який почав вивчати штучний інтелект із шахами як об’єктом у 1950 році, до Семюела, піонера штучного інтелекту, винайшов алгоритми навчання з підкріпленням на основі шашок. Настільні ігри, такі як шахи та шашки, довгий час вважалися «плодовими мушками досліджень штучного інтелекту», тобто недорогим, зрозумілим засобом для швидкої перевірки проблем. Сьогодні стрімкий розвиток ігрової індустрії безпосередньо сприяє процвітанню теоретичних досліджень штучного інтелекту. З 1971 по 2015 рік кількість досліджень штучного інтелекту, пов’язаних з іграми, становила менше 1000. Однак після того, як у 2015 році AlphaGO переміг триразового чемпіона Європи з Го Фан Хуея, дослідження штучного інтелекту, пов’язані з іграми, різко зросли. до 2022 За 7 років 2019 кількість відповідних статей досягла 1625, з них 17 статей стали титульними статтями «Nature» і «Science». [3]

**Гра сприяє інноваційній ітерації обчислювальної інфраструктури штучного інтелекту GPU (графічна відеокарта). **Як приклад компанії Nvidia, що займається виробництвом чіпів, судячи зі змін у доходах і загальному доході від ігор і центрів обробки даних Nvidia з 1995 по 2022 рік, майже весь дохід Nvidia в перші дні надходив від ігрового бізнесу, і Nvidia, покладаючись на ігровий бізнес, завершили накопичення коштів і побудували технічні бар’єри для нарощування сил для подальшої трансформації. Сьогодні Nvidia швидко стала лідером чіпів зі штучним інтелектом завдяки багатому накопиченню технологій у ігрових графічних картах і великим інвестиціям у дослідження та розробки. Наразі Nvidia займає 95% ринку чіпів для навчання AI. [4] . Багато технологій, накопичених ігровими відеокартами, також стали ключовими базовими можливостями графічних процесорів NVIDIA та застосовуються в інших сферах, таких як автономне водіння, медичне обслуговування, науки про життя, енергетика, фінансові послуги та виробництво.

**Ігри забезпечують штучний інтелект із керованим навчальним середовищем і чіткими стандартами вимірювання. **Гра містить цілі, правила та завдання, а процес вирішення завдань відображає інтелект. Тому, створюючи програму, яка може завершити певну гру, можна припустити, що ця програма певною мірою буде володіти якимось «людським» «інтелектом». З одного боку, гра має багаті сцени взаємодії між людиною та комп’ютером і стабільні та контрольовані правила, які можуть вирішити проблему відсутності сцен дослідження штучного інтелекту. З іншого боку, ігри забезпечують чіткі стандарти вимірювання штучного інтелекту, а можливість оцінювати штучний інтелект за допомогою чітких і кількісно визначених правил в іграх може значно підвищити ефективність ітерації та тестування технологій.

Разом із технологічними ітераціями та інноваціями в додатках все більше підприємств, університетів і науково-дослідних установ почали проводити інноваційні дослідження штучного інтелекту на основі ігор. Дослідження штучного інтелекту в іграх від самого початку були спрямовані на створення людських інтелектуальних тіл і досягнення конфронтації з людьми в ідеальному інформаційному/недосконалому інформаційному середовищі (такому як штучний інтелект AlphaStar на основі «StarCraft 2», штучний інтелект на основі «DOTA2»). ") Інтелектуальний OpenAIFive тощо), розширений, щоб зосередитися на автоматичній генерації різноманітного вмісту в грі (віртуальному середовищі), щоб ще більше покращити взаємодію людини з комп’ютером. Не так давно, на Всесвітній конференції зі штучного інтелекту 2023 року, низка університетів спільно запустила «Спільний дослідницький центр ігрового штучного інтелекту університету», зосередившись на зв’язку між іграми та індустрією штучного інтелекту.

Від простих правил до складних симуляцій: люди вчать ШІ «ходити та бігати»

Серед багатьох досліджень штучного інтелекту в іграх, які зосереджуються на інтерактивному досвіді, типовим є створення дій інтелектуальними агентами. Агент — це віртуальний або реальний об’єкт, керований машиною, який може діяти та реагувати відповідно до різних внутрішніх і зовнішніх умов. Типовим представником є некерований гравцем персонаж (NPC) у грі. Технологія генерації рухів інтелектуального тіла в основному вивчає, як зробити поведінку розумного тіла такою ж плавною та природною, як справжня людина, і ще більше покращити досвід взаємодії людини з комп’ютером. Якщо області комп’ютерного зору та обробки природної мови в дослідженнях штучного інтелекту зосереджені на можливостях розуміння зображення, тексту та мови відповідно, то генерація дій агента відповідає області штучного інтелекту для контролю поведінки та дій.

Історично розвиток технології генерації дій пройшов процес від простих правил до складної симуляції, від найдавнішого кінцевого автомата до алгоритмів узгодження руху, а потім до генерації дій на основі машинного навчання. Моделюючи дії людини, агенти поступово навчаються Walk і біжи як людина.

(1) Генерація дії на основі відповідності правил

  1. Генерація дії на основі кінцевого автомата

У віртуальному середовищі різноманітні дії агента, такі як ходьба, біг, стрибки, напад тощо, розглядаються як різні стани. Ранні розробники зазвичай використовують «кінцевий автомат» для керування поведінкою агента, об’єднуючи різні дії агента відповідно до різних умов. Перевагою цього підходу є те, що можна чітко визначити правила переходу між станами, наприклад, стан ходьби можна трансформувати в біг або стрибки. На малюнку нижче показано кінцевий автомат, який використовує агент у грі.

Рисунок 1. Принципова схема кінцевого автомата в грі [5]

Неважко виявити, що перевага цього підходу полягає в тому, що він може чітко визначити правила переходу між станами, наприклад, стан ходьби можна трансформувати в біг або стрибки; обмеження полягає в тому, що може бути важко мати справу зі складними поведінкові взаємодії та передбачити майбутні зміни стану. Розробка та обслуговування кінцевого автомата може стати надзвичайно складним і займати багато часу для дуже складних систем через потребу в рукописній логіці для переходу з одного вузла на інший.

  1. Генерація дії на основі узгодження руху

Щоб усунути обмеження застосування кінцевої машини, вчені в галузі штучного інтелекту почали досліджувати більш ефективні рішення для генерації руху, і з’явилася технологія відповідності руху (Motion Matching). У порівнянні з кінцевим автоматом ця технологія більше не потребує вручну з’єднувати різні сегменти даних захоплення руху, а використовує дані захоплення руху для створення бази даних пози дії, а також вибирає та змішує найбільш підходящі сегменти руху в режимі реального часу відповідно до поточного стану. і цільовий стан агента. У результаті можна реалізувати більш складний і тонкий контроль анімації відповідно до стану персонажа та факторів навколишнього середовища в реальному часі, щоб розумне тіло могло представити більш природний і плавний ефект руху.

Рисунок 2. Схематична діаграма процесу узгодження за Мотіном [6]

Звичайно, технологія узгодження руху також має певні обмеження на практиці. Наприклад, під час її використання потрібно зберігати всі дані анімації в пам’яті, що займає багато пам’яті; усі анімації є наявним вмістом у базі даних, який неможливо реалізувати Інновації в анімації руху. Навіть у «Red Dead Redemption 2», який робить NPC достатньо реалістичними, він реалізує лише «спортивне зіставлення». Незважаючи на те, що в грі розроблено сотні різних анімацій для коня, і є навіть сотні різних звуків для дихання, це не справжній інтелект, а складено величезними правилами кінцевої машини та ресурсами анімації.

(2) Генерація дій агента на основі машинного навчання

Незалежно від того, базується він на кінцевій машині чи технології узгодження руху, він не реалізував справжню інтелектуальну генерацію дій по суті, і існують проблеми складної системи та великих втрат у процесі посадки. Отже, чи є спосіб додати скільки завгодно даних про дії під час навчання моделі, і немає потреби поміщати ці додаткові дані в пам’ять під час запуску гри?

З цією метою академічні кола та індустрії в країні та за кордоном провели багато досліджень, намагаючись реалізувати автоматичне генерування інтелектуальних дій тіла на основі машинного навчання. За кордоном американська компанія EA у 2021 році розробила технологію HyperMotion, яка значно покращила реалістичність і швидкість відгуку інтелектуальних рухів тіла в іграх серії FIFA. Технічне рішення спочатку використовує технологію захоплення руху для захоплення понад 8,7 мільйона кадрів даних руху 22 професійних футболістів у грі, а потім використовує алгоритми машинного навчання для постійного навчання з 8,7 мільйонів кадрів даних і, нарешті, реалізує реальні -час руху розумного тіла в грі генерувати. [7]

У Китаї з 2019 року Tencent намагається застосувати модель саморегресивної нейронної мережі (ARNN) до рішення агента для генерації дій і досягла проривного прогресу. ARNN — це алгоритм машинного навчання, який широко використовується для аналізу та обробки даних часових рядів і часто використовується в таких сценаріях, як прогноз погоди та фондового ринку. Якщо його можна використовувати в полі дії, можна буде захопити велику кількість реальних людей і ввести дані для навчання, дозволити моделі AI передбачити наступний кадр кадру послідовності дій і, нарешті, створити повний і природна дія узгоджено.

Щоб досягти цієї мети, у 2019 році команда «Reverse Battle Mobile Games» студії Tianmei J3 об’єдналася з лабораторією Tencent RoboticsX, базуючись на дослідженні моделі ARNN, відкрила та поступово завершила передову технологію в області ігор та роботів - дослідження та розробки "технології створення дій для розумного тіла". Ця технологія заснована на принципі моделі ARNN, вивчає дані захоплення руху та використовує керовані даними адаптивні алгоритми, щоб дозволити NPC або роботам автоматично генерувати дії, реакції та вирази, які більше нагадують справжні істоти відповідно до різних зовнішніх реакцій, таких як як дії гравців або зміни середовища.

Рисунок 3 Принципова схема технології генерації дії агента

Цей набір технологічних рішень для генерації дій на основі ARNN, запропонованих командою антивоєнних мобільних ігор Tencent, досяг багатьох проривів у галузі:

По-перше, щоб реалізувати алгоритм авторегресійної нейронної мережі, дослідники створили повний ланцюжок інструментів з нуля та створили повний виробничий конвеєр за допомогою таких етапів, як захоплення руху, попередня обробка анімації, навчання та налаштування. Щоб вирішити проблеми синхронізації мережі та оптимізації продуктивності, які можуть виникнути, коли ця технологія використовується на мобільному терміналі, команда застосувала технологію узгодження траєкторії, технологію злиття анімації та відповідні рішення на рівні алгоритму, що значно покращило загальну продуктивність і зменшило нейронні зв’язки. продуктивність мережі Затрати пам'яті для висновку.

По-друге, дослідницька група співпрацювала з лабораторією Tencent RoboticsX, щоб застосувати технологію інтелектуальної генерації руху тіла до чотириногого робота, щоб допомогти йому реалізувати інтелектуальний контроль і приймати рішення, а також значно підвищити ефективність навчання. У застосуванні самого алгоритму цей набір технологій може допомогти роботам покращити свої здібності до мислення, допомогти роботам приймати автономні рішення та автоматично генерувати дії, реакції та вирази, які більше схожі на реальних істот на основі зовнішніх реакцій. Під час безперервних досліджень і тренувань, після довгих симуляційних тренувань, робот, оснащений цією технологією, навчився рухам справжніх собак, таким як ходьба, біг, стрибки, стояння тощо, і може гнучко використовувати ці пози для завершення повзання, подолання перешкод. біг, перешкода паркур човник між об’єктами та інші завдання; навіть якщо ви зіткнулися з перешкодою, про яку ви заздалегідь не знаєте, ви можете ухилитися від неї за допомогою світлового спалаху, спритно уникати її, самостійно змінювати траєкторію та використовувати різні плани маршруту, щоб виконати поставлену мету (як показано на малюнку нижче). [8]

Рисунок 4 Мультимодальний чотириногий робот власної розробки Tencent

Від імітації до трансцендентності: ігровий штучний інтелект впливає на реальний світ

На основі ігрового середовища люди навчили штучний інтелект, як краще досягати «ходьби та бігу» у віртуальному середовищі, але значення досліджень штучного інтелекту в іграх на цьому не закінчується. Як зазначено в статті журналу Science, «Прогрес штучного інтелекту в іграх також стане важливим кроком до більш потужних і гнучких систем штучного інтелекту, що працюють у реальному світі».** Вісімнадцять бойових мистецтв, навчених штучним інтелектом шляхом «імітації» у грі є універсальні характеристики та значення, які можна перенести в різноманітні реальні проблеми та сценарії. **

На практиці наукових кіл та індустрії в країні та за кордоном дослідники з науково-дослідних установ і підприємств також намагаються застосувати більше технологій штучного інтелекту в іграх в інших сферах, використовувати ігровий ШІ для підключення реальної економіки та формування цифрової продуктивності в інших сферах:

У сфері медичної діагностики пов’язані технології ігрового штучного інтелекту також використовуються в медичних дослідженнях і клінічній практиці та в інших сферах медицини та охорони здоров’я, включаючи персоналізований скринінг, діагностику, прогноз, моніторинг, моделювання ризиків, відкриття ліків і прогнозування відповіді на лікування тощо. . Технологія штучного інтелекту в іграх надає ефективну підтримку, особливо для підвищення швидкості та точності ідентифікації та діагностики захворювань. Ігрова технологія штучного інтелекту також може симулювати віртуальну сцену стану або операції пацієнта за допомогою історичних даних, надавати підтримку для прийняття медичних рішень за допомогою навчання з підкріпленням, а також робити можливими хірургічні операції за допомогою роботів.

У сфері освітньої діяльності ігровий штучний інтелект також має великий потенціал застосування. З одного боку, люди можуть посилатися на результати досліджень ігрового штучного інтелекту для створення або вдосконалення нових форм навчальної діяльності, таких як «Ігрове навчання» та «Гейміфікація в освіті», щоб покращити традиційний навчальний процес. унікальні елементи та механізми гри в гру для досягнення мети покращення ефекту навчання; з іншого боку, люди також можуть використовувати ігрові середовища, такі як "My World", "StarCraft" і "Glory of the King" щоб допомогти здійснити навчальну діяльність зі штучного інтелекту (насправді майже неможливо проводити навчальну діяльність із закріпленням без ігрового середовища). [9]

Передбачається, що в наступний період часу виведення технології штучного інтелекту з ігрового середовища стане основним напрямком застосування. Ми також очікуємо, що ігровий штучний інтелект може сприяти інноваціям і розвитку всіх сфер життя після того, як він вийде з віртуального світу.

Дякуємо багатьом експертам із Tencent Tianmei J3 Studio за їхні поради під час написання цієї статті.

Довідкове джерело:

[1] Wurman, P R., Stone, P., & Spranger, M (2023) Покращення штучного інтелекту за допомогою ігор. Наука, 381 (6654), 147-148.

[2] Дослідницький центр філософії ігор Університету Сямень та ін. «Звіт про спостереження індустрії ігрового штучного інтелекту»

[3] Останнє дослідження команди Китайської академії наук: ігрові технології стали важливою рушійною силою для інновацій і розвитку штучного інтелекту.

[4] Від ігор до прискорення AI: Nvidia ліворуч, AMD праворуч.

[5] Холден, Деніел «Керування символами за допомогою нейронних мереж і машинного навчання».

[6] Холден, Деніел «Керування символами за допомогою нейронних мереж і машинного навчання».

[7] Технологія Hypermotion FIFA22

[8] Останні розробки щодо роботів Tencent: вчіться «бігати та стрибати» у справжніх собак

[9] Дослідницький центр філософії ігор університету Сямень «Звіт про розвиток штучного інтелекту в іграх за 2023 рік»

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити