Іноземний майстер використовував ChatGPT, щоб впровадити самосвідомість у агентів ШІ. Лаура, яка породила «життя», прокинулася і почала самостійно проходити рівні в «Tomb Raider».
Якими були б відеоігри, якби вдихнули життя в ігрових персонажів?
У минулому такою була уява багатьох людей, але тепер, із розвитком агентів ШІ, ця уява почала втілюватися в реальність.
Нещодавно YouTube-автор Foxmaster зняв оригінальне відео класичної гри "Tomb Raider".
А героїня Лаура насправді є агентом ШІ, який може керувати її персонажем!
Можна сказати, що за допомогою різних інструментів ШІ, таких як машинне бачення, позиціонування, розпізнавання об’єктів, анімація, текст і голос, Foxmaster впровадив цифрове життя в ігрових персонажів.
Буквально кілька днів тому Stanford Smart Body Town, який вибухнув у спільноті AI, був офіційно відкритий. 25 агентів штучного інтелекту зі своїми власними індивідуальностями живуть, працюють і знаходять друзів у віртуальному містечку-пісочниці, такому як «Західний світ».
Тож, можливо, це майбутнє відеоігор?
Героїня «Розкрадачки гробниць» має свідомість
Концепція створення віртуального штучного інтелекту, який може грати в ігри, вже поширена. Однак Formaster хотів зробити так, щоб цей персонаж почувався справжньою людиною.
Тому він вибрав гру «Розкрадачка гробниць», головна героїня гри, Лаура, є персонажем із сильною індивідуальністю та чітко окресленим характером.
І Формасте сподівається, що ця особистість вплине на кінцевий результат гри.
Як зробити так, щоб ця агентка зі штучним інтелектом Лара Крофт по-справжньому усвідомлювала себе в грі?
Після вивчення наступних кроків Formaster нарешті досяг успіху.
Вивчіть правила гри
Перший крок — попросити її вивчити правила гри. "Tomb Raider" дав підручник, який пояснює весь процес управління грою.
Автор попросив Лару потренуватися у вказаний спосіб і виконати підручники на кожному етапі, як гравець.
Підручник закінчується, коли Лара залишає пул, тому програму можна перезапустити на цьому етапі, щоб внести покращення.
На початку покращити Лару було дуже важко.
Іноді вона здається розгубленою, навмання ходить по карті, а іноді навіть застрягає на панелі меню, знову і знову дивлячись на свій компас.
Щоб вирішити цю проблему, автор переналаштував основні годинник на віртуальній машині і прискорив процес гри в 40 разів. Цей метод спрацював, і агент штучного інтелекту нарешті завершив підручник за відносно вдалий час.
Однак була проблема: Лара часто застрягала в одному місці, а кожен рівень складався зі статичних елементів, тому був лише один шлях оптимізації.
Це може змусити її просто знати, якими шляхами не слід йти, замість того, щоб придумати більш цілісний підхід до проблеми. Але автор сподівається, що Лара навчиться самостійно відкривати процес дослідження.
Враховуючи, що єдині знання, якими володіла Лара, це те, що відображалося на екрані для кожного рівня, автори спостерігали за поведінкою гравців-людей, які ніколи не грали в гру.
Хтось прочитає весь підручник, а хтось спочатку дослідить навколишнє середовище, і різниця в цьому виборі визначається «особистістю» різних людей.
Лара повинна навчитися саме такому ставленню.
визначте роль
Щоб встановити зв’язок з Ларою для AI, необхідно дати AI зрозуміти, що вона є купою пікселів. Після того, як люди-гравці увійшли в гру, у них раптово з'явилася така свідомість.
У зв'язку з цим автор записав 24 години відео Лари, яка рухається в різних напрямках під різними кутами, щоб агент ШІ міг розпізнати будь-якого персонажа.
Як самокерований автомобіль, здатний знімати 24 години відео зі швидкістю 30 кадрів на секунду, у результаті чого створюється 2 592 000 еталонних зображень для розпізнавання дорожніх знаків.
Спочатку автори відстежують головні пікселі голови, а потім головні пікселі тіла, щоб вибрати відповідні регіони.
Щоб переконатися, що Лара була присутня на кожному зображенні, автори попросили програму ідентифікувати зображення, які не містять жодних відблисків.
Коли Лара займає весь екран або коли на її шляху стоїть двовимірний об’єкт, автор використовує візуальне захоплення ШІ, щоб допомогти ідентифікувати Лару, і результати виявляються достатньо точними, щоб ідентифікувати персонажа на екрані.
Взаємодія з навколишнім середовищем
Як тільки ви зможете впізнати Лару, вам потрібно змусити ШІ взаємодіяти з навколишнім середовищем.
Усе середовище гри складається з однакових блоків, автор імпортує їх на куб, потім знімає середовище з усіх боків, а потім запускає процес розпізнавання, щоб агент AI міг розпізнати середовище, як процес людей-гравців, які інтерпретують зображення.
Ділянки, виділені червоним, є нерозпізнаними текстурами. Однак штучному інтелекту все ще не вистачає усвідомлення бажання кудись потрапити, і йому потрібно знати, як далеко це місце від оточення.
Цікаво, що ці нерозпізнані області зазвичай розташовані подалі від Лари або закриті іншими 2D-об’єктами.
Коли ми спостерігаємо за поведінкою людей-гравців і бачимо це зображення, ми можемо відразу зрозуміти, що область, на яку вказує стрілка, є входом.
Ми можемо не знати розміру наступної кімнати, але ми знаємо, що вона існує.
Однак це також може бути оптична ілюзія. Коли ми йдемо на переїзд, текстура вхідної зони відрізняється від інших місць, що характерно для 3D-простору.
Тому агент ШІ повинен навчитися рухатися і порівнювати. За допомогою обчислень можна використовувати кілька зображень, щоб визначити, які текстури мають найменшу варіацію розміру.
Тут ви можете використовувати площу основних полігонів, і вони змінюються в основному на основі ймовірності, пропорційної відстані між собою.
### УЯВИ
Тепер, коли ШІ знає, де вона знаходиться, вона повинна вирішити, куди вона хоче йти далі.
Розпізнаючи текстури, можна доставити її в певне місце, однак для навігації рівнем потрібно щось простіше.
Найшвидший спосіб зробити це — спростити контраст і визначити раптові зміни освітленості в певній області. Однак люди-гравці не обов’язково ходять у ці місця.
Коли є кілька отворів, AI повинен проявити достатній інтерес, але не викликати її смерть.
Наприклад, якщо яма занадто глибока, неможливо стрибнути в неї, не схопившись за навколишні виступи. Якби там була вода, можливо, варто було б ризикнути.
Людина-гравець знає, коли стрибнути, але напрямок дій Лари випливає з підручника, він повинен точно оцінити, скільки блоків між ним і ціллю, чи повинен він набрати обертів і чи повинен він зробити паузу, перш ніж відпустити .
Коротше кажучи, вона повинна робити точні оцінки, як людина.
Якби вона заздалегідь знала розмір ями, то бігла б дуже швидко, що не відповідає нашим очікуванням.
Щоб вона могла зібрати більше інформації про навколишнє середовище, автор заохочує ШІ, якщо є сумніви, він повинен повернути камеру, щоб зібрати більше інформації.
Але насправді навіть тоді ШІ міг застрягти в кімнаті.
Щоб спонукати її вийти з кімнати, автор додав деякі правила колекції.
Наприклад, щоразу, коли вона стикається з текстурою, яку ніколи не бачила раніше, ця область стає пріоритетною, їй доводиться рухатися таким чином, щоб збільшити розмір цієї текстури на екрані.
Таким чином вона може просуватися лише через рівень. Оскільки на кожному рівні є унікальні текстури, єдиний спосіб розблокувати їх — це перейти на наступний рівень.
Таким чином, Лара постійно аналізує те, що вона бачить на екрані – текстури різних поверхонь, вона рухає своїм тілом і визначає нові точки інтересу (тобто текстури, яких ще немає в каталозі).
У цьому процесі вона продовжить перевірку, щоб знайти відсутню текстуру.
спорт
Однак навіть із зазначеними вище вдосконаленнями ШІ все ще занадто роботизований, і схема дій очевидна.
Щоб покращити його, автори знову спостерігали за людьми-гравцями.
Що визначає те, як гравець-людина діє в грі? Це наша пам'ять, ми пам'ятаємо, як складаються дії.
Тому цей процес також має бути вбудований у ШІ, оскільки Лара має знати про свої власні спортивні здібності.
Для цього автор щосекунди зберігає дії ШІ, щоб навчити його, а потім додає правило, яке дозволяє йому виконувати ці збережені дії одночасно.
Таким чином рухи ШІ стають набагато плавнішими.
Крім того, оскільки час відновлення кожної дії відомий, це запобігає ШІ виконувати непотрібні дії, залишаючись активним.
На зображенні нижче вогонь знову активізується так швидко, що потрібен великий стрибок, щоб перебратися.
На щастя, ці канали візуально спрощені, і їх легко визначити по краях блоків.
ШІ знає, що Лара завжди зробить правильний стрибок, коли активується перша частина блоку, як це зрозуміє гравець-людина.
Інструмент ChatGPT
Далі необхідно вселити агенту ШІ особистість Лари. Особистість заснована на досвіді та пам'яті, і поєднання цих факторів визначає характер Лари.
Відповідно до сеттингу гри, вона відомий археолог, який ніколи не боїться ризикувати і готовий приймати доручені гірські завдання без винагороди, все з любові.
Крім того, Лара дуже багата і щойно переїхала в особняк з дуже елегантним внутрішнім оздобленням і кімнатою для тренувань у будинку. Вона також дуже добре навчає, плаває, скелелазіть і має дуже сильну витривалість.
Коли вона стикається з небезпекою під час своєї пригоди, вона може залишатися спокійною та дуже сміливою та без вагань допоможе своїм супутникам.
Зіткнувшись з облогою вовків, вона влучно стріляє з рушниці, а також може вбити небезпечних вовків кинджалом. Єдине, від чого вона відмовилася, це силоміць відкрити замок.
Усе перераховане вище — це особистість Лари, отримана з налаштувань гри.
Далі — автентично прокоментувати все, що вона бачить, для чого автор зібрав риси особистості Лари в базу даних.
Для того, щоб коментар мав сенс реальної ситуації, програма повинна співвіднести зображення гри з чимось, що можна ідентифікувати в реальному житті.
Для зображень, які зазвичай мають менше деталей текстури, можна використати зворотний пошук зображень Google, щоб знайти їх.
Тому, коли агент AI виявляє досить велику текстуру, він починає пошук.
Щоб розпізнавати слова, автори скопіювали всю сторінку в ChatGPT. Після цього ChatGPT пропонується класифікувати його на основі кількості входжень, перш ніж додати розпізнане слово до списку.
Нарешті, ChatGPT попросили скласти речення на основі цих слів, враховуючи особистість Лари.
При цьому я хочу, щоб ChatGPT дійсно коментував те, що Лара бачила в реальному житті.
Наприклад, якщо текстура ідентифікована як морський лев, ChatGPT може зробити коментар, пов’язуючи морського лева з рисами особистості Лари.
Загалом особистість агента Lara встановлюється через ChatGPT за допомогою різних атрибутів, таких як «хоробрий», «дружній» або «розумний».
У грі всі предмети, які Лара сприймає та коментує, проходитимуть через цей фільтр особистості, і Лара відповідатиме відповідно до встановленої особистості.
Наприклад, для тюленя вище Лара згадає скам’янілості морських левів або чудову здатність плавати, і не коментуватиме це в цирку.
Користувач мережі: інтелектуальне тіло ШІ перетворює відеоігри на витвори мистецтва
Деякі користувачі мережі сказали, що це один із найкрутіших і найприродніших способів розвитку персонажів. Коли персонажі оживають, ви можете справді відчути відеогру як витвір мистецтва.
«Те, як вона розмовляє та аналізує оточення, просто чарівне. Надавши боту штучного інтелекту можливість коментувати її оточення, незалежно від того, наскільки воно хороше насправді, створює відчуття, що вона справжня людина».
"Це захоплююче. Її відсторонена цікавість і нотка химерності страшенно схожі на те, яким, на мою думку, буде внутрішній монолог Лари".
Зважаючи на це, мене дивує, що її діалог відповідає її діям.
Це створює відчуття, ніби штучний інтелект, який пише діалог, і штучний інтелект, який керує персонажами, — одна й та сама особа.
Не так давно, коли Stanford AI Intelligent Body Town відкрив вихідний код, користувачі мережі були дуже схвильовані, думаючи, що AGI прийшов, і різні рольові ігри та симулятори незабаром використовуватимуть цю технологію.
А тепер Foxmaster поєднує ChatGPT, комп’ютерний зір і розпізнавання об’єктів, щоб зробити відеоігри цікавішими.
Можливо, у майбутньому персонажі відеоігор зможуть отримати глибші, гнучкіші особистості, швидше реагувати на навколишнє середовище та багато інших змін, про які ми навіть не можемо уявити.
Література:
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
AI генерує самосвідомість, «Розкрадачка гробниць» Лаура пробуджується! Революція відеоігор тут
Джерело статті: Xinzhiyuan
Редагувати: Еней Пічіс
Якими були б відеоігри, якби вдихнули життя в ігрових персонажів?
У минулому такою була уява багатьох людей, але тепер, із розвитком агентів ШІ, ця уява почала втілюватися в реальність.
Нещодавно YouTube-автор Foxmaster зняв оригінальне відео класичної гри "Tomb Raider".
А героїня Лаура насправді є агентом ШІ, який може керувати її персонажем!
Буквально кілька днів тому Stanford Smart Body Town, який вибухнув у спільноті AI, був офіційно відкритий. 25 агентів штучного інтелекту зі своїми власними індивідуальностями живуть, працюють і знаходять друзів у віртуальному містечку-пісочниці, такому як «Західний світ».
Тож, можливо, це майбутнє відеоігор?
Героїня «Розкрадачки гробниць» має свідомість
Концепція створення віртуального штучного інтелекту, який може грати в ігри, вже поширена. Однак Formaster хотів зробити так, щоб цей персонаж почувався справжньою людиною.
Тому він вибрав гру «Розкрадачка гробниць», головна героїня гри, Лаура, є персонажем із сильною індивідуальністю та чітко окресленим характером.
І Формасте сподівається, що ця особистість вплине на кінцевий результат гри.
Після вивчення наступних кроків Formaster нарешті досяг успіху.
Вивчіть правила гри
Перший крок — попросити її вивчити правила гри. "Tomb Raider" дав підручник, який пояснює весь процес управління грою.
Автор попросив Лару потренуватися у вказаний спосіб і виконати підручники на кожному етапі, як гравець.
Підручник закінчується, коли Лара залишає пул, тому програму можна перезапустити на цьому етапі, щоб внести покращення.
На початку покращити Лару було дуже важко.
Іноді вона здається розгубленою, навмання ходить по карті, а іноді навіть застрягає на панелі меню, знову і знову дивлячись на свій компас.
Однак була проблема: Лара часто застрягала в одному місці, а кожен рівень складався зі статичних елементів, тому був лише один шлях оптимізації.
Це може змусити її просто знати, якими шляхами не слід йти, замість того, щоб придумати більш цілісний підхід до проблеми. Але автор сподівається, що Лара навчиться самостійно відкривати процес дослідження.
Хтось прочитає весь підручник, а хтось спочатку дослідить навколишнє середовище, і різниця в цьому виборі визначається «особистістю» різних людей.
визначте роль
Щоб встановити зв’язок з Ларою для AI, необхідно дати AI зрозуміти, що вона є купою пікселів. Після того, як люди-гравці увійшли в гру, у них раптово з'явилася така свідомість.
У зв'язку з цим автор записав 24 години відео Лари, яка рухається в різних напрямках під різними кутами, щоб агент ШІ міг розпізнати будь-якого персонажа.
Як самокерований автомобіль, здатний знімати 24 години відео зі швидкістю 30 кадрів на секунду, у результаті чого створюється 2 592 000 еталонних зображень для розпізнавання дорожніх знаків.
Спочатку автори відстежують головні пікселі голови, а потім головні пікселі тіла, щоб вибрати відповідні регіони.
Коли Лара займає весь екран або коли на її шляху стоїть двовимірний об’єкт, автор використовує візуальне захоплення ШІ, щоб допомогти ідентифікувати Лару, і результати виявляються достатньо точними, щоб ідентифікувати персонажа на екрані.
Взаємодія з навколишнім середовищем
Як тільки ви зможете впізнати Лару, вам потрібно змусити ШІ взаємодіяти з навколишнім середовищем.
Усе середовище гри складається з однакових блоків, автор імпортує їх на куб, потім знімає середовище з усіх боків, а потім запускає процес розпізнавання, щоб агент AI міг розпізнати середовище, як процес людей-гравців, які інтерпретують зображення.
Коли ми спостерігаємо за поведінкою людей-гравців і бачимо це зображення, ми можемо відразу зрозуміти, що область, на яку вказує стрілка, є входом.
Ми можемо не знати розміру наступної кімнати, але ми знаємо, що вона існує.
Тому агент ШІ повинен навчитися рухатися і порівнювати. За допомогою обчислень можна використовувати кілька зображень, щоб визначити, які текстури мають найменшу варіацію розміру.
Тут ви можете використовувати площу основних полігонів, і вони змінюються в основному на основі ймовірності, пропорційної відстані між собою.
Тепер, коли ШІ знає, де вона знаходиться, вона повинна вирішити, куди вона хоче йти далі.
Розпізнаючи текстури, можна доставити її в певне місце, однак для навігації рівнем потрібно щось простіше.
Найшвидший спосіб зробити це — спростити контраст і визначити раптові зміни освітленості в певній області. Однак люди-гравці не обов’язково ходять у ці місця.
Коли є кілька отворів, AI повинен проявити достатній інтерес, але не викликати її смерть.
Людина-гравець знає, коли стрибнути, але напрямок дій Лари випливає з підручника, він повинен точно оцінити, скільки блоків між ним і ціллю, чи повинен він набрати обертів і чи повинен він зробити паузу, перш ніж відпустити .
Якби вона заздалегідь знала розмір ями, то бігла б дуже швидко, що не відповідає нашим очікуванням.
Але насправді навіть тоді ШІ міг застрягти в кімнаті.
Щоб спонукати її вийти з кімнати, автор додав деякі правила колекції.
Наприклад, щоразу, коли вона стикається з текстурою, яку ніколи не бачила раніше, ця область стає пріоритетною, їй доводиться рухатися таким чином, щоб збільшити розмір цієї текстури на екрані.
Таким чином, Лара постійно аналізує те, що вона бачить на екрані – текстури різних поверхонь, вона рухає своїм тілом і визначає нові точки інтересу (тобто текстури, яких ще немає в каталозі).
У цьому процесі вона продовжить перевірку, щоб знайти відсутню текстуру.
спорт
Однак навіть із зазначеними вище вдосконаленнями ШІ все ще занадто роботизований, і схема дій очевидна.
Щоб покращити його, автори знову спостерігали за людьми-гравцями.
Що визначає те, як гравець-людина діє в грі? Це наша пам'ять, ми пам'ятаємо, як складаються дії.
Тому цей процес також має бути вбудований у ШІ, оскільки Лара має знати про свої власні спортивні здібності.
Таким чином рухи ШІ стають набагато плавнішими.
Крім того, оскільки час відновлення кожної дії відомий, це запобігає ШІ виконувати непотрібні дії, залишаючись активним.
На щастя, ці канали візуально спрощені, і їх легко визначити по краях блоків.
ШІ знає, що Лара завжди зробить правильний стрибок, коли активується перша частина блоку, як це зрозуміє гравець-людина.
Інструмент ChatGPT
Далі необхідно вселити агенту ШІ особистість Лари. Особистість заснована на досвіді та пам'яті, і поєднання цих факторів визначає характер Лари.
Відповідно до сеттингу гри, вона відомий археолог, який ніколи не боїться ризикувати і готовий приймати доручені гірські завдання без винагороди, все з любові.
Коли вона стикається з небезпекою під час своєї пригоди, вона може залишатися спокійною та дуже сміливою та без вагань допоможе своїм супутникам.
Зіткнувшись з облогою вовків, вона влучно стріляє з рушниці, а також може вбити небезпечних вовків кинджалом. Єдине, від чого вона відмовилася, це силоміць відкрити замок.
Усе перераховане вище — це особистість Лари, отримана з налаштувань гри.
Далі — автентично прокоментувати все, що вона бачить, для чого автор зібрав риси особистості Лари в базу даних.
Для зображень, які зазвичай мають менше деталей текстури, можна використати зворотний пошук зображень Google, щоб знайти їх.
Щоб розпізнавати слова, автори скопіювали всю сторінку в ChatGPT. Після цього ChatGPT пропонується класифікувати його на основі кількості входжень, перш ніж додати розпізнане слово до списку.
Нарешті, ChatGPT попросили скласти речення на основі цих слів, враховуючи особистість Лари.
Наприклад, якщо текстура ідентифікована як морський лев, ChatGPT може зробити коментар, пов’язуючи морського лева з рисами особистості Лари.
Наприклад, для тюленя вище Лара згадає скам’янілості морських левів або чудову здатність плавати, і не коментуватиме це в цирку.
Користувач мережі: інтелектуальне тіло ШІ перетворює відеоігри на витвори мистецтва
Деякі користувачі мережі сказали, що це один із найкрутіших і найприродніших способів розвитку персонажів. Коли персонажі оживають, ви можете справді відчути відеогру як витвір мистецтва.
Це створює відчуття, ніби штучний інтелект, який пише діалог, і штучний інтелект, який керує персонажами, — одна й та сама особа.
А тепер Foxmaster поєднує ChatGPT, комп’ютерний зір і розпізнавання об’єктів, щоб зробити відеоігри цікавішими.
Можливо, у майбутньому персонажі відеоігор зможуть отримати глибші, гнучкіші особистості, швидше реагувати на навколишнє середовище та багато інших змін, про які ми навіть не можемо уявити.
Література: