Meta викладає вісім вказівок щодо розробки систем ШІ для цілодобових окулярів AR

2023-07-07 05:50:16

Редактор: Естер

Джерело: Qingting.com

Як ми всі знаємо, Meta не обмежується лише гарнітурами VR, такими як Quest, але також створює легші окуляри AR з метою кращої інтеграції продуктів у повсякденне життя людей. На додаток до легкого апаратного забезпечення, це також має вирішальне значення з точки зору функцій та інтерактивного досвіду, таких як природні методи взаємодії, такі як введення жестами, візуальні помічники штучного інтелекту тощо, які невіддільні від комп’ютерного зору та технології ШІ.

Технологія штучного інтелекту стане важливою частиною окулярів AR. Надаючи користувачам відповіді та пропозиції в режимі реального часу (наприклад, рекомендовані навігаційні маршрути, навіть розклади та рекомендовані страви відповідно до вподобань тощо), щоб покращити практичність окулярів AR, це стане Meta AR Однією з точок продажу окулярів. Зокрема, враховуючи інвестиції Meta в технологію штучного інтелекту за останні роки, у нас є всі підстави вірити в це.

Reality Labs випустили дослідження: XAIR, з якого ми можемо дізнатися про принципи проектування систем ШІ в окулярах AR. Фреймворк заснований на таких дослідженнях, як Explainable Artificial Intelligence Framework (XAI) і Human-Computer Interaction (HCI), який містить 8 основних принципів проектування, які можуть стати цінним довідником для розробки AI окулярів AR.

Що таке XAI?

Відповідно до Qingting.com, XAI (Explainable AI), також відомий як Transparent AI (Transparent AI), характеризується поведінкою, яку легко зрозуміти. Більшість штучного інтелекту, заснованого на машинному навчанні, працює в так званих чорних ящиках, і оскільки він не може надати причини та інформацію, що стоять за рішеннями, такий штучний інтелект є ризикованим, оскільки невідомо, чи він надійний, надійний чи упереджений.

Концепцію XAI можна простежити понад сорок років тому. Пізніше, з успіхом моделі чорної скриньки AI/ML, технологія XAI почала привертати увагу науковців, регуляторних органів та інших галузей. Дослідження показують, що XAI, сподіваємось, забезпечить користувачам чіткі рішення та зміцнить довіру. Тому в промисловій сфері XAI почав застосовуватися до щоденних сценаріїв для покращення взаємодії з користувачем.

XAI може обслуговувати різні цільові аудиторії та мати різноманітне використання. Ранні дослідження XAI зосереджувались лише на розробниках алгоритмів, науковцях із обробки даних та експертах у галузі клінічної медицини. Останніми роками все більше й більше XAI почали орієнтуватися на звичайних користувачів та інтегруватись із споживчими продуктами, наприклад показувати та рекомендувати певний продукт на причини для веб-сайту для покупок тощо. Однак це ще рано.

Важливість XAI

Для того, щоб штучний інтелект був широко зрозумілий людям, знадобляться міждисциплінарні дослідницькі зусилля. Наприклад, дослідники ML розробили алгоритми, які генерують прозорі моделі (наприклад, дерева рішень, байєсовські моделі) або використовують методи інтерпретації (наприклад, важливість ознак, візуальні пояснення) для створення пояснень. Дослідники HCI, з іншого боку, зосереджуються на підвищенні довіри користувачів і розумінні пояснень, створених машиною. Психологи, з іншого боку, вивчають XAI з більш фундаментальної точки зору, дивлячись на те, як люди створюють, спілкуються та розуміють.

Відкритий і прозорий штучний інтелект також дуже важливий, і це відповідає його майбутній стратегії розвитку в галузі AR/VR. У дослідженнях XAIR мета XAI полягає в тому, щоб допомогти користувачам чітко та легко зрозуміти рішення та функції штучного інтелекту шляхом генерування деталей або причин. Мета зазначив, що XAI є важливою частиною інтерактивної системи, керованої штучним інтелектом, і він також відіграватиме важливу роль у щоденних додатках AR у майбутньому, допомагаючи користувачам взаємодіяти з візуалізованими інтелектуальними сервісами. XAI може краще розуміти поведінку інтелектуальних систем AR, уникати несподіваних рішень штучного інтелекту, розвивати обізнаність щодо конфіденційності та завоювати довіру користувачів.

Одна з проблем, з якою зараз стикається Meta, полягає в створенні ефективного досвіду XAI для повсякденних додатків AR. Більшість існуючих досліджень XAI зосереджено на класифікації типів інтерпретації та методів генерації без урахування характеристик повсякденних сценаріїв AR, таких як перцептивна інформація, створена користувачами та контекстом, цілодобова робота та хороша адаптивність. Ці фактори можуть не тільки сформувати більш зручні для людини пояснення, але й впливати на дизайн інтерфейсу інтерпретації.

Тому Meta запропонувала структуру дизайну XAIR, яка описує, коли і як пояснювати рішення ШІ в AR. Щоб створити структуру XAIR, також було проведено експеримент із 500 людьми, щоб зібрати їхні переваги щодо дизайну досвіду AR. Крім того, згадуються думки 12 експертів щодо взаємодії AR.

Це дослідження спрямоване на визначення трьох питань:

Коли AI повинен пояснити;
що можна пояснити;
Як пояснити.

Попередні дослідження досліджували перші дві проблеми, і, хоча вони не стосувалися AR, надали деяку корисну інформацію для розробки XAIR.

Рекомендації щодо проектування XAI

Meta вважає, що якщо в окулярах AR будуть інтелектуальні сервіси, то штучний інтелект буде відігравати важливу роль, наприклад, надавати користувачам контекстні пропозиції на основі інформації, отриманої датчиками окулярів AR. Крім того, взаємодія між штучним інтелектом і користувачами має базуватися на ефективному дизайні XAI, щоб переконатися, що рішення штучного інтелекту є надійними та заслуговують довіри, тим самим покращуючи взаємодію з користувачем.

На відміну від існуючої структури XAI для комп’ютерів і мобільних телефонів, дизайн XAI AR повинен включати глибшу та багатшу контекстну інформацію (навіть з урахуванням стану користувача), тому його потрібно переробити спеціально для AR. Крім того, XAI AR також повинен мати можливості сприйняття 3D і бути онлайн в режимі реального часу, перш ніж його можна буде застосовувати до щоденних сценаріїв AR та інтегрувати вміст інтерпретації з фізичним простором. Наприклад, рекомендуючи рецепти, одночасно виділіть інгредієнти в холодильнику користувача, тобто поясніть рішення, виходячи з контексту сцени. І навпаки, існуючі на ринку фреймворки XAI не можуть задовольнити ці потреби.

Тому Meta підсумувала 8 основних рекомендацій щодо дизайну за допомогою опитувань користувачів:

Завжди генеруйте результати штучного інтелекту, щоб користувачі могли легко отримати до них доступ, коли вони їм потрібні;
Не запускати пояснення автоматично, якщо не виконано дві умови — визначити високе когнітивне навантаження користувача, відчуття терміновості тощо або визначити здивування, збентеження, незнайомість, невпевненість тощо;
Необхідно враховувати три фактори для персоналізованого змісту пояснення: системні цілі, цілі користувача та портрети користувачів;
У стані за замовчуванням віддайте перевагу поясненню чому та виберіть стисле пояснення;
Завжди надавайте детальніші пояснення, дозволяючи користувачам розширювати їх відповідно до їхніх потреб за допомогою маленьких вікон підказок тощо;
За замовчуванням використовується той самий метод інтерпретації, що і вихід AI (крім тактильного, звукового), а при високому навантаженні одного режиму вибирається інший;
Контент - це переважно текст. Якщо це зображення, воно повинно бути максимально спрощеним, щоб користувачі могли його легко зрозуміти;
Вставте пояснювальний вміст у сцену якомога таємніше або відкрито, якщо це не доречно.

Meta в поєднанні з інструкціями з проектування розробив кілька варіантів застосування та перевірив їх серед дизайнерів 10. У результаті дизайнери вважають, що XAIR може надати вичерпну довідку або допомогу для розробки фреймворку XAI для AR, що допомагає стимулювати мислення та уяву конструктори.сила. 12 кінцевих користувачів, які брали участь в експерименті, також повідомили, що XAIR має чудову зручність використання.

Додатки

У цьому дослідженні Meta розробила два демонстраційних кейси, якщо вам цікаво, ви можете подивитися:

Коли користувач біжить по доріжці, окуляри AR покажуть користувачеві карту поблизу з урахуванням поточного сезону та пейзажу, запропонувавши об’їзд до сусідньої дороги, щоб насолодитися цвітінням сакури. Пояснення, які може надати ШІ, включають: кращий пейзаж, правильну довжину маршруту та розклад користувача. Бланки пояснень містять текст, зображення квітів сакури тощо.

2) Коли користувач AR повертається додому після обговорення садівництва з сусідами, окуляри AR відображатимуть підказку «технічне обслуговування» на навколишніх рослинах і нададуть користувачеві інструкції щодо удобрення рослин. Цю пропозицію користувач має активувати вручну, щоб не думати, що штучний інтелект порушує конфіденційність, а ручний запуск може краще зміцнити довіру. Крім того, штучний інтелект також може підказувати: після сканування системи на листках рослин з’являються аномальні плями, які вказують на те, що вони можуть страждати від грибкових або бактеріальних інфекцій. Окрім тексту, форма пояснення також може використовувати AR для позначення ненормальних точок на листках (текст є очевидною підказкою, тоді як підказка AR є прихованим типом, який інтегрований зі сценою).

посилання:

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

2 лайків