Інтерв’ю丨Не вірте у великі моделі, інновації на цьому етапі все ще «інтерактивні»

Джерело зображення: створено Unbounded AI

**Джерело: **AI Technology Review

Автор: Huang Nan; Редактор: Chen Caixian

MOSS, який у «Блукаючій Землі» вважається «бунтівником», — це цифрове життя, створене спеціально для проекту Tinder. Він дуже розумний і має здатність перевершити людські знання про мораль, філософію, науку, мистецтво тощо, і може отримати оптимальне рішення та прийняти «найправильніше» рішення за найкоротший час. Це розумне тіло, яке прагне до досконалості.

Сьогодні велика модель використовується для технологічних змін, і вона забезпечує майже абсолютну можливість для впровадження «галузі» та «поля» в обмеженому діапазоні. У новому наративі комерціалізації штучного інтелекту люди або активно, або пасивно приєднуються до безумства ресурсна конкуренція середня.

Назавжди залишати людей здоровими — це розкіш. Так само, як людська цивілізація до MOSS, яка пережила історію руйнування та відродження, нам також необхідно терміново повернутися до технічної раціональності від карнавалу посадки великомасштабних моделей.

Хуа Сяньшен, технічний директор Terminus, який бере участь у цій гонці озброєнь, також висловив свої власні спокійні думки про велику модель і відповідь на вихід із ситуації. Нижче наведено запис розмови між Хуа Сяньшенгом і AI Technology Review, який витяг із AI Technology Review наступним чином:

1. Точка зору 1: великі моделі — це ще не кінець розвитку інтелекту

Лише через рік після «розумної появи» великої моделі фізичний світ і метод виробництва інформації зазнали революційних змін, які відображаються на більш широкому міському просторі та неминуче спричинять новий виток інновацій. У зв’язку з цим Хуа Сяншен відверто сказав, говорячи про огляди технологій штучного інтелекту: «Хоча велика модель справді досягла значного прогресу, не будьте забобонними щодо великої моделі, у неї є свої обмеження.».

За спогадами Хуа Сяншена, після виходу ChatGPT минулого року він звернув на нього пильну увагу і вперше спробував. Незаперечно, що це справді величезний прорив. З одного боку, я вражений значним покращенням його можливостей, але, відверто кажучи, я також виявив, що він не такий потужний, як ми собі уявляли, недостатньо хороший.

«Коли глибоке навчання тільки зароджувалося, усі думали, що воно може вирішити всі проблеми. Воно може використовувати досить складну модель і достатньо даних для побудови моделей різноманітних проблем у реальному світі. Але в реальних боях насправді потрібно заглиблюватися в Проблема. Сучасна велика модель не змінила це правило, ** усе ще потрібно заглибитися в поле, щоб зрозуміти відповідний процес, дані тощо, щоб вирішити проблеми галузі.**" Хуа згадував Сяншен.

Сьогодні в суперрозумному кампусі Terminus м’які роботи стали подібними до MOSS в епоху великомасштабних моделей. Він ховається на великих екранах парку і знає все про парк. Ви можете запитати в нього дорогу, отримати потрібну інформацію та використовувати її для виконання операцій. За співіснуванням людей і машин стоїть семантичне узгодження великих моделей і обладнання IoT для досягнення високого рівня інтелекту між людьми, пристроями IoT і містами.

Отже, коли AIoT зустрінеться з великою моделлю, з якими іскрами він зіткнеться? Хуа Сяншен висловив свою думку: штучний інтелект є душею AIoT, а IoT — це його сприйняття та контроль, як і його «руки та ноги», і, звичайно, він також включає фізичну основу для свого «тіла», тобто ресурси обчислювальної потужності. .

Поява LLM (велика мовна модель) підштовхнула можливості штучного інтелекту на крок ближче до більш загальної мети: по-перше, велику мовну модель можна безпосередньо використовувати як інтерактивний інтерфейс системи AIoT. По-друге, дані AIoT за своєю суттю є мультимодальними.Очікується, що мультимодальні великі моделі вирішать багато проблем, які раніше потрібно було вирішувати за допомогою «ШІ + правила».

В очах Хуа Сяньшена, коли мова заходить про великі моделі AIoT, існує два основні шляхи: перший — оновити те, що AI робив у минулому з великою моделлю, і зробити це знову, що робить більшість людей; перший — широкомасштабна модель AIoT у справжньому сенсі, де мультимодальні гетерогенні дані в AIoT дійсно використовуються** та поміщаються у велику модель. «Однак така справжня модель AIoT може з’явитися незабаром у майбутньому, або це може зайняти багато часу», — сказав Хуа Сяншен.

На його думку, велика модель, яка використовується в індустрії AIoT на цьому етапі, все ще є першим технічним шляхом, тобто «псевдо» велика модель AIoT, заснована на мові або мові плюс бачення.

До появи «псевдо» великої моделі AIoT зв’язок і співпраця між пристроями AIoT повністю ґрунтувалися на правилах, попередньо визначених експертами. Ці правила є фіксованими, неповними та не розвиваються самостійно, і їх можна не розуміти безпосередньо та дотримуватися людьми Інструкція. Але за допомогою великої моделі ми можемо автоматично й динамічно створювати правила зв’язку та координації між об’єктами відповідно до дуже різноманітних контекстів (будь-який сезон, час, персонаж, інструкція тощо), забезпечуючи адаптивну, різноманітну, глибоку, інтегровану інтелектуальну сцену. з людськими вказівками.

Хуа Сяншен сказав в інтерв’ю: «Незалежно від того, який шлях, найбільш типова глобальна модель AIoT ще не з’явилася.**»

2. Точка огляду 2: стереоскопічне сприйняття, точне керування, розкриття доісторичної потужності великих моделей AIoT

Які можливості повинна мати справжня модель AIoT? Хуа Сяншен вважає, що існує дві основні відмінності між AIoT та іншими галузями. По-перше, існує багато різнорідних даних. Велика кількість датчиків збирає різні дані, такі як погода, температура, вологість, електроенергія та опади, і інформація багатша. По-друге, пристрої IoT є не лише датчиками, але також зворотно контролювати середовище. Багаті розміри сприйняття та потужніша дія — це те, що повинна мати модель AIoT.

Повертаючись до ситуації, щоб розширити можливості сфери AIoT, важко досягти цього, лише покладаючись на загальну модель із багатьма обмеженнями. Тому велика модель AIoT повинна відповідати декільком характеристикам:

По-перше, професіоналізм. Він повинен бути професійним і мати можливість вирішувати більше професійних проблем у цій галузі. Сучасні великі моделі виглядають потужними, але вони не мають достатнього досвіду для використання в парку.

По-друге, надійність. Модель повинна добре розуміти сцену, яка її цікавить. З одного боку, вона повинна розуміти достатньо, вводячи нові знання; по-друге, їй також потрібні певні методи обмеження, щоб зробити вихідні результати високонадійними, без «ілюзії» "серйозної нісенітниці".

По-третє, баланс між продуктивністю та вартістю. З точки зору витрат на навчання, особливо велика модель загального призначення не може бути дозволена звичайним стартап-компаніям; по-друге, під час висновку, якщо кількість користувачів або відвідувань є занадто великою, послуга великої моделі також не працюватиме. Тому спрощена модель є хорошим вибором. Нам не потрібно, щоб він був всезнайком, якщо він вирішує мої проблеми та має певний здоровий глузд.

По-четверте, система ** проходить через **. Ця велика модель не тільки має знання, але також потребує глибокого зв’язку з системою парку, щоб отримувати інформацію в реальному часі, і може протидіяти парку в режимі реального часу за умови авторизації.

Говорячи про технологію втіленого інтелекту, яка нещодавно привернула велику увагу, Хуа Сяньшен згадав в інтерв’ю: Запропонована нами велика модель AIoT є втіленням існуючої технології великої моделі. Пристрої AIoT – це наші очі та вуха, а також руки та ноги. Наразі ми більше зосереджуємося на взаємодії та зв’язках між сценами, а пізніше ми замінимо сприйняття та контроль великими моделями. Зокрема, наші пристрої та роботи супер-Інтернету речей самі по собі є проявами втіленого інтелекту, що підтримується бездоганно об’єднаними можливостями на стороні сервера (Інтернет речей і макети) і можливостями на стороні роботів (відчуття, планування, дії та взаємодія), але робот Terminus втілений інтелект — це втілений інтелект «співпраці машини та середовища», а не просто безпосередня здатність самого робота.

3. Точка зору 3: складність приземлення, мультимодальний виклик великої моделі AIoT

Що стосується труднощів у впровадженні великої моделі AIoT, Хуа Сяншен вважає, що труднощі в основному включають кілька аспектів.На додаток до відповідності вищезгаданому професіоналізму, надійності, балансу між продуктивністю та вартістю, а також системної інтеграції, впровадження також вимагає реального -часова продуктивність.Вона буде значно вищою, оскільки це реально працююча система AIoT, крім того, її еволюція можливостей полягає не лише в оновленні самої великої моделі, а й у накопиченні даних, ітерації пам’яті тощо. Загалом**, найбільша складність у реалізації великих моделей AIoT полягає в мультимодальності**.

У довгостроковій перспективі можна інтегрувати дані IoT в модель AIoT уніфікованим способом, можливо, центруючи текст/зображення та вирівнюючи інші дані IoT з центром. Це те, що потрібно. Але через неоднорідність і мультимодальність даних AIoT, інтеграція та ефективне використання різних типів даних повинні подолати проблеми представлення даних і узгодження.

Перш за все, з точки зору представлення даних, у якій формі слід моделювати різні дані датчиків, чи слід використовувати еталонний текст як вхідну послідовність, еталонне зображення слід використовувати як вхідну матрицю чи нову форму моделювання? У цьому відношенні як академічні кола, так і промисловість досі не мають остаточного висновку.

Крім того, з точки зору вирівнювання даних, мовна модель вивчає мову та генерує мову, зрозумілу людям.Однак у сфері AIoT існує багато даних без міток та інформаційних анотацій, і більшість її контекстів є не мають явної семантики. , Неможливо зіставити семантику з даними, що робить дані та інформацію, згенеровану ними, незрозумілими. Це потребує повторної обробки, щоб встановити семантичне узгодження між даними AIoT і природною мовою, щоб дати значення цих даних.

4. Точка зору 4: Великі моделі не єдиний спосіб досягти AGI, «модель + система» є правильним рішенням

Зіткнувшись із труднощами, з якими стикається ШІ в різних сферах, таких як AIoT, як реалізувати AGI у справжньому сенсі? Хуа Сяншен вважає, що наразі є три можливі шляхи:

  • Перший шлях — це безперервний розвиток і прогрес великої моделі, безперервне збільшення розміру моделі, збільшення обсягу даних і модальності для створення надвеликої моделі для досягнення AGI.
  • Другий шлях полягає в тому, щоб підірвати поточний коннекціонізм, вивчити нові модельні рамки, щоб наблизити їх до режиму роботи людського мозку чи людського серця, а також мати потужні можливості аналізу, міркувань, відкриттів та інновацій за умови низької потужності. споживання .
  • Третій спосіб — запропонований нами метод "модель + система"; на відміну від першого способу з великою модельною системою як ядром, згадана тут система більш обширна, включаючи злиття великих і малих моделі та еволюція включає злиття моделей і правил, взаємну трансформацію правил і моделей тощо. За допомогою методу злиття систем і моделей ми побудуємо більш складне розумне тіло, яке може постійно розвиватися.

Взявши за приклад сферу AIoT, Хуа Сяншен сказав, що велика мовна модель сама по собі є розширенням AIoT і ** використовує велику мовну модель як «мозок» із сильними можливостями розуміння, а потім підключає пристрої AIoT через систему до поєднайте його з «очима», «носом», «вухами», «руками» та «ногами», щоб він мав кілька можливостей сприйняття, аналізу, прийняття рішень і контролю, щоб досягти більшого інтелекту **. Коли «модель + система» використовується все більше і більше, і накопичується більше даних, стає можливим справді реалізувати модель «великого об’єднання» AIoT мультимодальних і гетерогенних даних.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити