Интервью 丨 Не верьте в большие модели, инновации на данном этапе все еще «интерактивны».

Источник изображения: сгенерировано Unbounded AI

**Источник: **Обзор технологий искусственного интеллекта.

Автор: Хуан Нань, редактор: Чэнь Цайсянь

MOSS, которого в «Блуждающей Земле» считают «мятежником», представляет собой цифровую жизнь, созданную специально для проекта Tinder. Он очень умен и обладает способностью превосходить человеческую мораль, философию, науку, искусство и другие знания, может найти оптимальное решение и принять «самое правильное» решение в кратчайшие сроки, это совершенный интеллект.

В настоящее время большая модель используется для технологических изменений и обеспечивает почти абсолютную возможность реализации «отрасли» и «поля» в ограниченном диапазоне.В новом повествовании о коммерциализации ИИ люди либо активно, либо пассивно присоединяются к безумию ресурс конкуренция средний.

Это роскошь - вечно сохранять человеческое здравомыслие. Как и человеческая цивилизация до MOSS, которая пережила историю разрушения и возрождения, нам также необходимо срочно вернуться к технической рациональности из карнавала посадки масштабных моделей.

Хуа Сяньшэн, технический директор Terminus, который участвует в этой гонке вооружений, также дал свое спокойное представление о большой модели и ответе на выход из ситуации.Ниже приводится стенограмма разговора между Хуа Сяньшэном и AI Technology Review, который выдержка из AI Technology Review выглядит следующим образом:

1. Точка зрения 1: Большие модели — это не конец появления интеллекта

Всего через год после «интеллектуального появления» большой модели физический мир и метод производства информации претерпели революционные изменения, которые отображаются в более широком городском пространстве и неизбежно приведут к новому витку инноваций. В связи с этим Хуа Сяньшэн прямо сказал, говоря об обзорах технологий искусственного интеллекта: «Хотя большая модель действительно добилась большого прогресса, не относитесь к большой модели суеверно, у нее есть свои ограничения».

По воспоминаниям Хуа Сяньшэна, после выхода ChatGPT в прошлом году он обратил на него пристальное внимание и впервые попробовал. Бесспорно, это действительно огромный прорыв.С одной стороны, я поражен существенным улучшением его возможностей, но, честно говоря, я также обнаружил, что он не так силен, как мы себе представляли, недостаточно хорош.

«Когда глубокое обучение зародилось, все думали, что оно может решить все проблемы. Оно может использовать достаточно сложную модель и достаточно данных для построения моделей различных проблем в реальном мире. чтобы действительно решить эту проблему. Проблема. Сегодняшняя большая модель не изменила это правило, ** все еще необходимо углубиться в область, чтобы понять соответствующий процесс, данные и т. д., чтобы решить проблемы отрасли. ** "Хуа Сяньшэн упомянул.

Сегодня в суперумном кампусе Терминуса мягкие роботы стали чем-то вроде MOSS в эпоху крупномасштабных моделей. Он прячется в больших экранах парка и знает о парке все, у него можно спросить дорогу, получить нужную информацию и использовать для выполнения операций. В основе сосуществования людей и машин лежит семантическое согласование больших моделей и оборудования IoT для достижения высокого уровня интеллекта между людьми, устройствами IoT и городами.

Итак, когда AIoT встретится с большой моделью, с какими искрами он столкнется? Хуа Сяньшэн высказал свое мнение: ИИ — это душа AIoT, а IoT — это его восприятие и управление, как его «руки и ноги», и, конечно же, он включает в себя и физическую основу для своего «тела», то есть ресурсы вычислительной мощности. .

Появление LLM (Large Language Model) подтолкнуло возможности ИИ на один шаг ближе к более общей цели: во-первых, Large Language Model можно напрямую использовать в качестве интерактивного интерфейса системы AIoT. Во-вторых, данные AIoT по своей природе мультимодальны.** Ожидается, что мультимодальные большие модели решат многие проблемы, которые в прошлом необходимо было решать с помощью «ИИ + правила»**.

По мнению Хуа Сяньшэна, когда дело доходит до больших моделей AIoT, есть два основных пути: первый — обновить то, что ИИ делал в прошлом, с большой моделью и сделать это снова, что и делает большинство людей; первый — крупномасштабная модель AIoT в прямом смысле, где мультимодальные разнородные данные в AIoT действительно используются** и помещаются в большую модель. «Однако такая реальная модель AIoT может появиться в ближайшее время или может занять много времени», — сказал Хуа Сяньшэн.

По его мнению, большая модель, используемая в индустрии AIoT на данном этапе, все еще находится на первом техническом маршруте, то есть «псевдо» большая модель AIoT, основанная на языке или языке плюс видение.

До появления «псевдо» большой модели AIoT соединение и взаимодействие между устройствами AIoT полностью основывались на правилах, предопределенных экспертами-людьми.Эти правила являются фиксированными, неполными и несаморазвивающимися, и их нельзя напрямую понять и соблюдать. людьми. Но с большой моделью мы можем автоматически и динамически создавать правила связи и координации между объектами в соответствии с самыми разнообразными контекстами (любое время года, время, персонаж, инструкция и т. д.), обеспечивая адаптивный, разнообразный, глубокий, интегрированный интеллектуальный опыт сцены. с человеческими инструкциями.

Хуа Сяньшэн сказал в интервью: «Независимо от того, какой маршрут, наиболее типичная глобальная модель AIoT еще не появилась **».

2. Точка зрения 2: стереоскопическое восприятие, точное управление, раскрытие доисторической мощи больших моделей AIoT

Какими возможностями должна обладать настоящая модель AIoT? Хуа Сяньшэн считает, что между AIoT и другими отраслями есть два основных отличия. Во-первых, много разнородных данных.Большое количество датчиков собирает различные данные, такие как погода, температура, влажность, электричество, осадки, и информация богаче.Во-вторых, устройства IoT являются не только датчиками, но и также обратно контролировать окружающую среду. Более широкие возможности восприятия и более мощная сила действия — это то, что должна иметь модель AIoT.

Возвращаясь к расширению возможностей области AIoT, трудно достичь этого, полагаясь только на общую модель со многими ограничениями. Поэтому большая модель AIoT должна соответствовать нескольким характеристикам:

Во-первых, профессионализм. Он должен быть профессиональным и иметь возможность решать более профессиональные проблемы в этой области. Сегодняшние большие модели выглядят мощными, но у них недостаточно знаний в предметной области, чтобы их можно было использовать в парке.

Во-вторых, надежность. Модель должна хорошо понимать интересующую ее сцену: с одной стороны, она должна понимать достаточно, вводя новые знания, во-вторых, ей также нужны некоторые методы ограничения, чтобы сделать выходные результаты высоконадежными, без «иллюзии». "серьезной чепухи".

В-третьих, баланс между производительностью и стоимостью. С точки зрения затрат на обучение обычная стартап-компания не может позволить себе особенно большую универсальную модель; во-вторых, во время вывода, если количество пользователей или посещений слишком велико, обслуживание большой модели также не удастся. Поэтому упрощенная модель является хорошим выбором. Нам не нужно, чтобы он был всезнайкой, пока он решает мои проблемы и имеет здравый смысл.

В-четвертых, система ** проходит через **. Эта большая модель не только обладает знаниями, но и должна быть тесно связана с системой парка для получения информации в режиме реального времени и может контр-контролировать парк в режиме реального времени при условии авторизации.

Говоря о технологии воплощенного интеллекта, которая в последнее время привлекла большое внимание, Хуа Сяньшэн упомянул в интервью: Предложенная нами большая модель AIoT является воплощением существующей технологии больших моделей. Устройства AIoT — это наши глаза и уши, а также наши руки и ноги. В настоящее время мы уделяем больше внимания взаимодействию и связи сцен, а позже заменим восприятие и контроль большими моделями. В частности, наши супер-IoT-устройства и роботы сами по себе являются проявлением воплощенного интеллекта, поддерживаемого бесшовно объединенными возможностями на стороне сервера (IoT и макеты) и возможностями на стороне робота (восприятие, планирование, действие и взаимодействие), но робот Терминуса воплощенный интеллект - это воплощенный интеллект «взаимодействия машины и окружающей среды», а не только непосредственная способность самого робота.

3. Точка зрения 3: сложность посадки, мультимодальная проблема большой модели AIoT

Что касается трудностей при внедрении большой модели AIoT, Хуа Сяньшэн считает, что трудности в основном включают в себя несколько аспектов.Помимо вышеупомянутого профессионализма, надежности, баланса между производительностью и стоимостью, а также системной интеграции, внедрение также требует реальных - временная производительность.Она будет намного выше, потому что это реально работающая система AIoT, кроме того, ее эволюция по возможностям — это не только обновление самой большой модели, но и накопление данных, итерация памяти и т. д. В целом** самая большая сложность в реализации крупных моделей AIoT заключается в мультимодальности**.

В долгосрочной перспективе можно интегрировать данные IoT в модель AIoT унифицированным образом, возможно, сосредоточив внимание на тексте/изображениях и согласовывая другие данные IoT с центром.Это то, что необходимо. Но из-за неоднородности и мультимодальности данных AIoT интеграция и эффективное использование различных типов данных должны решать проблемы представления и согласования данных.

Прежде всего, с точки зрения представления данных, в какой форме следует моделировать различные данные датчиков, следует ли использовать справочный текст в качестве входных данных последовательности, эталонное изображение следует использовать в качестве входных данных матрицы или новую форму моделирования? В этом отношении как академические круги, так и промышленность по-прежнему не могут прийти к окончательному выводу.

Кроме того, с точки зрения выравнивания данных, языковая модель учится на языке и генерирует язык, понятный человеку.Однако в области AIoT есть много данных без меток и информационных аннотаций, а большинство его контекстов не имеют явная семантика. , Невозможно сопоставить семантику с данными, что делает данные и информацию, сгенерированную ими, непонятными. ** Требуется повторная обработка, чтобы установить семантическое соответствие между данными AIoT и естественным языком, чтобы дать этим данным значение**.

4. Точка зрения 4: Большие модели — не единственный способ достичь ОИИ, «модель + система» — правильное решение

Столкнувшись с трудностями, с которыми сталкивается ИИ в различных областях, таких как AIoT, как реализовать AGI в истинном смысле? Хуа Сяньшэн считает, что в настоящее время есть три возможных пути:

  • Первый путь — это непрерывная эволюция и прогресс большой модели, постоянное увеличение размера модели, увеличение объема данных и модальности для создания сверхбольшой модели для достижения ОИИ.
  • Второй путь состоит в том, чтобы ниспровергнуть нынешний коннекционизм, изучить новые модели моделей, чтобы приблизить их к режиму работы человеческого мозга или человеческого сердца, а также получить мощные возможности анализа, рассуждений, открытий и инноваций в условиях малой мощности. потребление .
  • Третий путь - предложенный нами метод "модель+система"; в отличие от первого пути с большой модельной системой в качестве ядра, упомянутая здесь система является более обширной, включающей слияние больших и малых моделей и Эволюция включает в себя слияние моделей и правил, взаимную трансформацию правил и моделей и т.д. С помощью метода слияния систем и моделей мы построим более сложное разумное тело, способное непрерывно расти.

Взяв в качестве примера поле AIoT, Хуа Сяньшэн сказал, что модель большого языка сама по себе является расширением AIoT и ** использует модель большого языка в качестве «мозга» с мощными возможностями понимания, а затем подключает устройства AIoT через систему к сопоставьте его с «глазами», «носом», «ушами», «руками» и «ногами», чтобы он имел множество возможностей восприятия, анализа, принятия решений и контроля, чтобы достичь более сильного интеллекта **. Когда используется «модель + система», накапливается все больше и больше данных, можно по-настоящему реализовать модель «большой унификации» AIoT мультимодальных и разнородных данных.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить