Участие в большой модели, новое повествование производителей мобильных телефонов

2023-08-16 02:28:43

Автор｜Ву Цзинцзин

Править｜Каштаны

Источник: Цзязи Гуаннянь.

Большая модель Xiaomi публично дебютировала во время ежегодной речи Лэй Цзюня в 2023 году.

Лэй Цзюнь упомянул, что, в отличие от многих интернет-платформ, ключевым прорывным направлением крупной модели Xiaomi является легкий вес и локальное развертывание, которые могут без проблем работать на стороне мобильного телефона.

Он сообщил, что в настоящее время на мобильных телефонах запущена модель MiLM1.3B со шкалой 1,3 миллиарда параметров, и эффект сравним с результатами больших моделей с 6 миллиардами параметров в облачных вычислениях. В отчете, который он опубликовал, большая сквозная модель Xiaomi показала лучшие результаты, чем модель ChatGLM2-6B ИИ Zhipu, по различным темам китайской оценки CMMLU, а разрыв в баллах с большой моделью Baichuan-13B Baichuan Intelligent было около 5 минут.

(Источник: Сяоми)

Ранее крупномасштабная языковая модель для предварительного обучения MiLM-6B/1.3B, разработанная Xiaomi, была размещена на GitHub, платформе для размещения кода, и заняла десятое место в общем списке C, заняв первое место по той же величине параметра и заняв первое место. первое место в китайском эталоне больших моделей "CMMLU", "MiLM-6B" занял первое место.

Конечно, поскольку размеры этих тестовых списков являются общедоступными, многим крупным модельным компаниям нетрудно получить баллы в соответствии с тестовыми заданиями, поэтому эти результаты оценки могут использоваться только в качестве справочных и не означают что результаты абсолютно отличные.

В то же время Лэй Цзюнь также объявил, что Xiao Ai, как первый бизнес-приложение большой модели Xiaomi, претерпел новое обновление и официально открыл пригласительный тест.

Это постановочное крупномасштабное модельное достижение, сделанное Xiaomi за четыре месяца с момента объявления новой команды крупномасштабных моделей в апреле этого года.

Что нового привносит практика Xiaomi в реализацию больших моделей? Что это означает для производителей мобильных телефонов, которые полагаются на новые итерации технологий?

1. Xiaomi не производит универсальные большие модели, а в основной команде около 30 человек

Xiaomi принадлежит к рациональной школе по пути масштабных моделей-** не гонится за масштабом параметров, и не делает универсальные масштабные модели. **

Ранее на телефонной конференции по доходам Лу Вейбинг, президент Xiaomi Group, сказал, что Xiaomi будет активно использовать крупномасштабные модели, и направление будет заключаться в глубокой интеграции продуктов и бизнеса, а не в создании крупномасштабных моделей общего назначения, таких как OpenAI. .

Согласно предыдущим сообщениям Shenran, доктор Ван Бинь, директор лаборатории искусственного интеллекта Xiaomi Group, однажды сказал, что Xiaomi не будет выпускать продукт, подобный ChatGPT, в одиночку, и в конечном итоге продукт будет выпущен в виде самостоятельно разработанной большой модели, и соответствующее правительство будет инвестировать десятки миллионов юаней уровня. **

Он сказал: «Что касается больших моделей, мы принадлежим к рациональной школе. У Xiaomi есть преимущества в сценариях приложений, и то, что мы видим, — это огромные возможности для сочетания больших моделей и сценариев».

Он рассказал, что до рождения ChatGPT Xiaomi проводила внутренние исследования, разработки и применение больших моделей.В то время она использовала предварительное обучение + контроль последующих задач и точную настройку для ведения диалога человек-машина со шкалой параметров с 2,8 млрд до 3 млрд. В основном это достигается за счет тонкой настройки диалоговых данных на основе предварительно обученной базовой модели, а не большой модели общего назначения, как ее сейчас называют.

Согласно общедоступной информации, нынешним главой большой модельной группы Xiaomi является Луан Цзянь, эксперт в области голоса ИИ, подчиняющийся Ван Биню, заместителю председателя технического комитета и директору лаборатории ИИ. Вся большая модельная команда насчитывает около 30 человек.

Луан Цзянь раньше был главным специалистом по голосу и руководителем группы голосового управления интеллектуальным голосовым роботом «Microsoft Xiaoice», исследователем в Исследовательском институте Toshiba (Китай) и старшим ученым в Инженерной академии Microsoft (Китай). После прихода в Xiaomi Луан Цзянь последовательно отвечал за генерацию голоса, NLP и другие команды, а также за внедрение связанных технологий в такие продукты, как Xiao Ai. Ван Бинь присоединился к Xiaomi в 2018 году и возглавляет лабораторию искусственного интеллекта с 2019. До прихода в Xiaomi он был научным сотрудником и научным руководителем в Институте информационной инженерии Китайской академии наук.У него почти 30 лет исследований. опыт работы в области поиска информации и обработки естественного языка.

Крупномасштабная модель также опирается на команду искусственного интеллекта Xiaomi.Лей Цзюнь сказал, что после 7 лет и 6 расширений команда искусственного интеллекта Xiaomi насчитывает более 3000 человек, занимающихся CV, NLP, визуализацией искусственного интеллекта, автономным вождением, робототехникой и другими. поля. .

(Источник: Сяоми)

2. Google, Qualcomm и Huawei вступили в игру один за другим

Помимо Xiaomi, запуск больших моделей на мобильных телефонах является текущей ключевой целью многих технологических компаний.

Технологические компании представляют себе возможность больших моделей: независимо от того, что вы открываете, WPS, графитовые документы или электронные письма, пока вы вводите такие команды, как письмо, мобильный телефон может вызвать локальные возможности для создания полной статьи или электронного письма. На мобильном телефоне все приложения могут в любое время вызвать местную масштабную модель, чтобы помочь справиться с работой и решить жизненные проблемы.Взаимодействие между людьми и различными приложениями на мобильном телефоне больше не является частыми щелчками, но может быть вызвано грамотно. по голосу.

Многие компании пытаются уменьшить размер модели, чтобы сделать более практичным и экономичным запуск больших моделей локально на мобильных телефонах. На конференции Google I/O в мае этого года, когда Google выпустил PaLM2, он был разделен на четыре спецификации в зависимости от размера, от маленького до большого в порядке Gecko, Otter, Bison и Unicorn, Среди них самый маленький Gecko может работать на мобильных телефонах. И он быстрый, он может обрабатывать 20 токенов в секунду, что примерно эквивалентно 16 или 17 словам, а также может поддерживать работу мобильных телефонов в автономном режиме. Но в то время Google не сказал, в каком телефоне будет использоваться эта модель.

В настоящее время именно Qualcomm добилась конкретных результатов. На MWC 2023 в марте этого года Qualcomm запустила Stable Diffusion, графовую модель Wensheng с более чем 1 миллиардом параметров, на смартфоне, оснащенном Snapdragon 8 второго поколения. В ходе демонстрации сотрудники использовали Stable Diffusion для создания изображений на телефоне Android без подключения к Интернету, и весь процесс занял 15 секунд.

На CVPR, крупнейшей конференции ученых по компьютерному зрению в июне, Qualcomm продемонстрировала модель ControlNet, работающую на телефоне Android, со шкалой из 1,5 миллиарда параметров, а время рисования составило всего 11,26 секунды. Зиад Асгар, старший вице-президент по управлению продуктами и глава отдела ИИ в Qualcomm, сказал: **Технически требуется меньше месяца, чтобы перенести эти большие модели с более чем 1 миллиардом параметров в мобильные телефоны. **

Последнее действие заключается в том, что Qualcomm объявила о сотрудничестве с Meta для изучения приложений и приложений, основанных на модели Llama 2, на смартфонах, ПК, головных дисплеях AR/VR, автомобилях и других устройствах на базе чипа Qualcomm Snapdragon без подключения к сети. Служить. По данным Qualcomm, по сравнению с облачным LLM, запуск крупномасштабных языковых моделей, таких как Llama 2, локально на устройстве не только дешевле и производительнее, но и не требует подключения к онлайн-сервисам**, а сервис является более персонализированным и более эффективным, безопасным и более приватным.

Apple, которая официально не объявляла о каких-либо действиях с крупномасштабными моделями, также изучает возможность размещения крупномасштабных моделей на стороне устройства. Согласно отчету Financial Times, Apple полностью набирает инженеров и исследователей для сжатия больших языковых моделей, чтобы они могли эффективно работать на iPhone и iPad. РАЗУМ) команда.

В настоящее время на Github популярный проект модели MLC LLM с открытым исходным кодом может поддерживать локальное развертывание.Он устраняет ограничения памяти за счет тщательного планирования распределения и активного сжатия параметров модели, а также может запускать модели ИИ на различных аппаратных устройствах, таких как iPhone. Проект был совместно разработан доцентом CMU, техническим директором OctoML Ченом Тяньци и другими исследователями.Команда использует технологию компиляции машинного обучения (MLC) в качестве основы для эффективного развертывания моделей ИИ. Менее чем через два дня после запуска MLC-LLM количество звезд на GitHub приблизилось к 1000. Кто-то протестировал локальное выполнение большой языковой модели в авиарежиме iPhone.

В отличие от зарубежных Google и Qualcomm, которые подчеркивают, что большие модели могут быть развернуты локально на стороне устройства и могут работать в автономном режиме, отечественные производители мобильных телефонов в настоящее время отдают приоритет развертыванию больших моделей на голосовых помощниках мобильных телефонов или существующих функциях поиска изображений. это обновление призвано вызвать дополнительные облачные возможности для использования больших моделей.

На этот раз Xiaomi использовала большую модель голосового помощника Xiao Ai. Однако, поскольку соответствующая информация о сквозной большой модели Xiaomi не разглашается, невозможно точно судить о пути развития большой модели Xiaomi в будущем. Судя по направлению локального развертывания и легкости, которые подчеркнул Лэй Цзюнь, Xiaomi может попытаться запустить большую модель в автономном режиме на мобильном телефоне в будущем.

Huawei также пытается реализовать крупномасштабные модели на мобильных телефонах, но основное внимание по-прежнему уделяется голосовым помощникам для мобильных телефонов и сценам поиска изображений. Ранее, в апреле, в недавно выпущенном мобильном телефоне Huawei P60 за новой функцией интеллектуального поиска изображений стояла мультимодальная технология крупномасштабных моделей, и в ходе этого процесса модель была миниатюризирована на стороне мобильного телефона. Недавно обновленный интеллектуальный помощник терминала Huawei Xiaoyi также оптимизировал работу на основе большой модели и может рекомендовать рестораны в соответствии с голосовыми подсказками и выполнять новые функции, такие как сводки.

OPPO и vivo также прилагают усилия в этом направлении.13 августа OPPO объявила, что скоро начнет испытывать новый Xiaobu Assistant на базе AndesGPT.Из данных видно, что после того, как Xiaobu Assistant интегрирует возможности больших моделей, он будет более эффективным в диалоге и копирайтинге.Усилится умение писать и другие аспекты. AndesGPT — это генеративная модель большого языка, основанная на гибридной облачной архитектуре, созданная командой OPPO Andes Intelligent Cloud.

Для производителей мобильных телефонов, будь то локальное развертывание или использование облачных возможностей, большие модели — это новая возможность, которую нельзя упускать для мобильных телефонов.

3. Большая модель работает на мобильном телефоне, в чем ключевая проблема?

Заставить большую модель работать на мобильном телефоне — непростая задача.

Вычислительная мощность является основной проблемой. Использование большой модели на мобильном телефоне требует не только вызова вычислительной мощности облака, но и вычислительной мощности терминального устройства.Из-за большого потребления ресурсов большой модели каждый вызов означает высокую стоимость. Председатель Alphabet Джон Хеннесси однажды упомянул, что стоимость поиска при использовании большой языковой модели в 10 раз выше, чем предыдущая стоимость поиска по ключевым словам. В прошлом году у Google было 3,3 триллиона поисковых запросов, каждый из которых стоил около одной пятой цента. Аналитики с Уолл-стрит предсказывают, что если Google будет использовать большие языковые модели для обработки половины своих поисковых запросов, каждый из которых будет давать ответ примерно из 50 слов**, к 2024 году Google может столкнуться с увеличением расходов на 6 миллиардов долларов. **

(Источник: Рейтер)

Запуск больших моделей на мобильных телефонах сталкивается с аналогичными проблемами стоимости.Это упоминается в отчете «Гибридный ИИ — будущее ИИ», выпущенном Qualcomm, точно так же, как традиционные вычисления эволюционировали от мейнфрейма и клиента до комбинации облачных и граничных терминалов. , В том же режиме для запуска большой модели на стороне терминала также требуется гибридная архитектура ИИ, позволяющая распределять и координировать рабочие нагрузки ИИ между облачными и пограничными терминалами**, что позволяет производителям мобильных телефонов использовать вычислительную мощность пограничных терминалов. для снижения затрат. Именно из соображений стоимости крупные модели можно развертывать локально.

Кроме того, поскольку мобильный телефон является личным имуществом каждого, это место, где генерируются данные, и большое количество личных данных также хранится локально. Если можно будет реализовать локальное развертывание, это обеспечит защиту людей с точки зрения безопасности и конфиденциальности. .

Это поднимает вторую проблему: если вы хотите использовать больше конечных возможностей для работы с большими моделями, как вы можете сделать энергопотребление мобильного телефона очень низким и в то же время сделать модель более эффективной?

Компания Qualcomm однажды заявила, что ключевая возможность развертывания больших моделей на локальных устройствах, таких как мобильные телефоны, заключается в полной оптимизации оборудования и программного обеспечения ИИ Qualcomm, включая Qualcomm AI Model Enhancement Toolkit (AIMET), Qualcomm AI Engine и связанные технологии Qualcomm, такие как программный стек ИИ может сжимать объем модели, ускорять рассуждения и уменьшать задержку выполнения и энергопотребление. Хоу Цзилэй, глобальный вице-президент Qualcomm и руководитель отдела исследований искусственного интеллекта Qualcomm, однажды упомянул, что важной частью исследований и разработок Qualcomm в области высокоэффективного искусственного интеллекта является исследование общей эффективности модели.Цель состоит в том, чтобы уменьшить модель искусственного интеллекта в нескольких направлениях. чтобы он мог эффективно работать на оборудовании.

Сжатие одной модели представляет собой немалую трудность. Некоторое сжатие моделей приведет к потере производительности больших моделей, а некоторые технические методы позволяют добиться сжатия без потерь, и все они требуют инженерных попыток в разных направлениях с помощью различных инструментов.

Эти ключевые программные и аппаратные возможности являются серьезной проблемой для производителей мобильных телефонов. Сегодня многие производители мобильных телефонов сделали первый шаг к выпуску больших моделей мобильных телефонов. Далее, более сложный и важный шаг – сделать так, чтобы более качественная большая модель подходила к каждому мобильному телефону более экономично и эффективно.

Приключение только началось.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .