Увлечение большими моделями: самый сладкий торт и самый сложный

2023-08-11 08:43:43

Автор 丨 Бай Цзяцзя

Американский редактор 丨 Fisherman

Источник: Исследовательская лаборатория на основе кремния.

Примечание редактора:

Одна сторона фанатична, а другая холодна.Таков текущий статус крупномасштабной модельной индустрии Китая.«Эпоха Хаоса» может быть наиболее подходящим ярлыком для этой индустрии. За последние шесть месяцев техника и люди, техника и промышленность, человеческая цивилизация и технологическая цивилизация вступили в новый этап реконструкции. За этим изменением стоит не только развитие технологий, но и продвижение ключевых людей и ключевых компаний.

Как передовой наблюдатель интеллектуальной эпохи, «Исследовательская лаборатория на основе кремния» уделяет внимание всем историям, связанным с технологиями.Сегодня мы запускаем план «Эпоха хаоса крупномасштабных моделей», начиная с деконструкции больших Масштабные модели и переводя объектив на передний план этих волн, компании и люди делятся и интерпретируют свои уникальные идеи для читателей.

Эта статья является второй статьей, запланированной в этой серии: «Увлечение большими моделями приложений: самый сладкий пирог и самый сложный проход». Часть 1: Хаотическая эпоха больших моделей: противоречия, дифференциация и будущее

Источник изображения: сгенерировано инструментом Unbounded AI

«Я видел вещи, в которые вы, люди, никогда не поверите. Я видел, как горят боевые корабли на краю Ориона, и я видел, как C-лучи мерцают во тьме возле Врат Тангейзера. Все эти моменты пройдут со временем, как слезы, исчезающие в дождь."

Это финальный монолог в фильме «Бегущий по лезвию», произнесенный репликантом Роем Бэтти.

Позже эта линия была выбрана британским «Обсервером» шестым из десяти лучших классических моментов в истории кино и часто упоминается как представитель научно-фантастических произведений.

В каком-то смысле этот отрывок становится реальностью. Сегодня крупномасштабная модель, которая заставила мир впасть в безумие, поглощает глобальные знания с невообразимой скоростью.Поток людей, вещей и вещей, стоящих за этими персонажами, может быть, не так прост, как Starheap Wars.

А ученые, инженеры и бизнесмены, которые все это сделали, все еще ждут, может быть, они не могут сказать, чего они хотят ждать, более совершенных технологических зондов? Более эффективные производственные инструменты? Супер приложение с большими деньгами?

Или репликанта вроде Роя Бэтти, облегчающего почти отчаянное одиночество людей, смотрящих на галактику.

это идет

что это приносит

Как это произошло?

Где оно впервые проросло?

В чем разница между Китаем и зарубежными странами?

……

Перед лицом бесконечных крупномасштабных моделей сегодня слишком поздно беспокоиться или ждать.Для этого партнера, который будет с нами долгое время в будущем, лучшая церемония приветствия - смотреть на него.

Сторона C переходит на сторону B, открытый исходный код влияет на закрытый

Появление ChatGPT похоже на то, как искусственный интеллект стучится в вашу дверь.

Он был выпущен для широкой публики 30 ноября 2022 года. Всего за два месяца ChatGPT успешно превысил отметку в 100 миллионов активных пользователей в месяц, что сделало его самым быстрорастущим потребительским приложением в истории.

В начале марта Codeway Dijital разработала Chat with Ask AI на основе API ChatGPT.Благодаря мощной функции вопросов и ответов выручка за первое полугодие превысила 16 миллионов долларов США (около 112 миллионов юаней). стать приложением AI + Chatbot с наибольшим количеством загрузок и доходов.

** Успех ChatGPT, по-видимому, указывает на то, что бизнес-логика приложений ИИ для C-конечных пользователей установлена — передача продукта пользователям, и они будут исследовать бесконечные возможности, предоставляемые ИИ. Затем вынырнуть. **

К сожалению, все не так просто.

4 июля компания веб-анализа Similarweb опубликовала данные о том, что глобальные посещения ChatGPT в июне упали на 9,7% по сравнению с предыдущим месяцем, а количество уникальных посетителей упало на 5,7% по сравнению с предыдущим месяцем.

В дополнение к ChatCPT, объем посещений Character.AI также резко снизился в июне, с падением по сравнению с предыдущим месяцем на 32%.

Character.AI может имитировать личности знаменитостей, исторических деятелей и вымышленных персонажей для разговоров, занимая второе место среди всех подобных инструментов AI.

В связи с этим аналитик Similarweb Дэвид Карр сказал: «Отныне чат-боты должны доказывать свою ценность и не принимать все как должное».

** В какой-то степени снижение количества посещений ChatGPT и Character.AI символизирует то, что приложения ИИ для C-конечных пользователей постепенно достигли верхнего предела, и это показывает, что—**

**Пользователям не так интересно изучать возможности ИИ самостоятельно, глубокая интеграция ИИ со сценариями приложений и «поставить молоток рядом с гвоздем» — необходимые условия для посадки больших моделей. **

Microsoft взяла на себя инициативу в том, чтобы стать «носильщиком молота».

Используя технологию OpenAI, материнской компании ChatGPT, Microsoft запустила Microsoft 365 Copilot, а на ежегодной конференции Inspire 18 июля предложила коммерческим клиентам ценник в 30 долларов в месяц.

Согласно сообщениям, Microsoft 365 Copilot может помочь предприятиям анализировать все бизнес-данные, в том числе генерировать самую свежую информацию из утренних собраний, электронных писем и записей чатов и отправлять их в команду, помогая пользователям понять ход проектов на прошлой неделе или из внутренних данных. файлы и сети Создайте SWOT-анализ данных.

**Комбинируя свои собственные сценарии, Microsoft встала на более надежный путь монетизации, и это также модель многих крупных компаний, тестирующих искусственный интеллект для воды сегодня.Весь процесс замкнут, а данные и модели передаются только гигантам. . **

Похоже, что самая передовая технология производства роботов в «Бегущем по лезвию» жестко контролируется корпорацией Тейлор.

Однако реальные события часто более драматичны, чем фильмы. Недавно Meta, также интернет-гигант, анонсировала базовую модель Llama2 с открытым исходным кодом, которая распространяется Microsoft Cloud и доступна для бесплатного коммерческого использования предприятиями, выпустив первый выстрел " антитехнологическая монополия».

Судя по результатам оценки, Llama2 все еще имеет определенное отставание от GPT-4, а также имеет свои преимущества и недостатки с GPT-3.5 и на данный момент является лучшей моделью с открытым исходным кодом на рынке.

Но что именно это значит?

Взяв в качестве примера разделение уровней больших моделей Huawei, его можно разделить на основные большие модели (имитирующие функции человека, такие как язык и зрение), отраслевые большие модели (в соответствии с отраслевыми подразделениями функции нескольких основных больших моделей могут координироваться). и модели сценариев (соответствующие конкретным сценариям в отрасли, таким как продавцы-консультанты, логистика цепочки поставок и оптимизация малых молекул).

Llama2 с открытым исходным кодом Meta представляет собой большую языковую модель в базовой большой модели.Для обучения модели не требуется большого объема данных, а требуется только большой корпус. Благодаря тонкой настройке предприниматели, работающие с крупными моделями, могут разрабатывать приложения ИИ, подходящие для соответствующих отраслей или сценариев.

Точно так же, как система Android поддерживает мобильную интернет-экосистему мобильных телефонов сторонних производителей, Llama2 минимизирует затраты на разработку крупномасштабных моделей для предприятий, чтобы они могли больше сосредоточиться на своих собственных промышленных сценариях.

«Камера Miaoya», которая недавно внезапно взорвалась в Китае, является бенефициаром открытого исходного кода.

Stable Diffusion (SD) — один из самых популярных инструментов для рисования ИИ в настоящее время Это бесплатный проект с открытым исходным кодом, который может быть развернут и использован кем угодно бесплатно. Согласно рыночным прогнозам, принцип «Miaoya Camera» заключается в решении проблемы случайности при выводе SD-изображения с помощью подключаемого модуля модели LoRA.

LoRA на самом деле является моделью технологии тонкой настройки, которая является бесплатной и общедоступной. 25 июля Alibaba Cloud запустила план обучения и развертывания полной серии версий Llama2 в Китае, включая тонкую настройку LoRA.

От ChatGPT, обращенного непосредственно к конечным потребителям C, до сочетания Microsoft больших моделей с собственными сценариями и последующего распространения их среди потребителей или предприятий, а затем до Meta Llama2 с открытым исходным кодом, предоставляющей базовые большие модели и услуги тонкой настройки для предприятий ** несколько путей для крупномасштабного продвижения За посадкой модели стоят крупные игроки, пытающиеся как можно скорее открыть бизнес-замкнутый цикл, и рассмотрение вывода средств для поддержки технологической итерации также является долгосрочным инвестиции в создание промышленной экологии ИИ и борьба за право говорить. **

Стоит отметить, что хотя в статье в качестве примеров используются Microsoft, OpenAI и Meta, это не означает, что они ограничены соответствующими путями.На самом деле, при поддержке технологий и средств ведущие компании имеют силы для развертывания нескольких пути, и это также сделало боевую обстановку более тревожной.

Например, согласно статье, опубликованной The Information 24 июля, крупномасштабная языковая модель с открытым исходным кодом, которую разрабатывает OpenAI, в настоящее время носит кодовое название G3PO, и график выпуска еще не определен внутри компании.

Интересно, что хотя главный Цукерберг заявил в Facebook, что «открытый исходный код способствует инновациям, потому что позволяет большему количеству разработчиков использовать новые технологии… Я считаю, что если экосистема будет более открытой, будет выпущено больше прогресса», Но в телефонной конференции несколько дней спустя он предложил взимать часть дохода от перепродажи услуг с крупных компаний, занимающихся облачными вычислениями, таких как Microsoft, Amazon и Google.

Данные могут стать сильнейшим рвом для китайских компаний

Дай Юсен, управляющий партнер ZhenFund, предлагает остроумную аналогию для этого раунда крупномасштабного модельного предпринимательства: появление GPT-3 эквивалентно открытию нового континента, а ChatGPT-4 — обнаружению золота на новом континенте.

Догоняющее путешествие китайской компании похоже на знание Нового Света и того, где находится золото, и знание того, что OpenAI плывет на лодке, и знание общего вида лодки, но без подробной карты.

Поэтому для китайских игроков в масштабные модели поиск береговых припасов во время этого долгого плавания — вопрос жизни и смерти.

Стыковка — это поиск точки приземления для большой модели и формирование устойчивой бизнес-модели.

Нельзя отрицать, что между отечественными чипами искусственного интеллекта и мировыми стандартами все еще существует определенный разрыв.Ограниченные санкциями на чипы, китайским компаниям сложно расширять масштабы вычислительной мощности.

Кроме того, со стороны алгоритмов, включая различные крупные модели, такие как обработка естественного языка, компьютерное зрение, аудио и мультимодальность, у Китая есть определенные преимущества, но сам алгоритм и вычислительная мощность дополняют друг друга, поэтому он также временно находится в на той же позиции, что и у OpenAI и других лидеров отрасли, на определенном расстоянии.

В нынешней ситуации отечественные предприятия должны усердно работать с данными, если они не хотят отставать от этой волны ИИ.

**Другими словами, один из основных барьеров для китайских крупных производителей моделей в этом раунде конкуренции основан на данных, сформированных на китайском рынке. **

В процессе разработки большой модели данные являются решающим фактором, а качество и масштаб данных напрямую влияют на стоимость разработки и эффект окончательного представления модели.

Однако качественные данные часто содержат большое количество корпоративных секретов, и даже загрузка во внешние сети не допускается, не говоря уже о передаче другим компаниям для масштабной разработки модели.

В марте этого года корейский медиа-экономист сообщил о трех случаях, связанных с неправомерным использованием и злоупотреблением ChatGPT внутри Samsung, в результате чего данные измерений полупроводникового оборудования, выход продукта и другой контент были сохранены в обучающей базе данных ChatGPT, что привело к серьезным убытки компании.

Именно из-за риска утечки информации и высокой стоимости доверия между предприятиями иностранные крупные модельные компании часто начинают увеличивать масштабы крупномасштабных моделей, налаживать промышленную экологию, а затем следуют заявками.

В определенной степени «Письмо о добровольных обязательствах», недавно подписанное такими компаниями, как Microsoft, OpenAI и Amazon в Белом доме, является не только ответом на социальные опасения, вызванные стремительным развитием ИИ, но и сигналом для рынка. , надеясь получить больше социальных институтов и доверия бизнеса.

** Вернувшись в Китай, под руководством национальной власти государственные предприятия и местные органы власти относительно открыты для крупномасштабных моделей, и приложения, экология и построение моделей развиваются одновременно. **

Например, крупномасштабная модель Pangea от Huawei приземлилась на современной крупной поперечной шахте «Lilou Coal Mine» с самыми большими запасами полезных ископаемых и самым продолжительным сроком службы шахты в провинции Шаньдун.

В октябре 2022 года Huawei подписала соглашение о сотрудничестве с Yunding Technology, дочерней компанией Shanneng Group, для полного запуска шахт, искусственного интеллекта, инфраструктуры ИКТ, умных парков, обучения талантов, умных носимых устройств, терминалов для майнинга и ИКТ-решений для отраслевых сценариев. сотрудничество.

С тех пор специалисты с обеих сторон углубились в передовую шахты и активно участвовали в применении крупномасштабных моделей.В реальном производстве 21 специальность в 9 дисциплинах, включая добычу угля, раскопки, основные перевозки, вспомогательные перевозки, были раскопаны подъем, надзор за безопасностью, защита от размыва, промывка и коксование.Сценарии применения, постоянное обновление модели и официально выпущенная первая большая модель ИИ в области добычи полезных ископаемых 18 июля этого года.

Понятно, что одна из функций большой модели Pangu заключается в том, чтобы помочь отделу защиты от размыва в стандартной проверке проектов защиты от размыва и сброса давления, что может снизить нагрузку на ручную проверку на 82% и достичь 100% % приемки антиразмывающих проектов.

Подобные истории также произошли с такими компаниями, как Baidu и HKUST Xunfei.

27 июня этого года Пекин выпустил первую партию из 10 типичных примеров применения крупномасштабных отраслевых моделей, большинство из которых являются «основными» областями, такими как городское управление, умные финансы, здравоохранение и модернизация промышленности.

К ним относится «Помощник по проверке работы оборудования, оснащенный крупной моделью NLP для электроэнергетики», разработанный совместно Baidu и исследовательским отделом State Grid Smart Grid, который может улучшить показатели F1 сегментации профессиональных слов в области электроэнергетики и распознавания объектов, чувствительных к маркетингу электроэнергетики, на 9,27. % и 13,28%, достигая 92,376% и 94,947%;

«Большая модель городского мозга», совместно разработанная iFLYTEK и Zhongguancun Science City City Brain, решает такие проблемы, как ограниченный доступ и применение ресурсов данных городского управления, слабая способность к обобщению моделей услуг городского управления и информационная безопасность в эпоху искусственного интеллекта.

** Таким образом, китайские компании встали на уникальный путь — от отраслевых крупных моделей к общим крупным моделям, а затем посмотрите, какая технология крупномасштабных моделей необходима для крупномасштабной реализации приложений. **

** И этот процесс также соответствует общему мнению отрасли в отношении производства высококачественных данных — снизить порог за счет популяризации ИИ и в то же время внедрить ИИ в отрасли, а затем накапливать и собирать больше высококачественных данных, и, наконец, продвиньте модель вперед. Итерируйте быстро. **

Причина, по которой отечественные сценарии применения крупномасштабных моделей отличаются от зарубежных, заключается, по сути, в том, что на фоне того, что вычислительная мощность и алгоритмы не доминируют, страна и предприятия формируют совместную силу для ускорения разработки «данные-модель-данные». "маховик.

** И что действительно определяет будущее направление во время этого раунда стыковки, так это то, можно ли построить в Китае рынок данных с высоким качеством, ликвидностью и безопасностью. **

Несколько дней назад Китайская ассоциация стандартов связи и Китайская академия информационных и коммуникационных технологий опубликовали «Отчет об исследовании развития баз данных (2023 г.)». В отчете указано, что объем мирового рынка баз данных в 2022 г. а размер китайского рынка баз данных составит 5,97 млрд долларов США (около 40,36 млрд долларов США) млрд юаней, что составляет 7,2% мирового рынка.

По оценкам, к 2027 году общий объем китайского рынка баз данных достигнет 128,68 млрд юаней, а совокупный годовой темп роста рынка (CAGR) составит 26,1%.

Где самый сладкий торт?

Подводя итог, можно сказать, что в треке больших моделей в целом есть две тенденции.

**Одна из них заключается в том, что ведущие компании переходят от приложений стороны C к стороне B. Некоторые игроки предпочитают интегрировать свои собственные ресурсы и создавать комплексную систему обслуживания от базы данных до промышленных приложений. масштабная модель платформы для интеграции с малыми и средними предприятиями. Сформируйте объединенные силы для атаки на ведущих игроков. **

**Во-вторых, зарубежные компании первыми внедряют масштабные модели в собственные сценарии, а отечественные компании глубоко интегрированы с реальными отраслями, формируя маховик данных. **

Между приливами и отливами постепенно всплывал «самый сладкий кусок пирога» в прикладном слое производственной цепочки ИИ.

** Судя по текущей ситуации, языковые крупномасштабные модели и визуальные крупномасштабные модели являются наиболее четкими путями коммерциализации и наиболее концентрированными крупномасштабными моделями на рынке. **В дополнение к приложениям, ориентированным непосредственно на потребителя, таким как ChatGPT и Miaoya Camera, компания также добивается устойчивого прогресса в таких областях, как совместный офис, редактирование изображений и интеллектуальное обслуживание клиентов.

Однако степень однородности таких приложений относительно высока. Если технология не будет такой же лидирующей, как OpenAI, эффект не будет сильно отличаться. Более того, даже OpenAI необходимо постоянно внедрять новые функции, чтобы удерживать клиентов.

20 и 21 июля ChatGPT увеличил количество сообщений, которые можно отправить через GPT-4, и запустил функцию пользовательской команды.

Напротив, многопользовательские онлайн-игры (MMO) имеют более высокие отраслевые барьеры, также основанные на возможностях генерации графики. Функция глубокого обучения ИИ соответствует многогранным характеристикам игры и играет ведущую роль в текущем процессе разработки игровых технологий, предоставляя игрокам более интеллектуальный, богатый и персонализированный игровой опыт.

Ожидается, что на фоне стабильного распределения номеров версий игр игровая индустрия в краткосрочной перспективе станет самым сладким куском пирога для масштабных модельных приложений.

** В долгосрочной перспективе крупная модель — это, по сути, инструмент для повышения качества и эффективности отрасли.Готовность клиентов приобретать услуги или продукты напрямую связана с преимуществами, которые может использовать крупная модель. Поэтому, чтобы в будущем найти самые неординарные сценарии применения, ключевыми показателями, которые необходимо исследовать, являются масштабы самой отрасли и высота рва. **

«Исследовательское бюро на основе кремния» считает, что транспортные средства на новой энергии являются наиболее творческим полем для будущих крупномасштабных моделей.

С точки зрения перспектив развития, новые энергетические транспортные средства соответствуют глобальной тенденции потребления «низкоуглеродных и экологически чистых», что способствует сокращению потребления энергии нефтехимической промышленностью.

Например, в июне 2022 года министры окружающей среды 27 стран ЕС достигли договоренности о новом законодательстве по защите климата: с 2035 года ЕС позволит ездить по дорогам только автомобилям с нулевым выбросом углекислого газа.

Только с точки зрения сокращения выбросов CO2 большие модели могут найти свой путь.

Помимо вождения, вся цепочка автомобильной промышленности сама по себе также является основным источником выбросов углерода, а выплавка металлического сырья, транснациональные перевозки, производство и другие звенья находятся в центре внимания сокращения выбросов углерода. Однако из-за сложной производственной цепочки, тривиальных данных и широких сценариев применения автомобильным компаниям сложно собирать и оценивать углеродный след всего жизненного цикла автомобилей.

С интеллектуализацией цепочки автомобильной промышленности различные данные передаются в облако, и постепенно становится возможным определить четкий путь сокращения выбросов углерода. Ожидается, что в этом процессе «маховик данных» большой модели станет « «пятое» автомобиля. «Колесо», чтобы разрушить информационные барьеры между звеньями и сформировать интеллектуальный путь в производственной цепочке.

** С другой стороны, сочетание больших моделей и транспортных средств, работающих на новой энергии, на самом деле является беспроигрышным путем. **

Высокая стоимость логического вывода больших моделей является причиной того, что многие предприятия отказываются от этого. С развитием технологий большие модели выпускаются из облака в продукты, и сам автомобиль также может выполнять определенные логические задачи на основе встроенного чипа и передавать результаты в облако. Для владельцев автомобилей это означает, что транспортные средства на новых источниках энергии по-прежнему сохранят определенную степень «умности» без подключения к Интернету, что является дополнительным преимуществом для пользователей.

**Однако предстоит преодолеть еще несколько трудностей, прежде чем большая модель сможет по-настоящему расширить возможности автомобильной промышленности, использующей новые источники энергии. **

Например, проблемы с хранением данных.

Еще в 2017 году в Китае прошла волна промышленного бума больших данных, типичным сценарием которого было раннее предупреждение и техническое обслуживание ключевого оборудования. С точки зрения непрофессионала, это должно предсказать, когда оборудование может отключиться, с помощью данных, возвращаемых датчиком, и подсказать, какое оборудование следует заменить.

Однако после фактической реализации выяснилось, что для формирования полной модели данных требуется не менее 2-3 циклов данных, а стоимость одного только хранения достигает десятков миллионов, что слишком рискованно для предприятий.

И это верно и сегодня, потому что исследования и разработки больших моделей и последующие итерации также требуют массивных данных в качестве поддержки, поэтому сегодняшние автомобильные компании более склонны сначала создавать платформы, соединять данные и бизнес, а затем использовать большие модели для создания некоторых моделей. подходит.

** Во-вторых, по сравнению с генеративными крупными моделями, промышленная область уделяет больше внимания стабильности. **

Чтобы привести простой пример, мы используем ChatGPT для написания стихов, ожидая, что это будет творчески, каждое произведение отличается, но в промышленной сфере, если каждая инструкция отличается, это вызовет большие проблемы.

Поэтому глубокая интеграция больших моделей и производственных линий должна быть аналогична написанию кодов для генерации промышленных инструкций или предложения оптимизационных решений для конкретных звеньев, а реально вмешиваться в производство невозможно.

Как говорится, благословение приходит от несчастья, а несчастье приходит от благословения.Две трудности, с которыми сталкиваются крупномасштабные модели, чтобы войти в отрасль транспортных средств на новой энергии, на самом деле являются рвами для компаний, которые добьются успехов в этой области в будущем. постоянное развитие технологии хранения и появление новых цифровых фабрик, таких как «фабрики черного света», также снижается сопротивление подключению больших моделей к новой энергетической отрасли.

В некоторых более передовых областях они начали производить химические реакции.

В настоящее время реализация крупномасштабных моделей в области транспортных средств на новой энергии в основном сосредоточена на автономном вождении. Baidu, Tesla, Huawei и Google развернули демонстрационную зону на дороге.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .