Произведено | Tiger Sniff Technology Group
Автор | Ци Цзянь
Редактор | Ляо Ин
Источник изображения: сгенерировано Unbounded AI
7 августа еще одна отечественная стартап-компания в области искусственного интеллекта выпустила собственную бесплатную коммерческую модель искусственного интеллекта с открытым исходным кодом: XVERSE-13B. Компания Yuanxiang XVERSE была основана Яо Сином, бывшим вице-президентом Tencent и основателем лаборатории искусственного интеллекта Tencent.
Поскольку в июле Meta выпустила крупномасштабные модели серии LLaMA 2 с открытым исходным кодом для бесплатного коммерческого использования, на рынке крупномасштабных моделей ИИ назревает новая волна «открытого исходного кода».
2 августа Wenxin Qianfan, платформа крупномасштабных моделей ИИ под управлением Baidu, объявила о доступе к полной серии моделей с открытым исходным кодом LLaMA 2. Количество крупномасштабных моделей, которые можно вызвать на платформе, увеличилось до 33. , За исключением 3 моделей Wenxin, остальные 30 моделей имеют открытый исходный код.Модели, включая ChatGLM2, RWKV, MPT, Dolly, OpenLLaMA, Falcon и т. д.
На следующий день Alibaba Cloud также объявила о присоединении к модели с открытым исходным кодом. Модель Tongyi Qianwen с 7 миллиардами параметров с открытым исходным кодом включает в себя общую модель Qwen-7B и диалоговую модель Qwen-7B-Chat. Эти две модели были запущены в сообществе Mota. Они имеют открытый исходный код, бесплатны и доступны на коммерческой основе.
Интересно, что это положительное отношение к открытому исходному коду и открытости началось с Microsoft, крупного владельца закрытой модели ChatGPT. ** 18 июля Microsoft объявила, что будет сотрудничать с Meta для выпуска коммерческой версии модели LLaMA 2 с открытым исходным кодом, предоставляя предприятиям альтернативы моделям OpenAI и Google. ** Монопольное положение OpenAI на рынке крупномасштабных моделей ИИ, похоже, «нацелено» на всю отрасль, даже на ее ближайших партнеров.
OpenAI GPT-4, признанная во всем мире модель номер один для больших языков, в настоящее время является единственной моделью для больших языков, за которую готово платить большое количество пользователей.
У лучшего ученика в классе обычно нет мотивации присоединиться к учебной группе. Точно так же у **OpenAI нет причин или мотивов для открытого исходного кода. **
Однако с полным открытым исходным кодом LLaMA 2 все больше и больше разработчиков вкладывают средства в Meta и различные модели с открытым исходным кодом. Точно так же, как Android использует открытый исходный код для борьбы с iOS, большое количество моделей искусственного интеллекта с открытым исходным кодом активно обходят технические барьеры GPT-4 и окружают OpenAI экосистемой с открытым исходным кодом. **
Почему с открытым исходным кодом?
Когда OpenAI впервые запустил функцию плагина, многие люди сравнивали модель ИИ с будущими Windows, iOS и Android. Теперь, с выходом LLaMA 2, большая модель ИИ — это не только функция, но даже структура рынка развивается в сторону операционной системы.
Инициированный LMSYS Org, организацией, возглавляемой Калифорнийским университетом в Беркли, это рейтинговое соревнование для больших языковых моделей (LLM); по состоянию на 20 июля последняя версия рейтинга насчитывала 40 больших моделей ИИ, и пятерка лучших все еще закрыта. Исходники Model (Proprietary), в которых представлены три модели ГПТ-4, ГПТ-3,5-турбо и Клод. Однако следующие 34 модели, за исключением Google PaLM-Chat-Bison-001, являются моделями с открытым исходным кодом, 15 из которых являются некоммерческими.
* Таблица лидеров крупных языковых моделей (LLM) LMSYS Org выпущена 20 июля.
Chatbot Arena: вычисляет рейтинг Эло, используя более 50 000 голосов пользователей.
MT-Bench: набор сложных многораундовых задач.
MMLU (5-shot): тест, который измеряет многозадачную точность модели на 57 задачах. *
Хотя по возможностям модели, глядя на весь рынок, ни одна модель вне зависимости от открытого или закрытого кода не осмелится конкурировать в лоб с GPT-4. Однако «тигры» не могли противостоять волкам и не могли победить большие модели GPT-4.Они решили «перестроиться и обогнать» и использовать открытый исходный код, чтобы захватить экологию приложений. чем-то похоже на борьбу Android против iOS.
"Сейчас все большие модели с открытым исходным кодом имеют одну цель — маркетинг."
Основатель отечественной компании, занимающейся исследованиями и разработками крупномасштабных моделей с открытым исходным кодом, признался Tiger Sniff, что основной причиной продвижения крупномасштабных моделей с открытым исходным кодом и систем Android с открытым исходным кодом является бесплатный захват рынка. «Многие крупные компании выпустили большие модели ИИ или даже просто сделали приложение на основе существующей модели, а затем начали продвигать его с большой помпой. На самом деле, для пользователей базовых больших моделей тратить больше денег на рекламу обходится дороже. чем это действительно не открытый исходный код для модели.» Это также лучший способ для компаний ИИ, чтобы доказать свою силу.
Во-первых, модели с открытым исходным кодом легче оценить, чем модели с закрытым кодом. Поскольку код и наборы данных моделей с открытым исходным кодом общедоступны, исследователи могут напрямую проверять архитектуру модели, обучающие данные и процесс обучения, чтобы провести более глубокий анализ модели, чтобы понять ее сильные и слабые стороны.
** «Некоторые большие модели ИИ кажутся очень способными, но они не имеют открытого исходного кода, и вы можете видеть только результаты его вывода». **
По сравнению с моделью с открытым исходным кодом модель с закрытым исходным кодом может понять преимущества и недостатки модели только посредством оценки производительности модели. Это приводит к тому, что производительность моделей с закрытым исходным кодом может быть искусственно преувеличена, либо скрыты их недостатки. Прозрачность модели с открытым исходным кодом может помочь разработчикам глубже понять модель и более объективно ее оценить.
Для опоздавших есть еще одна проблема с закрытой моделью: легко усомниться в оригинальности технологии. Многие крупные разработчики моделей однажды сказали Huxiu: «Если говорить прямо, для тех моделей, которые не являются открытым исходным кодом, даже если это оболочка LLaMA или просто вызывает интерфейс ChatGPT в фоновом режиме, кто знает?»
Когда вышла первая волна отечественных крупных моделей ИИ, такие голоса сомнений были широко распространены в Интернете. Для тех крупных моделей ИИ, которые не являются открытым исходным кодом, трудно доказать их невиновность.Чтобы доказать, что они не вызывают API ChatGPT, некоторые компании даже вынесли сервер рассуждений и вытащили сетевой кабель для демонстрации на место.
Открытый исходный код, несомненно, является одним из лучших способов самостоятельной сертификации крупных моделей ИИ. Но реальная ценность **открытого исходного кода не в возможности самосертификации, а в том, чтобы овладеть экологией. **
«После выпуска LLaMA 2 он определенно быстро захватит экосистему OpenAI». Более того, открытость API-интерфейса GPT-4 также очень низкая, поэтому существует множество ограничений на развитие модели GPT. В результате многие разработчики выбирают модели с открытым исходным кодом, такие как LLaMA, которые могут не только точно настраивать инструкции, но и проводить исследования базовой модели.
"LLaMA определенно более популярен среди разработчиков, чем OpenAI."
Когда LLaMA 2 был впервые выпущен 19 июля, на GitHub было более 5600 проектов с ключевыми словами, включая «LLaMA», и более 4100 проектов, включая «GPT-4». Через две недели после его выпуска скорость роста LLaMA увеличилась: на момент написания статьи насчитывается более 6200 «LLaMA» и более 4400 «GPT-4».
С другой стороны, модели с открытым исходным кодом можно загрузить локально для частного развертывания, что облегчает обучение ИИ для коммерческих компаний. Приложения ИИ таких компаний необходимо обучать на основе их собственных бизнес-данных, а масштабная модель ИИ, развернутая в частном порядке, может в наибольшей степени защитить безопасность данных. В то же время существует больше вариантов вычислительной мощности для приватизированного развертывания, будь то облачный сервис, локальное развертывание или даже распределенная вычислительная мощность нескольких IDC, что значительно снижает стоимость обучения модели и рассуждений.
Хотя ChatGPT собрал 100 миллионов активных пользователей в месяц всего за два месяца, в экосистеме разработчиков скорость, с которой модель с открытым исходным кодом захватывает умы пользователей, кажется выше.
В настоящее время многие отечественные ИИ-компании решили выпускать модели с открытым исходным кодом. К ним относятся модель с открытым исходным кодом ChatGLM-6B, выпущенная Zhipu AI, MOSS, выпущенная Университетом Фудань, Wudao Tianying Aquila, выпущенная Исследовательским институтом Чжиюань, и Baichuan-7B (13B), выпущенная Baichuan Intelligent. Среди них ChatGLM-6B, большая модель с открытым исходным кодом, выпущенная **Zhipu AI, была загружена более 4 миллионов раз по всему миру и получила 32 000 звезд на GitHub, что на 3 000 звезд больше, чем у LLaMA. **
«Если мы не создадим модель с открытым исходным кодом, рынок скоро будет заполнен LLaMA». крупная модель.
Некоторые отечественные крупные модели искусственного интеллекта с открытым исходным кодом
Фактически, до того, как началась тенденция LLM, генеративный ИИ уже вел битву открытого и закрытого исходного кода.
**При большом количестве разработчиков и продуктовых приложений графическая модель Wensheng с открытым исходным кодом Stable Diffusion чуть не загнала в угол первую модель OpenAI с закрытым исходным кодом Dall-E 2. Хотя пользователи в целом считают, что возможности модели Stable Diffusion не так хороши, как у другого продукта с закрытым исходным кодом MidJourney, Stable Diffusion захватил большое количество рынков графов Vincent благодаря своим атрибутам с открытым исходным кодом и бесплатности и стал Самая популярная графовая модель Винсента.Его компания-разработчик RunwayML And Stability AI также получила много внимания и финансирования. **
Модель с открытым исходным кодом LLaMA 2, похоже, намеревается вытеснить OpenAI в области LLM.
Опенсорс с товарами
LLaMA 2 в настоящее время имеет открытый исходный код, все три модели серии: версии с 7 миллиардами, 13 миллиардами и 70 миллиардами параметров. Однако на рынке также ходят слухи, что «на самом деле у Meta есть версия с большими параметрами, которая не была выпущена. В следующей версии может быть версия с большими параметрами, но она может быть не с открытым исходным кодом».
Стоит отметить, что в настоящее время многие модели с открытым исходным кодом не все являются открытыми. В модели Enlightenment 3.0, выпущенной научно-исследовательским институтом Чжиюань, только базовая языковая модель «Тяньинь» является открытым исходным кодом; ChatGLM, выпущенный Zhipu AI, открыл только часть серии моделей, а более крупная модель со 130 миллиардами параметров все еще открыта. закрытый источник. **
Независимо от того, является ли LLaMA 2 «зарезервированной» для более крупных моделей, «бесплатная» форма, несомненно, ускорит формирование Meta на рынке крупных моделей и подтолкнет ее к «старой дороге» Android.
Благодаря экосистеме с открытым исходным кодом система Android привлекла большое количество разработчиков и пользователей по всему миру. С точки зрения экологии технологий она сильно проверила и сбалансировала ведущую систему с закрытым исходным кодом iOS, а на некоторых рынках даже сформировала собственную монополию. С 2018 года Евросоюз наложил на Google штраф в размере более 4 млрд евро из-за монопольного механизма системы Android. Из этого заоблачного штрафа мы также можем видеть, насколько прибыльна система Android с открытым исходным кодом.
Согласно отчету исследовательской компании Sensor Tower, расходы пользователей на Google Play составят примерно 53 миллиарда долларов США в 2022 году, а в 2023 году эта цифра вырастет до 60 миллиардов долларов США. Согласно отчету, опубликованному другим исследовательским институтом, Statista, по состоянию на январь 2022 года в магазине Google Play находится около 140 000 приложений.
На данном этапе модель искусственного интеллекта с открытым исходным кодом, очевидно, еще не так популярна, как мобильные телефоны. Однако, даже если ИИ действительно так же популярен, как мобильные телефоны, такие гиганты, как Meta, не отпустят компании, заработавшие много денег на LLaMA 2.
В соглашении об открытом исходном коде LLaMA 2 есть такое положение: **Если количество активных пользователей в месяц превышает 700 миллионов, вы должны подать заявку на лицензию от Meta. Meta может по своему усмотрению предоставить вам лицензию, и вы не имеете права осуществлять какие-либо из этих прав. **
В то же время, в дополнение к версии с открытым исходным кодом модели с открытым исходным кодом и применению больших моделей ИИ, это также может помогать вычислительной мощности «приносить пользу».
Первые два производителя в Китае, которые продвигают крупномасштабные модели ИИ, Baidu и Ali, являются поставщиками облачных услуг. Два других поставщика облачных услуг, Tencent Cloud и Huawei Cloud, хотя и не имеют продуктов LLM, таких как Wenxin Yiyan и Tongyi Qianwen, также продолжают кричать о моделях ИИ. Основной причиной этого является «эффект переноса» большой модели в облаке.
«Объявление о некоторых действиях в отношении крупномасштабных моделей ИИ также продвигается рынком и клиентами совместно. За последние несколько месяцев было слишком много клиентов, которые пришли спросить о крупномасштабных моделях», — сказал лидер облачного бизнеса Tencent. Huxiu, что вычислительная мощность выстроилась в очередь, что является лучшим доказательством способности большой модели ИИ перевозить грузы.
**Модель не должна приносить деньги, но вычислительная мощность должна приносить прибыль. **Alibaba открыла Tongyi Qianwen, а Baidu представила 30 моделей с открытым исходным кодом на платформе крупномасштабных моделей Wenxin Qianfan Эти два действия должны предоставить пользователям «бесплатные» возможности искусственного интеллекта. Пользователи, использующие модель с открытым исходным кодом, больше не платят за ИИ, но пока их ИИ работает в облаке Alibaba Cloud и Baidu Smart Cloud, им придется платить за вычислительную мощность.
«ИИ также должен вернуться к идее облака и зарабатывать на облаке.» Синь Чжоу, генеральный менеджер Baidu Smart Cloud AI and Big Data Platform, сказал, что первоначальное намерение открыть Платформа большой модели предназначена для создания ценности для бизнеса клиентов. Создавая ценность, она может повысить лояльность старых клиентов и привлечь больше новых клиентов. Это очень помогает в расширении эффекта масштаба поставщиков облачных услуг.
Бесплатно дороже
«10 миллионов, это примерно столько же, сколько стартовая цена за кастомизацию большой модели.»
Основатель крупной модельной компании с открытым исходным кодом назвал цену посреднику, который пришел проконсультироваться по телефону.
«После того, как модель с открытым исходным кодом будет признана пользователями, вы можете поговорить с другими о плате за услуги для индивидуальной разработки». по крайней мере то, что это стоит десятки миллионов долларов. Следовательно, рынок, на который он ориентируется, должен в десятки или сотни раз превышать стоимость разработки.
С текущей точки зрения, лучший способ для **компаний ИИ заработать на моделях с открытым исходным кодом — начать с услуг. **
К счастью, большинство пользователей больших моделей ИИ очень нуждаются в этих услугах.
"Модель с открытым исходным кодом, бесплатная и коммерчески доступная. Это означает, что начиная со загрузки модели, развертывания модели, обучения, настройки и разработки приложений в реальных приложениях, всю работу необходимо выполнять самостоятельно", — разработчик приложений LLaMA. сказал Huxiu, большинство поставщиков моделей с закрытым исходным кодом будут предоставлять услуги по обучению и развертыванию, а также могут настраивать функции разработки в соответствии с потребностями пользователя. Но если вы используете модель с открытым исходным кодом, вам придется делать все эти задачи самостоятельно, никто не поможет вам обучаться, никто не найдет вам вычислительную мощность и никто не поможет настроить разработку.
«На самом деле производители моделей с закрытым исходным кодом продают услуги.» Руководитель онлайн-образовательного учреждения, который провел исследование приложений ИИ на основе модели LLaMA, сказал Хуксиу: «Модель с открытым исходным кодом, похоже, бесплатна. , но в процессе развертывания все еще нужно потратить много денег». После добавления модели ИИ стоимость рабочей силы и вычислительной мощности в ИТ-отделе значительно возросла.
Хотя обучение и настройка на основе моделей с открытым исходным кодом не представляет сложности для большинства ИТ-персонала. Однако для проведения глубоких исследований и разработки модели все же требуются некоторые технические резервы в части алгоритмов и ИИ. Поскольку концепция крупномасштабных моделей ИИ становится все более популярной, цена талантов в этой области также растет.
«** Рост затрат на оплату труда на самом деле плавающий, но стоимость серверов и оборудования реальна. С момента инвестирования в большие модели до сегодняшнего дня наши затраты увеличились примерно на 20%-30%. **» — сказал ответственный человек. вышеупомянутого онлайн-образовательного учреждения В настоящее время его организация все еще находится на стадии исследования сцены ИИ, и самая большая трудность заключается в том, что ей необходимо экспериментировать с каждой сценой. «Если один выйдет из строя, замените его другим. В этом процессе каждый шаг стоит денег».
В связи с этим Хусю спросил инсайдера Baidu Smart Cloud об услуге и стоимости Baidu Wenxin Qianfan с точки зрения развертывания, что сэкономит деньги**».
По сути, независимо от того, модель с открытым исходным кодом или модель с закрытым исходным кодом, стоимость развертывания модели рассчитывается из расчета «человек/день», и существенной разницы в затратах вычислительных мощностей на последующие не будет. обучение и рассуждения. «**Однако использование моделей с открытым исходным кодом для самостоятельного обучения, развертывания и разработки только сделает этот процесс очень хлопотным.» Инсайдер Baidu сказал, что конкретная стоимость развертывания зависит от конкретного проекта, и разница очень велика. Однако на самом деле нет существенной разницы между открытым исходным кодом и закрытым исходным кодом с точки зрения затрат на развертывание и использование. ** А с точки зрения безопасности данных большинство моделей с закрытым исходным кодом также можно развертывать в частном порядке.
**На данном этапе ИИ все еще трудно достичь инклюзивности. **
У большинства компаний, занимающихся интернет-бизнесом, есть свои команды по исследованиям и разработкам в области ИТ. Но для многих отраслей розничной торговли, традиционного производства и сферы услуг цифровая трансформация является сложной проблемой, им действительно сложно изучать обучение, развертывание и обоснование больших моделей ИИ.
Для этих компаний лучшим продуктом ИИ является универсальный плагин ИИ. "Что нам нужно, так это просто робот для обслуживания клиентов, чьи разговоры не выглядят такими идиотскими. Я попросил меня научиться обучать модель, и это немного увлекательно", - сказал Хуксиу менеджер бизнес-направления бренда электронной коммерции. за последние шесть месяцев он просто слушал. Говорят, что способность ИИ к диалогу сильнее, чем раньше, но ChatGPT еще не пробовали. Хотя он также готов осваивать новые технологии, сейчас для него недостаточно мотивации тратить время на обучение и вкладывать деньги в ИИ.
«Если в платформе или программном обеспечении, которое я использую сейчас, нет плагина, я могу использовать его, просто взяв в руки, иначе я не буду слишком много думать о том, чтобы потратить деньги на немедленное обновление ИИ-помощника. " Низкий.
«** Для этого торговцам нужен искусственный интеллект, и его можно применять и расширять без каких-либо чувств.**» Производитель SaaS Weimob создал такое приложение WAI в цифровом маркетинге, которое помогает продавцам использовать возможности искусственного интеллекта в виде встраивания существующих приложений. Обеспечьте продавцов диалогами с искусственным интеллектом и возможностями генерации текста и изображений на основе больших языковых моделей.
Открытое подключение больших моделей к сервисным инструментам SaaS чем-то похоже на вызов модели Baidu Wenxin Qianfan. Хотя выполняются только вызовы интерфейса и Finetune, он предоставляет пользователям больше, быстрее и стабильнее возможности посадки ИИ.
«Модели с открытым исходным кодом могут упростить пользователям начало работы, и теперь многие модели с открытым исходным кодом обновляются быстрее, чем крупные производители».» Главный операционный директор Weimob Инь Шиминг считает, что открытый исходный код и открытость могут быстро предоставить возможности ИИ. пользователям В ваших руках то, что действительно нужно пользователям, — это искусственный интеллект «подключи и работай». **
Для большинства пользователей, которые все еще находятся на стадии тестирования, экспериментирования и испытания больших моделей ИИ, порог для моделей с открытым исходным кодом явно ниже, а начальные затраты практически равны нулю.
Многие пользователи использовали модель с открытым исходным кодом с самого начала и будут продолжать использовать ее в будущем. Упомянутые выше проблемы развертывания и обучения порождают цепочку индустрии услуг для моделей с открытым исходным кодом.
Чен Ран На этой волне роста больших моделей недавно созданная OpenCSG занимается обслуживанием больших моделей с открытым исходным кодом.
Услуга больших моделей, предоставляемая OpenCSG, в основном направлена на обучение и внедрение моделей с открытым исходным кодом для предприятий. От выбора моделей с открытым исходным кодом до гибридных распределенных вычислительных мощностей в сочетании с обучением бизнес-моделям, разработкой серверных приложений и т. д., он может предоставлять услуги предприятиям.
"**По моему мнению, крупные модели похожи на все модели SaaS. Отрасли вверх и вниз по течению будут постепенно обогащаться, и клиенты будут ориентироваться не только на возможности модели". мощная модель, но лучше, проще и проще использовать большие модели ИИ для обслуживания своего бизнеса.
Экология с открытым исходным кодом вокруг ИИ
Во всей цепочке индустрии искусственного интеллекта открытый исходный код выходит далеко за рамки моделей. От исследований и разработок до развертывания приложений почти все звенья неотделимы от темы открытого исходного кода.
** Алгоритмы, вычислительная мощность, данные и три элемента ИИ требуют поддержки с открытым исходным кодом. **
На уровне алгоритмов большие модели ИИ с открытым исходным кодом находятся на относительно поздней стадии. В ранних исследованиях и разработках ИИ почти все модели ИИ использовали фреймворки машинного обучения, которые эквивалентны созданию наборов инструментов ИИ. Текущие основные фреймворки машинного обучения, включая TensorFlow, Pytorch и PaddlePaddle (летающее весло), являются фреймворками с открытым исходным кодом.
На уровне данных набор данных с открытым исходным кодом Commen Crow является важным источником данных в процессе обучения модели GPT. В настоящее время многие учреждения и компании, занимающиеся данными, выпустили продукты с открытым исходным кодом для наборов данных для обучения ИИ, включая набор данных COIG-PC Научно-исследовательского института Чжиюань и мультимодальный набор данных DOTS-MM-0526 Гаитянского AAC.
Для издателей наборов данных открытый исходный код может не только повысить влияние и ценность бренда, но и наборы данных с открытым исходным кодом могут также собирать положительные отзывы от сообщества открытого исходного кода для поиска и исправления ошибок или несоответствий в данных. Эта внешняя проверка помогает улучшить качество данных, а также еще больше обогащает продуктовую экосистему издателя.
«**Инженеры-алгоритмы часто сталкиваются с проблемой нехватки данных в исследованиях и разработках. Высококачественные данные могут привести к качественным улучшениям в оценке моделей. **Моя страна в настоящее время сталкивается с проблемой нехватки высококачественных наборов данных, которая также Китайские крупные модели мешают развитию технологий».
** С точки зрения вычислительной мощности, самого большого узкого места в развитии ИИ, структура чипов с открытым исходным кодом также стимулирует развитие отрасли. **
4 августа Qualcomm объявила о создании совместного предприятия с четырьмя полупроводниковыми компаниями для ускорения коммерциализации чипов на основе архитектуры RISC-V с открытым исходным кодом. В настоящее время на рынке представлены три основные платформы микросхем: x86, используемая процессорами Intel, Arm, используемая графическими процессорами Nvidia, и RISC-V, платформа микросхем с открытым исходным кодом.
«RISC-V может предоставить программируемую среду. Команда разработчиков чипов может использовать RISC-V для выполнения большого количества работ по предварительной и постобработке, а также может добавлять специальные ускорители или функциональные модули, отвечающие потребностям пользователя для удовлетворения потребностей пользователя. «Ган Чжицзянь, старший вице-президент по маркетингу и развитию бизнеса в SiFive, сказал, что экосистема RISC-V предоставляет множество возможностей для исследований и разработок чипов, что очень помогает удовлетворить быстро растущий сегодня спрос на чипы ИИ.
Arm и x86 имеют относительно закрытые экосистемы по сравнению с RISC-V. ** В экосистеме Arm пользователи могут выбирать только ограниченные возможности, предоставляемые Arm, в то время как в экосистеме RISC-V участвует много компаний, и будет больше типов продуктов и вариантов выбора. **
Архитектура с открытым исходным кодом также стимулирует индустрию микросхем к ускорению конкуренции.Ган Чжицзянь сказал: «** Как поставщик услуг архитектуры микросхем с открытым исходным кодом, мы также будем конкурировать с другими компаниями. разновидность конкуренции. В конечном счете, это будет способствовать процветанию и прогрессу экосистемы RISC-V.**»
Хотя архитектура набора инструкций RISC-V является бесплатной и с открытым исходным кодом, основная интеллектуальная собственность, созданная производителями микросхем на основе вторичной разработки архитектуры набора инструкций RISC-V, имеет независимые права интеллектуальной собственности и может быть авторизована за счет внешних сборов. По данным Международного фонда RISC-V, число участников увеличится более чем на 26% по сравнению с прошлым годом в 2022 году, а общее количество подразделений превысит 3180, охватывая 70 стран/регионов, включая Qualcomm, Intel, Google, Alibaba, Huawei и UNISOC, Sharp и многие другие ведущие производители чипов.
Открытый исходный код является преимуществом для RISC-V, но также создает некоторые проблемы. RISC-V имеет всего более 40 основных наборов инструкций, а также десятки инструкций расширения основных модулей.Любое предприятие и разработчик могут бесплатно использовать RISC-V для создания микросхем с независимыми правами интеллектуальной собственности.
Однако открытый исходный код, широкие возможности настройки и модульные функции также делают экосистему RISC-V более фрагментированной и сложной.
«После того, как каждая компания, занимающаяся исследованиями и разработками чипов, обновит набор инструкций RISC-V, она фактически создаст новую архитектуру. Она называется RISC-V, но разные компании несовместимы с RISC-V, а экология с открытым исходным кодом на самом деле .**» Лу Тао, президент Weiwei Technology и генеральный менеджер Большого Китая, считает, что архитектура чипов с открытым исходным кодом и экология программного обеспечения очень важны, но разным командам очень сложно найти баланс между открытостью, настройка и фрагментация.Проверьте мудрость и способности команды R&D.
Кроме того, архитектура Arm уже произвела графические процессоры, межпроцессорные процессоры и другие чипы, подходящие для обучения и рассуждений ИИ, а техническая экология стала более полной и зрелой. Изначально RISC-V предназначался для разработки процессоров, хотя он очень открыт, разработка чипов ИИ все еще находится на стадии исследования.
По данным исследовательской компании Counterpoint Research, к 2025 году совокупные поставки процессоров RISC-V превысят 80 миллиардов, а совокупный годовой темп роста составит 114,9%. К тому времени RISC-V займет 14% мирового рынка процессоров, 28% рынка IoT, 12% промышленного рынка и 10% автомобильного рынка.
Qualcomm уже внедрила RISC-V в микроконтроллеры в своей SoC Snapdragon 865 в 2019 году и на сегодняшний день поставила более 650 миллионов чипов RISC-V. На форуме AI Hardware Summit в сентябре 2022 года профессор Крсте Асанович, изобретатель RISC-V, сообщил, что Google начала использовать SiFive Intelligence X280 на основе RISC-V для разработки своей платформы машинного обучения TensorFlow. **До этого Google более 10 лет проводил самостоятельные исследования архитектуры чипа TPU.
Хотя разработать чипы RISC-V с нуля сложно, природа RISC-V с открытым исходным кодом дала китайским чипам, которые также начинали с нуля, шанс выжить в условиях блокады и монополии. компании являются самыми быстрорастущими в мире. Китайские производители чипов более агрессивны и готовы решать проблемы». Ган Чжицзянь сказал, что китайский рынок является ключом к стимулированию развития индустрии чипов. Китайский рынок чипов огромен, например, спрос на вычислительную мощность автомобильных чипов в Китае намного превышает спрос на европейском и американском рынках. ** В связи с растущим спросом китайских предприятий на вычислительные мощности ИИ китайская индустрия чипов ИИ определенно откроет больше возможностей в будущем.
Заключение
Помимо коммерческих соображений, **открытый исходный код также может помочь техническим издателям оптимизировать модели. **
«ChatGPT на самом деле является победой инженеров.» Успех сегодняшней большой языковой модели на самом деле основан на многократном обучении и настройке модели. Если после того, как базовая модель будет создана, модель будет продвигаться в сообществе с открытым исходным кодом, и больше разработчиков будут участвовать в работе по оптимизации модели, это, несомненно, окажет большую помощь прогрессу большой модели ИИ.
Кроме того, «большие модели с открытым исходным кодом позволяют не изобретать велосипед», — сказал Линь Юнхуа, вице-президент и главный инженер Пекинского научно-исследовательского института искусственного интеллекта Чжиюань, в интервью во время Чжиюаньской конференции 2023 года, предполагая, что все в ** происходят из исследование и разработка крупномасштабных моделей общего назначения требуют больших вычислительных мощностей, данных и электроэнергии, что является полным изобретением велосипеда, что не способствует рациональному использованию социальных ресурсов. **
Для некоммерческой организации, такой как научно-исследовательский институт Чжиюань, независимо от того, является ли модель открытой или закрытой, коммерческих соображений может быть не так много. Но для коммерческих ИИ-компаний, будь то Microsoft, Google, Meta, OpenAI или отечественные Zhipu AI и Baichuan Intelligent, любая крупная модель ИИ точно будет не только для целей «научных исследований». **
Хотя продукты OpenAI имеют абсолютное преимущество в технологиях, экосистема ChatGPT, построенная в виде плагинов, слаба с точки зрения экологического построения. В спорах об ИИ с открытым и закрытым исходным кодом мы можем увидеть в будущем модель, отличную от мобильной операционной системы.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
OpenAI в опасности
Произведено | Tiger Sniff Technology Group Автор | Ци Цзянь Редактор | Ляо Ин
7 августа еще одна отечественная стартап-компания в области искусственного интеллекта выпустила собственную бесплатную коммерческую модель искусственного интеллекта с открытым исходным кодом: XVERSE-13B. Компания Yuanxiang XVERSE была основана Яо Сином, бывшим вице-президентом Tencent и основателем лаборатории искусственного интеллекта Tencent.
Поскольку в июле Meta выпустила крупномасштабные модели серии LLaMA 2 с открытым исходным кодом для бесплатного коммерческого использования, на рынке крупномасштабных моделей ИИ назревает новая волна «открытого исходного кода».
2 августа Wenxin Qianfan, платформа крупномасштабных моделей ИИ под управлением Baidu, объявила о доступе к полной серии моделей с открытым исходным кодом LLaMA 2. Количество крупномасштабных моделей, которые можно вызвать на платформе, увеличилось до 33. , За исключением 3 моделей Wenxin, остальные 30 моделей имеют открытый исходный код.Модели, включая ChatGLM2, RWKV, MPT, Dolly, OpenLLaMA, Falcon и т. д.
На следующий день Alibaba Cloud также объявила о присоединении к модели с открытым исходным кодом. Модель Tongyi Qianwen с 7 миллиардами параметров с открытым исходным кодом включает в себя общую модель Qwen-7B и диалоговую модель Qwen-7B-Chat. Эти две модели были запущены в сообществе Mota. Они имеют открытый исходный код, бесплатны и доступны на коммерческой основе.
Интересно, что это положительное отношение к открытому исходному коду и открытости началось с Microsoft, крупного владельца закрытой модели ChatGPT. ** 18 июля Microsoft объявила, что будет сотрудничать с Meta для выпуска коммерческой версии модели LLaMA 2 с открытым исходным кодом, предоставляя предприятиям альтернативы моделям OpenAI и Google. ** Монопольное положение OpenAI на рынке крупномасштабных моделей ИИ, похоже, «нацелено» на всю отрасль, даже на ее ближайших партнеров.
OpenAI GPT-4, признанная во всем мире модель номер один для больших языков, в настоящее время является единственной моделью для больших языков, за которую готово платить большое количество пользователей.
У лучшего ученика в классе обычно нет мотивации присоединиться к учебной группе. Точно так же у **OpenAI нет причин или мотивов для открытого исходного кода. **
Однако с полным открытым исходным кодом LLaMA 2 все больше и больше разработчиков вкладывают средства в Meta и различные модели с открытым исходным кодом. Точно так же, как Android использует открытый исходный код для борьбы с iOS, большое количество моделей искусственного интеллекта с открытым исходным кодом активно обходят технические барьеры GPT-4 и окружают OpenAI экосистемой с открытым исходным кодом. **
Почему с открытым исходным кодом?
Когда OpenAI впервые запустил функцию плагина, многие люди сравнивали модель ИИ с будущими Windows, iOS и Android. Теперь, с выходом LLaMA 2, большая модель ИИ — это не только функция, но даже структура рынка развивается в сторону операционной системы.
Инициированный LMSYS Org, организацией, возглавляемой Калифорнийским университетом в Беркли, это рейтинговое соревнование для больших языковых моделей (LLM); по состоянию на 20 июля последняя версия рейтинга насчитывала 40 больших моделей ИИ, и пятерка лучших все еще закрыта. Исходники Model (Proprietary), в которых представлены три модели ГПТ-4, ГПТ-3,5-турбо и Клод. Однако следующие 34 модели, за исключением Google PaLM-Chat-Bison-001, являются моделями с открытым исходным кодом, 15 из которых являются некоммерческими.
Хотя по возможностям модели, глядя на весь рынок, ни одна модель вне зависимости от открытого или закрытого кода не осмелится конкурировать в лоб с GPT-4. Однако «тигры» не могли противостоять волкам и не могли победить большие модели GPT-4.Они решили «перестроиться и обогнать» и использовать открытый исходный код, чтобы захватить экологию приложений. чем-то похоже на борьбу Android против iOS.
"Сейчас все большие модели с открытым исходным кодом имеют одну цель — маркетинг."
Основатель отечественной компании, занимающейся исследованиями и разработками крупномасштабных моделей с открытым исходным кодом, признался Tiger Sniff, что основной причиной продвижения крупномасштабных моделей с открытым исходным кодом и систем Android с открытым исходным кодом является бесплатный захват рынка. «Многие крупные компании выпустили большие модели ИИ или даже просто сделали приложение на основе существующей модели, а затем начали продвигать его с большой помпой. На самом деле, для пользователей базовых больших моделей тратить больше денег на рекламу обходится дороже. чем это действительно не открытый исходный код для модели.» Это также лучший способ для компаний ИИ, чтобы доказать свою силу.
Во-первых, модели с открытым исходным кодом легче оценить, чем модели с закрытым кодом. Поскольку код и наборы данных моделей с открытым исходным кодом общедоступны, исследователи могут напрямую проверять архитектуру модели, обучающие данные и процесс обучения, чтобы провести более глубокий анализ модели, чтобы понять ее сильные и слабые стороны.
** «Некоторые большие модели ИИ кажутся очень способными, но они не имеют открытого исходного кода, и вы можете видеть только результаты его вывода». **
По сравнению с моделью с открытым исходным кодом модель с закрытым исходным кодом может понять преимущества и недостатки модели только посредством оценки производительности модели. Это приводит к тому, что производительность моделей с закрытым исходным кодом может быть искусственно преувеличена, либо скрыты их недостатки. Прозрачность модели с открытым исходным кодом может помочь разработчикам глубже понять модель и более объективно ее оценить.
Для опоздавших есть еще одна проблема с закрытой моделью: легко усомниться в оригинальности технологии. Многие крупные разработчики моделей однажды сказали Huxiu: «Если говорить прямо, для тех моделей, которые не являются открытым исходным кодом, даже если это оболочка LLaMA или просто вызывает интерфейс ChatGPT в фоновом режиме, кто знает?»
Когда вышла первая волна отечественных крупных моделей ИИ, такие голоса сомнений были широко распространены в Интернете. Для тех крупных моделей ИИ, которые не являются открытым исходным кодом, трудно доказать их невиновность.Чтобы доказать, что они не вызывают API ChatGPT, некоторые компании даже вынесли сервер рассуждений и вытащили сетевой кабель для демонстрации на место.
Открытый исходный код, несомненно, является одним из лучших способов самостоятельной сертификации крупных моделей ИИ. Но реальная ценность **открытого исходного кода не в возможности самосертификации, а в том, чтобы овладеть экологией. **
«После выпуска LLaMA 2 он определенно быстро захватит экосистему OpenAI». Более того, открытость API-интерфейса GPT-4 также очень низкая, поэтому существует множество ограничений на развитие модели GPT. В результате многие разработчики выбирают модели с открытым исходным кодом, такие как LLaMA, которые могут не только точно настраивать инструкции, но и проводить исследования базовой модели.
"LLaMA определенно более популярен среди разработчиков, чем OpenAI."
Когда LLaMA 2 был впервые выпущен 19 июля, на GitHub было более 5600 проектов с ключевыми словами, включая «LLaMA», и более 4100 проектов, включая «GPT-4». Через две недели после его выпуска скорость роста LLaMA увеличилась: на момент написания статьи насчитывается более 6200 «LLaMA» и более 4400 «GPT-4».
С другой стороны, модели с открытым исходным кодом можно загрузить локально для частного развертывания, что облегчает обучение ИИ для коммерческих компаний. Приложения ИИ таких компаний необходимо обучать на основе их собственных бизнес-данных, а масштабная модель ИИ, развернутая в частном порядке, может в наибольшей степени защитить безопасность данных. В то же время существует больше вариантов вычислительной мощности для приватизированного развертывания, будь то облачный сервис, локальное развертывание или даже распределенная вычислительная мощность нескольких IDC, что значительно снижает стоимость обучения модели и рассуждений.
Хотя ChatGPT собрал 100 миллионов активных пользователей в месяц всего за два месяца, в экосистеме разработчиков скорость, с которой модель с открытым исходным кодом захватывает умы пользователей, кажется выше.
В настоящее время многие отечественные ИИ-компании решили выпускать модели с открытым исходным кодом. К ним относятся модель с открытым исходным кодом ChatGLM-6B, выпущенная Zhipu AI, MOSS, выпущенная Университетом Фудань, Wudao Tianying Aquila, выпущенная Исследовательским институтом Чжиюань, и Baichuan-7B (13B), выпущенная Baichuan Intelligent. Среди них ChatGLM-6B, большая модель с открытым исходным кодом, выпущенная **Zhipu AI, была загружена более 4 миллионов раз по всему миру и получила 32 000 звезд на GitHub, что на 3 000 звезд больше, чем у LLaMA. **
«Если мы не создадим модель с открытым исходным кодом, рынок скоро будет заполнен LLaMA». крупная модель.
Фактически, до того, как началась тенденция LLM, генеративный ИИ уже вел битву открытого и закрытого исходного кода.
**При большом количестве разработчиков и продуктовых приложений графическая модель Wensheng с открытым исходным кодом Stable Diffusion чуть не загнала в угол первую модель OpenAI с закрытым исходным кодом Dall-E 2. Хотя пользователи в целом считают, что возможности модели Stable Diffusion не так хороши, как у другого продукта с закрытым исходным кодом MidJourney, Stable Diffusion захватил большое количество рынков графов Vincent благодаря своим атрибутам с открытым исходным кодом и бесплатности и стал Самая популярная графовая модель Винсента.Его компания-разработчик RunwayML And Stability AI также получила много внимания и финансирования. **
Модель с открытым исходным кодом LLaMA 2, похоже, намеревается вытеснить OpenAI в области LLM.
Опенсорс с товарами
LLaMA 2 в настоящее время имеет открытый исходный код, все три модели серии: версии с 7 миллиардами, 13 миллиардами и 70 миллиардами параметров. Однако на рынке также ходят слухи, что «на самом деле у Meta есть версия с большими параметрами, которая не была выпущена. В следующей версии может быть версия с большими параметрами, но она может быть не с открытым исходным кодом».
Стоит отметить, что в настоящее время многие модели с открытым исходным кодом не все являются открытыми. В модели Enlightenment 3.0, выпущенной научно-исследовательским институтом Чжиюань, только базовая языковая модель «Тяньинь» является открытым исходным кодом; ChatGLM, выпущенный Zhipu AI, открыл только часть серии моделей, а более крупная модель со 130 миллиардами параметров все еще открыта. закрытый источник. **
Независимо от того, является ли LLaMA 2 «зарезервированной» для более крупных моделей, «бесплатная» форма, несомненно, ускорит формирование Meta на рынке крупных моделей и подтолкнет ее к «старой дороге» Android.
Благодаря экосистеме с открытым исходным кодом система Android привлекла большое количество разработчиков и пользователей по всему миру. С точки зрения экологии технологий она сильно проверила и сбалансировала ведущую систему с закрытым исходным кодом iOS, а на некоторых рынках даже сформировала собственную монополию. С 2018 года Евросоюз наложил на Google штраф в размере более 4 млрд евро из-за монопольного механизма системы Android. Из этого заоблачного штрафа мы также можем видеть, насколько прибыльна система Android с открытым исходным кодом.
Согласно отчету исследовательской компании Sensor Tower, расходы пользователей на Google Play составят примерно 53 миллиарда долларов США в 2022 году, а в 2023 году эта цифра вырастет до 60 миллиардов долларов США. Согласно отчету, опубликованному другим исследовательским институтом, Statista, по состоянию на январь 2022 года в магазине Google Play находится около 140 000 приложений.
На данном этапе модель искусственного интеллекта с открытым исходным кодом, очевидно, еще не так популярна, как мобильные телефоны. Однако, даже если ИИ действительно так же популярен, как мобильные телефоны, такие гиганты, как Meta, не отпустят компании, заработавшие много денег на LLaMA 2.
В соглашении об открытом исходном коде LLaMA 2 есть такое положение: **Если количество активных пользователей в месяц превышает 700 миллионов, вы должны подать заявку на лицензию от Meta. Meta может по своему усмотрению предоставить вам лицензию, и вы не имеете права осуществлять какие-либо из этих прав. **
В то же время, в дополнение к версии с открытым исходным кодом модели с открытым исходным кодом и применению больших моделей ИИ, это также может помогать вычислительной мощности «приносить пользу».
Первые два производителя в Китае, которые продвигают крупномасштабные модели ИИ, Baidu и Ali, являются поставщиками облачных услуг. Два других поставщика облачных услуг, Tencent Cloud и Huawei Cloud, хотя и не имеют продуктов LLM, таких как Wenxin Yiyan и Tongyi Qianwen, также продолжают кричать о моделях ИИ. Основной причиной этого является «эффект переноса» большой модели в облаке.
«Объявление о некоторых действиях в отношении крупномасштабных моделей ИИ также продвигается рынком и клиентами совместно. За последние несколько месяцев было слишком много клиентов, которые пришли спросить о крупномасштабных моделях», — сказал лидер облачного бизнеса Tencent. Huxiu, что вычислительная мощность выстроилась в очередь, что является лучшим доказательством способности большой модели ИИ перевозить грузы.
**Модель не должна приносить деньги, но вычислительная мощность должна приносить прибыль. **Alibaba открыла Tongyi Qianwen, а Baidu представила 30 моделей с открытым исходным кодом на платформе крупномасштабных моделей Wenxin Qianfan Эти два действия должны предоставить пользователям «бесплатные» возможности искусственного интеллекта. Пользователи, использующие модель с открытым исходным кодом, больше не платят за ИИ, но пока их ИИ работает в облаке Alibaba Cloud и Baidu Smart Cloud, им придется платить за вычислительную мощность.
«ИИ также должен вернуться к идее облака и зарабатывать на облаке.» Синь Чжоу, генеральный менеджер Baidu Smart Cloud AI and Big Data Platform, сказал, что первоначальное намерение открыть Платформа большой модели предназначена для создания ценности для бизнеса клиентов. Создавая ценность, она может повысить лояльность старых клиентов и привлечь больше новых клиентов. Это очень помогает в расширении эффекта масштаба поставщиков облачных услуг.
Бесплатно дороже
«10 миллионов, это примерно столько же, сколько стартовая цена за кастомизацию большой модели.»
Основатель крупной модельной компании с открытым исходным кодом назвал цену посреднику, который пришел проконсультироваться по телефону.
«После того, как модель с открытым исходным кодом будет признана пользователями, вы можете поговорить с другими о плате за услуги для индивидуальной разработки». по крайней мере то, что это стоит десятки миллионов долларов. Следовательно, рынок, на который он ориентируется, должен в десятки или сотни раз превышать стоимость разработки.
С текущей точки зрения, лучший способ для **компаний ИИ заработать на моделях с открытым исходным кодом — начать с услуг. **
К счастью, большинство пользователей больших моделей ИИ очень нуждаются в этих услугах.
"Модель с открытым исходным кодом, бесплатная и коммерчески доступная. Это означает, что начиная со загрузки модели, развертывания модели, обучения, настройки и разработки приложений в реальных приложениях, всю работу необходимо выполнять самостоятельно", — разработчик приложений LLaMA. сказал Huxiu, большинство поставщиков моделей с закрытым исходным кодом будут предоставлять услуги по обучению и развертыванию, а также могут настраивать функции разработки в соответствии с потребностями пользователя. Но если вы используете модель с открытым исходным кодом, вам придется делать все эти задачи самостоятельно, никто не поможет вам обучаться, никто не найдет вам вычислительную мощность и никто не поможет настроить разработку.
«На самом деле производители моделей с закрытым исходным кодом продают услуги.» Руководитель онлайн-образовательного учреждения, который провел исследование приложений ИИ на основе модели LLaMA, сказал Хуксиу: «Модель с открытым исходным кодом, похоже, бесплатна. , но в процессе развертывания все еще нужно потратить много денег». После добавления модели ИИ стоимость рабочей силы и вычислительной мощности в ИТ-отделе значительно возросла.
Хотя обучение и настройка на основе моделей с открытым исходным кодом не представляет сложности для большинства ИТ-персонала. Однако для проведения глубоких исследований и разработки модели все же требуются некоторые технические резервы в части алгоритмов и ИИ. Поскольку концепция крупномасштабных моделей ИИ становится все более популярной, цена талантов в этой области также растет.
«** Рост затрат на оплату труда на самом деле плавающий, но стоимость серверов и оборудования реальна. С момента инвестирования в большие модели до сегодняшнего дня наши затраты увеличились примерно на 20%-30%. **» — сказал ответственный человек. вышеупомянутого онлайн-образовательного учреждения В настоящее время его организация все еще находится на стадии исследования сцены ИИ, и самая большая трудность заключается в том, что ей необходимо экспериментировать с каждой сценой. «Если один выйдет из строя, замените его другим. В этом процессе каждый шаг стоит денег».
В связи с этим Хусю спросил инсайдера Baidu Smart Cloud об услуге и стоимости Baidu Wenxin Qianfan с точки зрения развертывания, что сэкономит деньги**».
По сути, независимо от того, модель с открытым исходным кодом или модель с закрытым исходным кодом, стоимость развертывания модели рассчитывается из расчета «человек/день», и существенной разницы в затратах вычислительных мощностей на последующие не будет. обучение и рассуждения. «**Однако использование моделей с открытым исходным кодом для самостоятельного обучения, развертывания и разработки только сделает этот процесс очень хлопотным.» Инсайдер Baidu сказал, что конкретная стоимость развертывания зависит от конкретного проекта, и разница очень велика. Однако на самом деле нет существенной разницы между открытым исходным кодом и закрытым исходным кодом с точки зрения затрат на развертывание и использование. ** А с точки зрения безопасности данных большинство моделей с закрытым исходным кодом также можно развертывать в частном порядке.
**На данном этапе ИИ все еще трудно достичь инклюзивности. **
У большинства компаний, занимающихся интернет-бизнесом, есть свои команды по исследованиям и разработкам в области ИТ. Но для многих отраслей розничной торговли, традиционного производства и сферы услуг цифровая трансформация является сложной проблемой, им действительно сложно изучать обучение, развертывание и обоснование больших моделей ИИ.
Для этих компаний лучшим продуктом ИИ является универсальный плагин ИИ. "Что нам нужно, так это просто робот для обслуживания клиентов, чьи разговоры не выглядят такими идиотскими. Я попросил меня научиться обучать модель, и это немного увлекательно", - сказал Хуксиу менеджер бизнес-направления бренда электронной коммерции. за последние шесть месяцев он просто слушал. Говорят, что способность ИИ к диалогу сильнее, чем раньше, но ChatGPT еще не пробовали. Хотя он также готов осваивать новые технологии, сейчас для него недостаточно мотивации тратить время на обучение и вкладывать деньги в ИИ.
«Если в платформе или программном обеспечении, которое я использую сейчас, нет плагина, я могу использовать его, просто взяв в руки, иначе я не буду слишком много думать о том, чтобы потратить деньги на немедленное обновление ИИ-помощника. " Низкий.
«** Для этого торговцам нужен искусственный интеллект, и его можно применять и расширять без каких-либо чувств.**» Производитель SaaS Weimob создал такое приложение WAI в цифровом маркетинге, которое помогает продавцам использовать возможности искусственного интеллекта в виде встраивания существующих приложений. Обеспечьте продавцов диалогами с искусственным интеллектом и возможностями генерации текста и изображений на основе больших языковых моделей.
Открытое подключение больших моделей к сервисным инструментам SaaS чем-то похоже на вызов модели Baidu Wenxin Qianfan. Хотя выполняются только вызовы интерфейса и Finetune, он предоставляет пользователям больше, быстрее и стабильнее возможности посадки ИИ.
«Модели с открытым исходным кодом могут упростить пользователям начало работы, и теперь многие модели с открытым исходным кодом обновляются быстрее, чем крупные производители».» Главный операционный директор Weimob Инь Шиминг считает, что открытый исходный код и открытость могут быстро предоставить возможности ИИ. пользователям В ваших руках то, что действительно нужно пользователям, — это искусственный интеллект «подключи и работай». **
Для большинства пользователей, которые все еще находятся на стадии тестирования, экспериментирования и испытания больших моделей ИИ, порог для моделей с открытым исходным кодом явно ниже, а начальные затраты практически равны нулю.
Многие пользователи использовали модель с открытым исходным кодом с самого начала и будут продолжать использовать ее в будущем. Упомянутые выше проблемы развертывания и обучения порождают цепочку индустрии услуг для моделей с открытым исходным кодом.
Чен Ран На этой волне роста больших моделей недавно созданная OpenCSG занимается обслуживанием больших моделей с открытым исходным кодом.
Услуга больших моделей, предоставляемая OpenCSG, в основном направлена на обучение и внедрение моделей с открытым исходным кодом для предприятий. От выбора моделей с открытым исходным кодом до гибридных распределенных вычислительных мощностей в сочетании с обучением бизнес-моделям, разработкой серверных приложений и т. д., он может предоставлять услуги предприятиям.
"**По моему мнению, крупные модели похожи на все модели SaaS. Отрасли вверх и вниз по течению будут постепенно обогащаться, и клиенты будут ориентироваться не только на возможности модели". мощная модель, но лучше, проще и проще использовать большие модели ИИ для обслуживания своего бизнеса.
Экология с открытым исходным кодом вокруг ИИ
Во всей цепочке индустрии искусственного интеллекта открытый исходный код выходит далеко за рамки моделей. От исследований и разработок до развертывания приложений почти все звенья неотделимы от темы открытого исходного кода.
** Алгоритмы, вычислительная мощность, данные и три элемента ИИ требуют поддержки с открытым исходным кодом. **
На уровне алгоритмов большие модели ИИ с открытым исходным кодом находятся на относительно поздней стадии. В ранних исследованиях и разработках ИИ почти все модели ИИ использовали фреймворки машинного обучения, которые эквивалентны созданию наборов инструментов ИИ. Текущие основные фреймворки машинного обучения, включая TensorFlow, Pytorch и PaddlePaddle (летающее весло), являются фреймворками с открытым исходным кодом.
На уровне данных набор данных с открытым исходным кодом Commen Crow является важным источником данных в процессе обучения модели GPT. В настоящее время многие учреждения и компании, занимающиеся данными, выпустили продукты с открытым исходным кодом для наборов данных для обучения ИИ, включая набор данных COIG-PC Научно-исследовательского института Чжиюань и мультимодальный набор данных DOTS-MM-0526 Гаитянского AAC.
Для издателей наборов данных открытый исходный код может не только повысить влияние и ценность бренда, но и наборы данных с открытым исходным кодом могут также собирать положительные отзывы от сообщества открытого исходного кода для поиска и исправления ошибок или несоответствий в данных. Эта внешняя проверка помогает улучшить качество данных, а также еще больше обогащает продуктовую экосистему издателя.
«**Инженеры-алгоритмы часто сталкиваются с проблемой нехватки данных в исследованиях и разработках. Высококачественные данные могут привести к качественным улучшениям в оценке моделей. **Моя страна в настоящее время сталкивается с проблемой нехватки высококачественных наборов данных, которая также Китайские крупные модели мешают развитию технологий».
** С точки зрения вычислительной мощности, самого большого узкого места в развитии ИИ, структура чипов с открытым исходным кодом также стимулирует развитие отрасли. **
4 августа Qualcomm объявила о создании совместного предприятия с четырьмя полупроводниковыми компаниями для ускорения коммерциализации чипов на основе архитектуры RISC-V с открытым исходным кодом. В настоящее время на рынке представлены три основные платформы микросхем: x86, используемая процессорами Intel, Arm, используемая графическими процессорами Nvidia, и RISC-V, платформа микросхем с открытым исходным кодом.
«RISC-V может предоставить программируемую среду. Команда разработчиков чипов может использовать RISC-V для выполнения большого количества работ по предварительной и постобработке, а также может добавлять специальные ускорители или функциональные модули, отвечающие потребностям пользователя для удовлетворения потребностей пользователя. «Ган Чжицзянь, старший вице-президент по маркетингу и развитию бизнеса в SiFive, сказал, что экосистема RISC-V предоставляет множество возможностей для исследований и разработок чипов, что очень помогает удовлетворить быстро растущий сегодня спрос на чипы ИИ.
Arm и x86 имеют относительно закрытые экосистемы по сравнению с RISC-V. ** В экосистеме Arm пользователи могут выбирать только ограниченные возможности, предоставляемые Arm, в то время как в экосистеме RISC-V участвует много компаний, и будет больше типов продуктов и вариантов выбора. **
Архитектура с открытым исходным кодом также стимулирует индустрию микросхем к ускорению конкуренции.Ган Чжицзянь сказал: «** Как поставщик услуг архитектуры микросхем с открытым исходным кодом, мы также будем конкурировать с другими компаниями. разновидность конкуренции. В конечном счете, это будет способствовать процветанию и прогрессу экосистемы RISC-V.**»
Хотя архитектура набора инструкций RISC-V является бесплатной и с открытым исходным кодом, основная интеллектуальная собственность, созданная производителями микросхем на основе вторичной разработки архитектуры набора инструкций RISC-V, имеет независимые права интеллектуальной собственности и может быть авторизована за счет внешних сборов. По данным Международного фонда RISC-V, число участников увеличится более чем на 26% по сравнению с прошлым годом в 2022 году, а общее количество подразделений превысит 3180, охватывая 70 стран/регионов, включая Qualcomm, Intel, Google, Alibaba, Huawei и UNISOC, Sharp и многие другие ведущие производители чипов.
Открытый исходный код является преимуществом для RISC-V, но также создает некоторые проблемы. RISC-V имеет всего более 40 основных наборов инструкций, а также десятки инструкций расширения основных модулей.Любое предприятие и разработчик могут бесплатно использовать RISC-V для создания микросхем с независимыми правами интеллектуальной собственности.
Однако открытый исходный код, широкие возможности настройки и модульные функции также делают экосистему RISC-V более фрагментированной и сложной.
«После того, как каждая компания, занимающаяся исследованиями и разработками чипов, обновит набор инструкций RISC-V, она фактически создаст новую архитектуру. Она называется RISC-V, но разные компании несовместимы с RISC-V, а экология с открытым исходным кодом на самом деле .**» Лу Тао, президент Weiwei Technology и генеральный менеджер Большого Китая, считает, что архитектура чипов с открытым исходным кодом и экология программного обеспечения очень важны, но разным командам очень сложно найти баланс между открытостью, настройка и фрагментация.Проверьте мудрость и способности команды R&D.
Кроме того, архитектура Arm уже произвела графические процессоры, межпроцессорные процессоры и другие чипы, подходящие для обучения и рассуждений ИИ, а техническая экология стала более полной и зрелой. Изначально RISC-V предназначался для разработки процессоров, хотя он очень открыт, разработка чипов ИИ все еще находится на стадии исследования.
По данным исследовательской компании Counterpoint Research, к 2025 году совокупные поставки процессоров RISC-V превысят 80 миллиардов, а совокупный годовой темп роста составит 114,9%. К тому времени RISC-V займет 14% мирового рынка процессоров, 28% рынка IoT, 12% промышленного рынка и 10% автомобильного рынка.
Qualcomm уже внедрила RISC-V в микроконтроллеры в своей SoC Snapdragon 865 в 2019 году и на сегодняшний день поставила более 650 миллионов чипов RISC-V. На форуме AI Hardware Summit в сентябре 2022 года профессор Крсте Асанович, изобретатель RISC-V, сообщил, что Google начала использовать SiFive Intelligence X280 на основе RISC-V для разработки своей платформы машинного обучения TensorFlow. **До этого Google более 10 лет проводил самостоятельные исследования архитектуры чипа TPU.
Хотя разработать чипы RISC-V с нуля сложно, природа RISC-V с открытым исходным кодом дала китайским чипам, которые также начинали с нуля, шанс выжить в условиях блокады и монополии. компании являются самыми быстрорастущими в мире. Китайские производители чипов более агрессивны и готовы решать проблемы». Ган Чжицзянь сказал, что китайский рынок является ключом к стимулированию развития индустрии чипов. Китайский рынок чипов огромен, например, спрос на вычислительную мощность автомобильных чипов в Китае намного превышает спрос на европейском и американском рынках. ** В связи с растущим спросом китайских предприятий на вычислительные мощности ИИ китайская индустрия чипов ИИ определенно откроет больше возможностей в будущем.
Заключение
Помимо коммерческих соображений, **открытый исходный код также может помочь техническим издателям оптимизировать модели. **
«ChatGPT на самом деле является победой инженеров.» Успех сегодняшней большой языковой модели на самом деле основан на многократном обучении и настройке модели. Если после того, как базовая модель будет создана, модель будет продвигаться в сообществе с открытым исходным кодом, и больше разработчиков будут участвовать в работе по оптимизации модели, это, несомненно, окажет большую помощь прогрессу большой модели ИИ.
Кроме того, «большие модели с открытым исходным кодом позволяют не изобретать велосипед», — сказал Линь Юнхуа, вице-президент и главный инженер Пекинского научно-исследовательского института искусственного интеллекта Чжиюань, в интервью во время Чжиюаньской конференции 2023 года, предполагая, что все в ** происходят из исследование и разработка крупномасштабных моделей общего назначения требуют больших вычислительных мощностей, данных и электроэнергии, что является полным изобретением велосипеда, что не способствует рациональному использованию социальных ресурсов. **
Для некоммерческой организации, такой как научно-исследовательский институт Чжиюань, независимо от того, является ли модель открытой или закрытой, коммерческих соображений может быть не так много. Но для коммерческих ИИ-компаний, будь то Microsoft, Google, Meta, OpenAI или отечественные Zhipu AI и Baichuan Intelligent, любая крупная модель ИИ точно будет не только для целей «научных исследований». **
Хотя продукты OpenAI имеют абсолютное преимущество в технологиях, экосистема ChatGPT, построенная в виде плагинов, слаба с точки зрения экологического построения. В спорах об ИИ с открытым и закрытым исходным кодом мы можем увидеть в будущем модель, отличную от мобильной операционной системы.