Большие модели не являются любимцами гигантов

Источник статьи: Tiger Sniff

Автор: Creek

Источник изображения: Generated by Unbounded AI

Война 100 моделей усиливается, но у многих практиков возникает все больше вопросов к большим моделям.

В области базовых крупных моделей хлынули Tencent, Alibaba, Baidu и другие интернет-гиганты, а Alibaba, Baidu, iFLYTEK и другие крупные производители в прошлом месяце последовательно выпустили последние версии продуктов больших моделей, и их технические возможности также были значительно улучшены; Стартапы одновременно перерабатывают новую версию, но и «сумасшедшее» финансирование, Zhipu AI недавно объявила, что в этом году получила в общей сложности 2,5 миллиарда юаней финансирования, созданная почти полгода Baichuan Intelligence получила 350 миллионов долларов США финансирования, среди инвесторов этих стартапов также есть Tencent, Alibaba, Meituan и другие интернет-гиганты.

Неужели Китаю нужно так много базовых моделей? Все основные крупные модельные компании без ума от «раскатки» технических параметров, но какая именно крупная модель нужна рынку? В оживленной и хаотичной боевой обстановке эти вопросы поднимает все больше и больше людей.

Чтобы ответить на этот вопрос, мы должны сначала понять, как базовая большая модель зарабатывает деньги на китайском рынке. Несмотря на то, что подавляющее большинство людей воспринимают большие модели — это чат-боты, и многие пользователи начинают использовать эти продукты при поиске информации и систематизации документов, смежным компаниям сложно заработать на этих продуктах C-end, и даже чем больше масштаб пользователя, тем больше предприятий теряют деньги. **В настоящее время наиболее прагматичным направлением коммерциализации базовых крупных моделей по-прежнему остается сторона Б, обслуживающая предприятия в розничной, финансовой, производственной и других сферах для снижения издержек и повышения эффективности, с целью получения стабильного коммерческого дохода. **

Существует только три типа потребностей для базовых больших моделей: ** Прямой вызов API больших моделей для получения соответствующих возможностей больших моделей; На основе большой модели вторичная разработка осуществляется в соответствии с фактическим бизнесом; Разрабатывайте приложения ИИ на основе больших моделей. ** Эти требования проверяют технические возможности базовой платформы больших моделей, а также проверяют ее возможности корпоративных сервисов.

С точки зрения сервисных возможностей, крупномасштабным модельным стартапам и интернет-гигантам приходится начинать с нуля, и ни у кого нет врожденного преимущества. Платформы, которые могут быстрее получать информацию о потребностях клиентов и предоставлять стабильные и надежные услуги, могут выделяться.

Большие модели не «выдуваются»

С популярностью ChatGPT в качестве демаркационной точки, разработка отечественных крупных моделей пережила два дня.

До того, как ChatGPT стал популярным, лишь небольшое количество отечественных компаний занимались исследованиями и разработками базовых больших моделей, потому что технологии и сервисные возможности больших моделей не были широко приняты рынком, и эти компании в основном сосредоточены на технологических исследованиях и разработках и накоплении сервисных возможностей. Когда ChatGPT стал популярным, в него хлынуло большое количество инвесторов и практиков, и крупные модели стали новой отдушиной.

Горячий рынок легко порождает спекулянтов, которые не углубляются в технологии, а рассказывают истории, раскручивают концепции, независимо от технологий и возможностей сервиса, сначала рассказывают историю в небо, и таким образом завоевывают признание рынка капитала и клиентов. Один крупный модельный практик в шутку рассказал Tiger Sniff, что многие крупные модельные компании в Китае утверждают, что разрыв между ними и GPT-4 составляет всего несколько месяцев, и это потому, что они прошли некоторое обучение на основе GPT-2, который был с открытым исходным кодом, и вышли рассказывать истории.

На самом деле, эволюция технических возможностей больших моделей не может быть достигнута обучением в течение нескольких месяцев, потому что это сложная система, и очень важно иметь большой масштаб, а произвести более интеллектуальную эволюцию без определенного масштаба невозможно. Однако увеличение масштаба обучения больших моделей требует много времени и многократной отладки. Технические специалисты, которые отлаживали параметры обучения больших моделей, понимают эту сложность: никто не говорит вам, что делать, вы должны разобраться самостоятельно, и в процессе возникают всевозможные неожиданные ситуации, на решение которых требуется время.

В Китае базовые большие модели, которые действительно уверены в технических возможностях, были обучены до того, как ChatGPT стал популярным, в то время большая модель была не всем хорошо известна, и многие люди не понимали и не были настроены оптимистично по отношению к большой модели, а компании, которые настаивали на инвестировании в большую модель, были очень уверены в новой технологии.

Например, в 2020 году KLCII запустил первый сверхмасштабный исследовательский проект предварительно обученной модели Wudao, а его версия 2.0 стала крупнейшей в мире моделью триллионного уровня. После обновления в этом году «Wudao» охватывает основные большие модели, такие как язык, зрение и мультимодальность, и вступил в стадию полностью открытого исходного кода.

В 2020 году Zhipu AI также разработала архитектуру предобучения GLM, а также обучила модель GLM-10B с десятками миллиардов параметров. 27 октября компания Zhipu AI выпустила диалоговую модель собственной разработки третьего поколения ChatGLM3, которая значительно улучшила свою производительность, способность к логическому выводу и контекстную емкость по сравнению с предыдущим поколением. По сравнению с ChatGLM2, ChatGLM3 занял первое место среди 44 общедоступных наборов данных на китайском и английском языках в Китае. Среди них MMLU увеличился на 36%, C – на 33%, GSM8K – на 179%, а BBH – на 126%.

Кроме того, с точки зрения функций, ряд отечественных больших моделей (ChatGLM, CodeGeeX, WebGLM, CogVLM и т.д.), выпущенных Zhipu AI, также являются наиболее полными бенчмаркинговыми большими моделями серии OpenAI в Китае, и применимы к генеративному ИИ-помощнику «Zhipu Qingyan».

Эта первая партия компаний, производящих большие модели, принципиально отличается от компаний, которые спекулируют концепциями и гоняются за ветром. Когда технология крупномасштабных моделей еще не взорвалась, а рынок еще не был таким волатильным, они вовлекаются в нее, потому что они поняли техническую ценность и бизнес-логику базовой крупномасштабной модели. Эта разница также очень очевидна после популярности большой модели, многие компании вовлекаются в C-end продукты ради трафика и актуальности, в то время как самые ранние компании, такие как Zhipu AI, больше ориентированы на сферу корпоративных услуг, и все возможности R&D и сервисные возможности также выкладываются вокруг этой идеи, и они накапливаются в приземленной манере, и развиваются в направлении создания ценности для клиентов.

**Сложность большой модели определяет, что предприятия, которые накапливали технологические и сервисные возможности в течение более длительного времени, имеют более сильное преимущество. Когда все больше и больше людей на рынке осознают сложность больших моделей и время, необходимое для эволюции больших моделей, те крупные модельные компании, которые полагаются на сторителлинг, чтобы поджарить концепции, будут иметь все меньше и меньше возможностей для выживания, а компании, которые серьезно аккумулируют технологии и сервисные возможности, смогут выдержать испытание первой волной конкуренции.

Нет большой модели процветающей экологии, нет будущего

** В процессе коммерциализации больших моделей тот, кто сможет попасть в сценарии применения, имеющие жесткие потребности общества, будет первым, кто сформирует добродетельный круг самокроветворения. **

Общая большая модель имеет более широкий спектр применения, но она недостаточно специализирована для решения конкретных задач в вертикальных областях. Вертикальные большие модели обладают более широкими возможностями для решения задач, специфичных для предметной области, но объем услуг очень ограничен, что затрудняет достижение баланса между затратами и бизнес-выгодами для многих вертикальных больших моделей, а пространство для разработки ограничено.

Конечная точка применения больших моделей заключается в том, чтобы использовать их в быту и на производстве, для решения практических задач в работе и быту, а также для повышения эффективности и производительности труда. Основываясь на преимуществах и недостатках текущей общей модели и вертикальной модели, более подходящей идеей в текущем процессе коммерциализации модели является открытый исходный код технологий и сервисных возможностей для розничной торговли, финансов, производства и других областей, а общая модель и предприятия в смежных областях работают вместе для создания сценариев применения. **

С учетом ограничений, таких как данные, вычислительная мощность и сценарии, существует не так много больших моделей, которые действительно могут работать с открытым исходным кодом. В то же время, как базовая технологическая база, роль большой модели очень похожа на операционные системы ПК и мобильных телефонов, и будет представлять собой конкурентную модель «под большим деревом ни пяди травы», то есть одна-две технические базы занимают доминирующее положение в отрасли, и все разработчики приложений должны развиваться на основе этих двух технических баз. Если модель пьедестала не сможет сформировать процветающую экологию, не будет способности к устойчивому развитию.

Судя по истории развития операционных систем для ПК и мобильных телефонов, преимущество первопроходца очень важно. Когда Windows доминирует на рынке ПК, а iOS и Android разделены на два мира в области мобильных телефонов, другим операционным системам трудно найти место для изменений.

Такая же тенденция наблюдается и в сфере больших моделей. Большие модели откроют процветающую экосистему приложений ИИ, а личные и корпоративные данные, возможности или приложения могут быстро стать подключаемыми модулями ИИ, расширяя возможности больших моделей и делая большие модели более практичными и простыми в использовании.

В настоящее время Baidu, iFLYTEK и другие гигантские компании привержены экологическому строительству, интеллектуальная облачная платформа Baidu Qianfan с большой моделью 2.0 ежемесячно активными предприятиями почти 10 000, охватывающая более 400 сценариев в финансах, образовании, производстве, энергетике, правительственных делах, транспорте и других отраслях, масштаб разработчика платформы больших моделей iFLYTEK Spark превысил 700 000.

Некоторые стартапы, которые накопили долгое время в области больших моделей, также первыми едят крабов. В настоящее время у Zhipu AI более 1000 клиентов и более 100 партнеров для создания экосистемы, охватывающей несколько сценариев, таких как медиа, SaaS, образование и офис. Например, за возможностями интеллектуальной генерации документов WPS презентационного контента и написания пресс-релизов стоит техническая возможность Zhipu AI в качестве поддержки.

В экологическом соревновании различных масштабных модельных платформ самым важным испытанием платформы является ценность, которую она приносит партнерам, и способность расти вместе с партнерами. Что касается офисного сценария, то генерация контента презентаций, написание содержания статьи и переписывание стиля предъявляют очень высокие требования к точности и возможностям рассуждений платформы больших моделей, и только большая модель, достигшая определенного технического уровня, может иметь возможность поддерживать эти приложения, а платформа больших моделей также должна исправлять ошибки и итерации в соответствии с отзывами пользователей в реальных приложениях.

**Будь то гигантская компания или начинающая компания, независимо от того, насколько велик капитал и ресурсная сила, необходимо накапливать и повторять шаг за шагом с нуля. Поэтому в процессе построения экосистемы для больших модельных платформ очень важен выигрыш во времени. По этой же причине стартапы с преимуществами первопроходца и интернет-гиганты с более сильными финансовыми ресурсами могут конкурировать на равных.

**100 модельная война, кто больше подходит для китайского рынка? **

Несмотря на то, что боевая обстановка войны 100 моделей является живой и хаотичной, направление конкуренции, стоящее за ней, очень ясно, а технические и сервисные возможности и способность платформы больших моделей построить экосистему напрямую определяют направление конкуренции.

Для накопления этих возможностей требуется время, и их трудно достичь в одночасье, но и накопить их со временем недостаточно. Преимущество первопроходца, в дополнение к разнице во времени, вызванной ранними действиями, также обладает способностью точно воспринимать рыночный спрос, то есть действовать твердо и быстро в соответствии с правильной стратегией, стратегическими колебаниями и обходными путями могут легко поглотить все временные преимущества, накопленные ранними действиями.

По мере того, как все больше и больше крупных модельных платформ смещают свое внимание на экологическое строительство, стратегическое определение и реализация платформы будут становиться все более и более важными в экологической конкуренции. ** Когда несколько платформ завершают качественный переход на суперплатформы, конкурентная среда в основном определяется.

На большом и сложном внутреннем рынке сервисные компании B-end склонны к стратегическим колебаниям и обходным путям. С одной стороны, регионы и масштабы бизнеса предприятий на отечественном рынке различны, и восприятие ценности больших моделей для enterprise intelligence довольно разное, и ресурсы и затраты, которые они готовы инвестировать, также разные, поэтому найти стандартизированное решение сложно; С другой стороны, предприятия в разных областях имеют разные потребности в возможностях больших моделей, и даже разные предприятия в одной и той же области имеют разные потребности в больших моделях.

В таких условиях, по сравнению с планом коммерциализации OpenAI, коммерциализация отечественных масштабных модельных платформ требует большего внимания к деталям. Такую тенденцию мы видим в идеях коммерциализации некоторых платформ.

Например, в дополнение к общим API-сервисам открытой платформы, Zhipu AI также предоставляет два решения: облачную приватизацию и локальную приватизацию. ** Облачная приватизация может помочь предприятиям создавать свои собственные большие модели, основанные на частных данных, с более высокой безопасностью, в то время как локальная приватизация является уникальным решением на китайском рынке, в дополнение к предоставлению более мощной модели, она также предоставляет полную матрицу моделей для удовлетворения различных сценариев и потребностей. **

В ответ на различные потребности клиентов, такие как генерация статей, интеллектуальное обслуживание клиентов и аннотирование данных, а также на масштабы крупных, средних и малых предприятий, Zhipu AI предоставляет различные решения, которые клиенты могут свободно комбинировать в соответствии со своими потребностями. Эта более детальная и гибкая модель обслуживания также основана на долгосрочном точном понимании китайского рынка.

Перед лицом неопределенности внешней среды Zhipu AI также запустила план адаптации отечественных чипов, сотрудничая с отечественными производителями оборудования и производителями чипов, чтобы обеспечить различные уровни сертификации и тестирования для разных типов пользователей и разных типов чипов, чтобы сделать услуги больших моделей более безопасными и надежными. В настоящее время серия ChatGLM поддерживает более 10 видов отечественных аппаратных экосистем, включая Ascend, Shenwei Supercomputer, Haiguang DCU, Haifeike, Muxi Xiyun, Computing Technology, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun, а также одновременно выпущенную развернутую тестовую модель мобильного телефона ChatGLM3-1.5B и 3B поддерживают Xiaomi, vivo, Samsung и другие мобильные телефоны и автомобильные платформы.

Чем ожесточеннее битва в войне 100 моделей, тем важнее эти, казалось бы, незаметные детали, ведь именно эти детали определяют степень узнаваемости внешних партнеров, а также влияют на скорость посадки крупных моделей при разных сценариях. Порог для простого выпуска большой модели не так высок, как представляет себе рынок, но можно иметь высококачественные сценарии данных, чтобы продолжать итерации и формировать конкурентные барьеры, а ключ к качественным сценариям данных лежит во внешних партнерах - платформа, которую больше партнеров готовы выбрать, облегчает прохождение этого бизнес-цикла.

В этом соревновании многие практики считают, что победителем должна стать компания-гигант с более сильными ресурсами и финансовыми возможностями, но это не так. Как стартапы, так и гиганты должны пройти все тонкости и докопаться до деталей, и здесь нет легких путей. Что касается финансирования, то оно не является корнем решающей битвы, потому что стартапы с основной конкурентоспособностью не будут испытывать недостатка в деньгах - даже если Zhipu AI получил наибольший объем финансирования от крупномасштабных модельных стартапов, новых инвесторов, желающих войти в игру, становится больше.

Если подумать под другим углом, то на самом деле рынок капитала уже голосует ногами за то, кто больше подходит для пьедесталной модели китайских предприятий.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить