«Объемные» фонды для захвата талантов, понимание конкурентной среды отечественных крупномасштабных моделей ИИ в одной статье

Первоисточник: Титаниум Медиа

Монтажер: Лю Янин, Сунь Чэн

Источник изображения: сгенерировано Unbounded AI‌

29 июня Meituan опубликовала объявление на Гонконгской фондовой бирже, объявив о приобретении компании по производству крупномасштабных моделей «Light Years Beyond», основанной Ван Хуэйвэнем, что также оставило спекуляции на рынке крупномасштабных моделей ИИ. Не только в Китае количество посещений ChatGPT в последнее время снизилось: согласно данным, глобальные посещения ChatGPT в июне упали на 9,7% в месячном исчислении, а количество уникальных посетителей упало на 5,7% в месячном исчислении. Кроме того, продолжительность пользователей, использующих ChatGPT, также сокращается. Продолжительность каждого посещения в мае сократилась на 8,5%. AIGC, похоже, вступила в период охлаждения.

Но, с другой стороны, 4 июля была официально запущена крупномасштабная модельная компания «Zero One Creation», организованная самим Кай-Фу Ли, и крупномасштабная языковая модель APP, разработанная Baidu. запущена на Apple App Market, а корпоративная проверка издателя — проверка большой модели — «Знание врага альфа»... Различные компании делают частые шаги в области больших моделей, и они идут полным ходом.

Насколько популярен ИИ в большом модельном бизнесе? Каков инвестиционный план рынка капитала для этого выхода? Какова производительность сегодняшних отечественных масштабных моделей? В этом выпуске Titanium Media·Tidu Tuwen делается попытка разобраться в текущем состоянии разработки отечественных крупномасштабных моделей на уровне данных.

Масштабная модель отечественного ИИ "Fairy Fight" технологические гиганты соревнуются в стрельбе

С марта этого года отечественные модели ИИ росли как грибы после дождя. В «Отчете об исследованиях больших моделей искусственного интеллекта Китая» показано, что к концу мая 2023 года было выпущено не менее 79 отечественных базовых крупных моделей со шкалой параметров 1 миллиард и более.

С глобальной точки зрения США занимают первое место в мире по количеству крупномасштабных моделей, уже в 2020 году в США было запущено 15 крупномасштабных моделей, в том числе GPT-3. В Китае, начиная с 2020 г., крупномасштабные модели также вступили в стадию бурного развития: в 2021 г. будет запущено 30 крупномасштабных моделей, в 2022 г. будет запущено 28 крупномасштабных моделей, а в 2022 г. будет запущено 19 крупномасштабных моделей. будет запущен в первые пять месяцев 2023 года, превзойдя 18 крупномасштабных моделей в США. Сегодня количество крупномасштабных моделей в Китае и США составляет почти 90% от общего количества крупномасштабных моделей в мире, а количество крупномасштабных моделей в Китае вышло в первый эшелон.

Отечественная крупномасштабная модельная дорожка очень оживленная.«Игроки», участвующие в дорожке крупномасштабных моделей ИИ, включают интернет-гигантов в лице Ali, Tencent, Baidu и т. д. 16 марта Baidu лидировала и запустила китайскую версию ChatGPT «文心一言». Впоследствии одна за другой всплывали крупные модели, такие как Ali, Huawei, Tencent и 360.

Кроме того, есть компании, занимающиеся технологиями искусственного интеллекта, представленные SenseTime и iFLYTEK, образовательные компании, такие как Kidswant, финансовые компании, такие как Flush, и компании, занимающиеся недвижимостью, такие как I Love My Home. Кроме того, большие модели также очень популярны в академических кругах.Уже в феврале этого года Университет Фудань выпустил MOSS, первую модель, подобную ChatGPT, в Китае.

Стоит отметить, что с ростом популярности ChatGPT в Китае также наблюдался бум крупномасштабного предпринимательства в области ИИ.Многие технологические лидеры и руководители крупных компаний посвятили себя крупномасштабным моделям и занялись повторным предпринимательством.

В феврале 2023 года Ван Хуэйвэнь, бывший соучредитель Meituan, опубликовал «Список героев ИИ», громкую запись в большой модели ИИ; также известной записью был Ли Кайфу, генеральный директор Sinovation. Предприятия 19 марта Ли Кайфу объявил в кругу друзей о создании компании Project AI 2.0 и вошел в крупномасштабную модель ИИ, впоследствии основатель Sogou Ван Сяочуань, бывший пионер бизнеса JD.com AI Чжоу Боуэн и Momenwen Генеральный директор Ли Чжифэй также присоединился к предпринимательскому буму крупномасштабных моделей ИИ.

Помимо этих технологических гигантов, к конкурсу присоединились многие руководители крупных интернет-компаний. Например, Ли Янь, бывший ключевой фигурой в области искусственного интеллекта в Куайшоу, основал компанию по искусственному интеллекту Yuanshi Technology для проведения исследований и разработок мультимодальных больших моделей, «закрытый ученик» Ли Кайфу и No. -компьютерное взаимодействие. Сегодня масштабный отечественный ИИ «фея бой», отраслевой трек очень оживленный.

Инвестиционные институты осторожны, и рынок набирает таланты в сфере крупных моделей с высокими зарплатами

Чтобы войти в большую модель, вы должны сначала подготовить деньги, В конце концов, крупная модельная стартап-компания выпускает относительно зрелую модель, которая должна инвестировать в стоимость инфраструктуры большой языковой модели, обучения и талантов НИОКР. Для стартапов финансирование — единственный способ выжить.

Согласно неполным статистическим данным Titanium Media·Tidu Tuwen, по состоянию на 4 июля 2023 года объем финансирования крупных стартап-компаний ИИ, получивших финансирование в этом году, обычно составляет от десятков до сотен миллионов. Среди них MiniMax, крупномасштабная модельная стартап-компания, получившая наибольшее финансирование, 1 июня завершила новый раунд финансирования на сумму, превышающую 250 миллионов долларов США. Текущая оценка компании превышает 1,2 миллиарда долларов США, и ее называют «первым Инвестиции». Название «Предпринимательство».

Кроме того, компания Light Years, которая только что была приобретена Meituan, 5 июня завершила раунд финансирования A в размере 230 миллионов долларов США, но этот раунд финансирования также был полностью возвращен после завершения приобретения Meituan. Стоит отметить, что Xihu Xinchen, основанная в 2021 году, завершила два последовательных финансирования в марте и апреле этого года, и скорость финансирования очень высока.

В крупномасштабных инвестициях в модели ИИ ведущие венчурные капиталисты, такие как IDG Capital, Matrix Partners и ZhenFund, сделали меньше шагов.

Согласно неполной статистике Titanium Media и Titanium News, наиболее активными инвестиционными институтами являются Tencent Investment, Innovation Works, Qiji Chuangtan и Sequoia China. , и большинство учреждений инвестируют только в 1 компанию.Hillhouse Venture Capital и Shenzhen Venture Capital, которые всегда были активны, не имеют общедоступных данных, свидетельствующих о том, что они инвестировали в крупномасштабные модели ИИ.Видно, что инвесторы заинтересованы в Путь крупного модельного предпринимательства более осторожен.

Помимо финансирования, в основе масштабного конкурса моделей лежат и технические возможности. Большие модели предъявляют высокие требования к алгоритмам, вычислительной мощности и данным. Крупные модели ИИ требуют больших затрат на обучение и инвестиций в исследования и разработки. Некоторые крупные интернет-компании и технологические компании имеют более глубокие капитальные и технические резервы.

Согласно неполной статистике Titanium Media·Tidu Tuwen, в 2022 году Huawei инвестирует 161,5 млрд юаней в расходы на исследования и разработки, став компанией с наибольшим объемом инвестиций в исследования и разработки; во-вторых, Tencent занимает второе место с 61,4 млрд юаней, а Ali — 55,5 млрд. млрд юаней в-третьих. Интернет-гиганты ежегодно инвестируют в R&D десятки миллиардов, кроме того, у них есть сильная команда R&D, они заслуженные игроки «первого эшелона» на треке крупномасштабного моделирования.

В дополнение к капиталу и технологиям талант также является неотъемлемой частью крупномасштабного модельного конкурса.

В первом квартале этого года различные компании объявили конкурс на лучшие таланты в области искусственного интеллекта. Ван Хуэйвэнь сказал, что он будет использовать 75% акций, чтобы пригласить лучших специалистов по исследованиям и разработкам. Ли Кайфу призвал набирать таланты мирового уровня по всему миру. Baidu наняла инженеров по алгоритмам крупномасштабных моделей ИИ с зарплатой 25-40 тысяч в месяц, и нанял инженера по архитектуре моделей с зарплатой 20-40 тысяч в месяц; Али нанимает инженеров по крупномасштабному обучению моделей и инженеров по алгоритмам с зарплатой 40-70 тысяч в месяц, а крупные компании жаждут талантов.

Соответствующие данные показывают, что в первом квартале этого года количество должностей, связанных с большими моделями ИИ, увеличилось на 10,16% в годовом исчислении, что является областью с наибольшим ростом, связанным с ChatGPT, Среди них средняя годовая зарплата инженеров по машинному обучению и алгоритмов достигла более 400 000 юаней.

Проблемы разработки крупномасштабных моделей китайского производства все еще имеют некоторые области, которые превосходят международные модели

В последние полгода большие модели выпускались одна за другой, какова их нынешняя сила? Согласно оценке 10 крупномасштабных моделей искусственного интеллекта в стране и за рубежом, проведенной соответствующими учреждениями, ChatGPT в целом имеет относительно очевидное преимущество, занимая первое место с точки зрения исчерпывающих данных. Что касается подсекторов, отечественная крупномасштабная модель превосходит зарубежную модель с точки зрения понимания слов и предложений и вопросов знаний, то есть отечественная крупномасштабная модель ИИ обладает более сильным базовым познанием и способностью к обучению для текста.

Среди шести отечественных крупномасштабных моделей всеобъемлющая производительность данных «Wen Xin Yi Yan» относительно превосходна, особенно лидируя среди отечественных крупных языковых моделей с точки зрения понимания слов и предложений, программирования, вопросов знаний и перевода; с точки зрения бизнеса Написание, отечественные продукты работают лучше всего Лучшее - «Xunfei Xinghuo»; с точки зрения литературных вопросов, отечественный продукт «Tiangong 3.5» имеет самый высокий балл 88,33%, что на одном уровне с ChatGPT; с точки зрения логического мышления, "Wenxinyiyan" и "Xunfei "Spark" показали себя довольно хорошо.

Отечественные крупномасштабные модели очень хорошо работают в некоторых подразделах, но все еще существует определенный разрыв с зарубежными продуктами того же типа, и еще есть много возможностей для улучшения основных технологий, таких как данные и сценарии посадки.

На уровне данных для разработки больших моделей требуются высококачественные обучающие наборы данных. В настоящее время общий объем китайских данных, необходимых для обучения крупномасштабных моделей на основе китайской семантики в Китае, недостаточен, а качество не является высоким.Нехватка высококачественного китайского корпуса для обучения крупномасштабных моделей также увеличивает разрыв.

С точки зрения вычислительной мощности, основанной на мощности центров обработки данных, ведущими компаниями в этой области в 2022 году являются Google, Microsoft, Amazon и Meta, На эти четыре платформы центров обработки данных приходится более 70% общей емкости самостоятельно созданных данных. центры в мире и В настоящее время, хотя некоторые ведущие технологические компании, такие как Alibaba, Baidu и Tencent, завершили строительство центров обработки данных в Китае, все еще существует определенный разрыв в плане мощности по сравнению с зарубежными странами.

С точки зрения сценариев приземления, стоимость приземления в различных сценариях подразделения также является проблемой. Чтобы получить достаточно эффективную и простую в использовании большую модель, необходимо вложить достаточный и целевой корпус, а это означает, что реализация различных сценариев подразделения требует больших затрат.

По оценкам, стоимость обучения большой модели составляет от 2 до 12 миллионов долларов США. Из-за высоких затрат на обучение компания OpenAI, занимающаяся разработкой искусственного интеллекта, потеряет в 2022 году около 540 миллионов долларов США. Поэтому для коммерческой реализации больших моделей ИИ потребуется время.

На этой высококонкурентной трассе, несмотря на множество трудностей, отечественные крупные модели движутся в более совершенном техническом направлении. Кроме того, конкуренция на треке также ускорит темпы развития отечественной технологии крупномасштабных моделей и будет способствовать общей технологической модернизации индустрии искусственного интеллекта в Китае.

*Источник данных: Structure Research, Исследовательский центр InfoQ, Liepin Big Data, «Отчет об исследовании большой модели искусственного интеллекта Китая» и другая общедоступная информация не полностью скомпилированы.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить