«Объемные» фонды для захвата талантов, понимание конкурентной среды отечественных крупномасштабных моделей ИИ в одной статье

2023-07-10 01:23:41

Первоисточник: Титаниум Медиа

Монтажер: Лю Янин, Сунь Чэн

Источник изображения: сгенерировано Unbounded AI‌

29 июня Meituan опубликовала объявление на Гонконгской фондовой бирже, объявив о приобретении компании по производству крупномасштабных моделей «Light Years Beyond», основанной Ван Хуэйвэнем, что также оставило спекуляции на рынке крупномасштабных моделей ИИ. Не только в Китае количество посещений ChatGPT в последнее время снизилось: согласно данным, глобальные посещения ChatGPT в июне упали на 9,7% в месячном исчислении, а количество уникальных посетителей упало на 5,7% в месячном исчислении. Кроме того, продолжительность пользователей, использующих ChatGPT, также сокращается. Продолжительность каждого посещения в мае сократилась на 8,5%. AIGC, похоже, вступила в период охлаждения.

Но, с другой стороны, 4 июля была официально запущена крупномасштабная модельная компания «Zero One Creation», организованная самим Кай-Фу Ли, и крупномасштабная языковая модель APP, разработанная Baidu. запущена на Apple App Market, а корпоративная проверка издателя — проверка большой модели — «Знание врага альфа»... Различные компании делают частые шаги в области больших моделей, и они идут полным ходом.

Насколько популярен ИИ в большом модельном бизнесе? Каков инвестиционный план рынка капитала для этого выхода? Какова производительность сегодняшних отечественных масштабных моделей? В этом выпуске Titanium Media·Tidu Tuwen делается попытка разобраться в текущем состоянии разработки отечественных крупномасштабных моделей на уровне данных.

Масштабная модель отечественного ИИ "Fairy Fight" технологические гиганты соревнуются в стрельбе

С марта этого года отечественные модели ИИ росли как грибы после дождя. В «Отчете об исследованиях больших моделей искусственного интеллекта Китая» показано, что к концу мая 2023 года было выпущено не менее 79 отечественных базовых крупных моделей со шкалой параметров 1 миллиард и более.

С глобальной точки зрения США занимают первое место в мире по количеству крупномасштабных моделей, уже в 2020 году в США было запущено 15 крупномасштабных моделей, в том числе GPT-3. В Китае, начиная с 2020 г., крупномасштабные модели также вступили в стадию бурного развития: в 2021 г. будет запущено 30 крупномасштабных моделей, в 2022 г. будет запущено 28 крупномасштабных моделей, а в 2022 г. будет запущено 19 крупномасштабных моделей. будет запущен в первые пять месяцев 2023 года, превзойдя 18 крупномасштабных моделей в США. Сегодня количество крупномасштабных моделей в Китае и США составляет почти 90% от общего количества крупномасштабных моделей в мире, а количество крупномасштабных моделей в Китае вышло в первый эшелон.

Отечественная крупномасштабная модельная дорожка очень оживленная.«Игроки», участвующие в дорожке крупномасштабных моделей ИИ, включают интернет-гигантов в лице Ali, Tencent, Baidu и т. д. 16 марта Baidu лидировала и запустила китайскую версию ChatGPT «文心一言». Впоследствии одна за другой всплывали крупные модели, такие как Ali, Huawei, Tencent и 360.

Кроме того, есть компании, занимающиеся технологиями искусственного интеллекта, представленные SenseTime и iFLYTEK, образовательные компании, такие как Kidswant, финансовые компании, такие как Flush, и компании, занимающиеся недвижимостью, такие как I Love My Home. Кроме того, большие модели также очень популярны в академических кругах.Уже в феврале этого года Университет Фудань выпустил MOSS, первую модель, подобную ChatGPT, в Китае.

Стоит отметить, что с ростом популярности ChatGPT в Китае также наблюдался бум крупномасштабного предпринимательства в области ИИ.Многие технологические лидеры и руководители крупных компаний посвятили себя крупномасштабным моделям и занялись повторным предпринимательством.

В феврале 2023 года Ван Хуэйвэнь, бывший соучредитель Meituan, опубликовал «Список героев ИИ», громкую запись в большой модели ИИ; также известной записью был Ли Кайфу, генеральный директор Sinovation. Предприятия 19 марта Ли Кайфу объявил в кругу друзей о создании компании Project AI 2.0 и вошел в крупномасштабную модель ИИ, впоследствии основатель Sogou Ван Сяочуань, бывший пионер бизнеса JD.com AI Чжоу Боуэн и Momenwen Генеральный директор Ли Чжифэй также присоединился к предпринимательскому буму крупномасштабных моделей ИИ.

Помимо этих технологических гигантов, к конкурсу присоединились многие руководители крупных интернет-компаний. Например, Ли Янь, бывший ключевой фигурой в области искусственного интеллекта в Куайшоу, основал компанию по искусственному интеллекту Yuanshi Technology для проведения исследований и разработок мультимодальных больших моделей, «закрытый ученик» Ли Кайфу и No. -компьютерное взаимодействие. Сегодня масштабный отечественный ИИ «фея бой», отраслевой трек очень оживленный.

Инвестиционные институты осторожны, и рынок набирает таланты в сфере крупных моделей с высокими зарплатами

Чтобы войти в большую модель, вы должны сначала подготовить деньги, В конце концов, крупная модельная стартап-компания выпускает относительно зрелую модель, которая должна инвестировать в стоимость инфраструктуры большой языковой модели, обучения и талантов НИОКР. Для стартапов финансирование — единственный способ выжить.

Согласно неполным статистическим данным Titanium Media·Tidu Tuwen, по состоянию на 4 июля 2023 года объем финансирования крупных стартап-компаний ИИ, получивших финансирование в этом году, обычно составляет от десятков до сотен миллионов. Среди них MiniMax, крупномасштабная модельная стартап-компания, получившая наибольшее финансирование, 1 июня завершила новый раунд финансирования на сумму, превышающую 250 миллионов долларов США. Текущая оценка компании превышает 1,2 миллиарда долларов США, и ее называют «первым Инвестиции». Название «Предпринимательство».

Кроме того, компания Light Years, которая только что была приобретена Meituan, 5 июня завершила раунд финансирования A в размере 230 миллионов долларов США, но этот раунд финансирования также был полностью возвращен после завершения приобретения Meituan. Стоит отметить, что Xihu Xinchen, основанная в 2021 году, завершила два последовательных финансирования в марте и апреле этого года, и скорость финансирования очень высока.

В крупномасштабных инвестициях в модели ИИ ведущие венчурные капиталисты, такие как IDG Capital, Matrix Partners и ZhenFund, сделали меньше шагов.

Согласно неполной статистике Titanium Media и Titanium News, наиболее активными инвестиционными институтами являются Tencent Investment, Innovation Works, Qiji Chuangtan и Sequoia China. , и большинство учреждений инвестируют только в 1 компанию.Hillhouse Venture Capital и Shenzhen Venture Capital, которые всегда были активны, не имеют общедоступных данных, свидетельствующих о том, что они инвестировали в крупномасштабные модели ИИ.Видно, что инвесторы заинтересованы в Путь крупного модельного предпринимательства более осторожен.

Помимо финансирования, в основе масштабного конкурса моделей лежат и технические возможности. Большие модели предъявляют высокие требования к алгоритмам, вычислительной мощности и данным. Крупные модели ИИ требуют больших затрат на обучение и инвестиций в исследования и разработки. Некоторые крупные интернет-компании и технологические компании имеют более глубокие капитальные и технические резервы.

Согласно неполной статистике Titanium Media·Tidu Tuwen, в 2022 году Huawei инвестирует 161,5 млрд юаней в расходы на исследования и разработки, став компанией с наибольшим объемом инвестиций в исследования и разработки; во-вторых, Tencent занимает второе место с 61,4 млрд юаней, а Ali — 55,5 млрд. млрд юаней в-третьих. Интернет-гиганты ежегодно инвестируют в R&D десятки миллиардов, кроме того, у них есть сильная команда R&D, они заслуженные игроки «первого эшелона» на треке крупномасштабного моделирования.

В дополнение к капиталу и технологиям талант также является неотъемлемой частью крупномасштабного модельного конкурса.

В первом квартале этого года различные компании объявили конкурс на лучшие таланты в области искусственного интеллекта. Ван Хуэйвэнь сказал, что он будет использовать 75% акций, чтобы пригласить лучших специалистов по исследованиям и разработкам. Ли Кайфу призвал набирать таланты мирового уровня по всему миру. Baidu наняла инженеров по алгоритмам крупномасштабных моделей ИИ с зарплатой 25-40 тысяч в месяц, и нанял инженера по архитектуре моделей с зарплатой 20-40 тысяч в месяц; Али нанимает инженеров по крупномасштабному обучению моделей и инженеров по алгоритмам с зарплатой 40-70 тысяч в месяц, а крупные компании жаждут талантов.

Соответствующие данные показывают, что в первом квартале этого года количество должностей, связанных с большими моделями ИИ, увеличилось на 10,16% в годовом исчислении, что является областью с наибольшим ростом, связанным с ChatGPT, Среди них средняя годовая зарплата инженеров по машинному обучению и алгоритмов достигла более 400 000 юаней.

Проблемы разработки крупномасштабных моделей китайского производства все еще имеют некоторые области, которые превосходят международные модели

В последние полгода большие модели выпускались одна за другой, какова их нынешняя сила? Согласно оценке 10 крупномасштабных моделей искусственного интеллекта в стране и за рубежом, проведенной соответствующими учреждениями, ChatGPT в целом имеет относительно очевидное преимущество, занимая первое место с точки зрения исчерпывающих данных. Что касается подсекторов, отечественная крупномасштабная модель превосходит зарубежную модель с точки зрения понимания слов и предложений и вопросов знаний, то есть отечественная крупномасштабная модель ИИ обладает более сильным базовым познанием и способностью к обучению для текста.

Среди шести отечественных крупномасштабных моделей всеобъемлющая производительность данных «Wen Xin Yi Yan» относительно превосходна, особенно лидируя среди отечественных крупных языковых моделей с точки зрения понимания слов и предложений, программирования, вопросов знаний и перевода; с точки зрения бизнеса Написание, отечественные продукты работают лучше всего Лучшее - «Xunfei Xinghuo»; с точки зрения литературных вопросов, отечественный продукт «Tiangong 3.5» имеет самый высокий балл 88,33%, что на одном уровне с ChatGPT; с точки зрения логического мышления, "Wenxinyiyan" и "Xunfei "Spark" показали себя довольно хорошо.

Отечественные крупномасштабные модели очень хорошо работают в некоторых подразделах, но все еще существует определенный разрыв с зарубежными продуктами того же типа, и еще есть много возможностей для улучшения основных технологий, таких как данные и сценарии посадки.

На уровне данных для разработки больших моделей требуются высококачественные обучающие наборы данных. В настоящее время общий объем китайских данных, необходимых для обучения крупномасштабных моделей на основе китайской семантики в Китае, недостаточен, а качество не является высоким.Нехватка высококачественного китайского корпуса для обучения крупномасштабных моделей также увеличивает разрыв.

С точки зрения вычислительной мощности, основанной на мощности центров обработки данных, ведущими компаниями в этой области в 2022 году являются Google, Microsoft, Amazon и Meta, На эти четыре платформы центров обработки данных приходится более 70% общей емкости самостоятельно созданных данных. центры в мире и В настоящее время, хотя некоторые ведущие технологические компании, такие как Alibaba, Baidu и Tencent, завершили строительство центров обработки данных в Китае, все еще существует определенный разрыв в плане мощности по сравнению с зарубежными странами.

С точки зрения сценариев приземления, стоимость приземления в различных сценариях подразделения также является проблемой. Чтобы получить достаточно эффективную и простую в использовании большую модель, необходимо вложить достаточный и целевой корпус, а это означает, что реализация различных сценариев подразделения требует больших затрат.

По оценкам, стоимость обучения большой модели составляет от 2 до 12 миллионов долларов США. Из-за высоких затрат на обучение компания OpenAI, занимающаяся разработкой искусственного интеллекта, потеряет в 2022 году около 540 миллионов долларов США. Поэтому для коммерческой реализации больших моделей ИИ потребуется время.

На этой высококонкурентной трассе, несмотря на множество трудностей, отечественные крупные модели движутся в более совершенном техническом направлении. Кроме того, конкуренция на треке также ускорит темпы развития отечественной технологии крупномасштабных моделей и будет способствовать общей технологической модернизации индустрии искусственного интеллекта в Китае.

*Источник данных: Structure Research, Исследовательский центр InfoQ, Liepin Big Data, «Отчет об исследовании большой модели искусственного интеллекта Китая» и другая общедоступная информация не полностью скомпилированы.

Посмотреть Оригинал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Награда
лайк
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
GT 2025 Q2 Burn Completed
7k Популярность
Michael Saylor Hints at Buying BTC
7k Популярность
BTC
30453k Популярность
4contentstar
10720k Популярность
5NADA
11186k Популярность
6BOME
11565k Популярность
7BTC
30453k Популярность
8SMILE
9062k Популярность
9比特币
13438k Популярность

Закрепить

Карта сайта