«Об’ємні» кошти, щоб захопити таланти, зрозуміти конкурентний ландшафт вітчизняних великомасштабних моделей ШІ в одній статті

Джерело: Titanium Media

Редактор: Лю Янін, Сунь Чен

Джерело зображення: створено Unbounded AI‌

29 червня Meituan опублікував оголошення на Гонконзькій фондовій біржі, оголосивши про придбання великомасштабної модельної компанії «Light Years Beyond», заснованої Ван Хуйвенем, що також залишило спекуляції на ринку великомасштабних моделей ШІ. Останнім часом кількість відвідувань ChatGPT скоротилася не лише в Китаї. Згідно з даними, глобальні відвідування ChatGPT у червні впали на 9,7% у порівнянні з місяцем, а кількість унікальних відвідувачів впала на 5,7% у порівнянні з місяцем. Крім того, тривалість користувачів ChatGPT також зменшується. Тривалість кожного відвідування зменшилася на 8,5% у травні. AIGC, схоже, започаткував період охолодження.

Але з іншого боку, 4 липня було офіційно запущено масштабну модельну компанію «Zero One Creation», організовану самим Кай-Фу Лі, а також широкомасштабну мовну модель «Wen Xin Yi Yan» APP, розроблену Baidu. запущено на Apple App Market, а корпоративна перевірка видавця перевірка Велика модель - «Знаючи ворога Альфа»... Різні компанії роблять часті кроки у сфері великих моделей, і вони в самому розпалі.

Наскільки популярний великий модельний бізнес штучного інтелекту? Який інвестиційний план ринку капіталу для цієї торгової точки? Яка продуктивність сучасних вітчизняних великогабаритних моделей? У цьому випуску Titanium Media·Tidu Tuwen намагається визначити поточний стан розробки вітчизняних великомасштабних моделей на рівні даних.

Вітчизняні технічні гіганти великомасштабної моделі «казкового бою» змагаються у стрільбі

З березня цього року вітчизняні моделі ШІ ростуть як гриби після дощу. «Звіт про дослідження великої моделі штучного інтелекту Китаю» показує, що до кінця травня 2023 року було випущено щонайменше 79 базових великих вітчизняних моделей із масштабом параметрів 1 мільярд або більше.

З глобальної точки зору Сполучені Штати посідають перше місце за кількістю великомасштабних моделей у світі.Уже в 2020 році Сполучені Штати випустили 15 великомасштабних моделей, включаючи GPT-3. У Китаї, починаючи з 2020 року, великомасштабні моделі також увійшли в стадію бурхливого розвитку: у 2021 році буде випущено 30 великомасштабних моделей, 28 великомасштабних моделей — у 2022 році, і 19 великомасштабних моделей. буде випущено в перші п'ять місяців 2023 року, перевершивши 18 великомасштабних моделей у Сполучених Штатах. Сьогодні кількість великомасштабних моделей у Китаї та Сполучених Штатах становить майже 90% від загальної кількості великомасштабних моделей у світі, а кількість великомасштабних моделей у Китаї увійшла в перший ешелон.

Вітчизняна траса великомасштабних моделей дуже жвава, і серед «гравців», які беруть участь у трасі великомасштабних моделей AI, є інтернет-компанії, представлені Ali, Tencent, Baidu тощо. 16 березня Baidu лідирував. і запустив китайську версію ChatGPT «文心一言». Згодом одна за одною з’явилися великі моделі, такі як Ali, Huawei, Tencent і 360.

Крім того, є компанії, що займаються технологіями ШІ, представлені SenseTime та iFLYTEK, освітні компанії, такі як Kidswant, фінансові компанії, такі як Flush, і компанії з нерухомості, такі як I Love My Home. Крім того, великі моделі також дуже популярні в академічних колах.Ще в лютому цього року Університет Фудань випустив MOSS, першу модель, схожу на ChatGPT, у Китаї.

Варто зазначити, що завдяки популярності ChatGPT у Китаї також стався бум великомасштабного підприємництва в області штучного інтелекту.Багато технологічних лідерів і керівників великих компаній присвятили себе великомасштабним моделям і почали повторне підприємництво.

У лютому 2023 року Ван Хуйвен, колишній співзасновник Meituan, опублікував «Список героїв AI», гучну статтю про велику модель AI; також відомим був Лі Кайфу, генеральний директор Sinovation. Ventures.19 березня Лі Кайфу оголосив у колі друзів, що заснував компанію Project AI 2.0 і ввів у широкомасштабну модель штучного інтелекту; згодом засновник Sogou Ван Сяочуань, колишній піонер JD.com AI бізнесу Чжоу Бовен і Моменвен Генеральний директор Лі Чжіфей також приєднався до підприємницького буму великомасштабних моделей AI.

Крім цих технологічних гігантів, багато керівників великих інтернет-компаній також приєдналися до змагань. Наприклад, Лі Янь, колишня головна фігура ШІ Kuaishou, заснував компанію Yuanshi Technology для проведення досліджень і розробки мультимодальних великих моделей; «закритий учень» Лі Кайфу та No. -взаємодія з комп'ютером. Сьогодні вітчизняний штучний інтелект широкомасштабний «казковий бій», індустріальний трек дуже жвавий.

Інвестиційні інституції обережні, а ринок набирає талантів у сфері великих моделей з високими зарплатами

Щоб увійти у велику модель, ви повинні спочатку підготувати гроші.Зрештою, велика модельна стартап-компанія випускає відносно зрілу модель, яка потребує інвестування у вартість інфраструктури великої мовної моделі, навчання та таланти R&D. Для стартапів фінансування – єдиний спосіб вижити.

Згідно з неповною статистикою Titanium Media·Tidu Tuwen, станом на 4 липня 2023 року сума фінансування великих стартап-компаній зі штучним інтелектом, які отримали фінансування цього року, зазвичай становить від десятків до сотень мільйонів. Серед них MiniMax, масштабна стартап-компанія, яка отримала найбільше фінансування, 1 червня завершила новий раунд фінансування, який перевищив 250 мільйонів доларів США. Поточна оцінка компанії перевищує 1,2 мільярда доларів США, і її називають «першою компанією Tencent». інвестиції." Підприємництво" назва.

Крім того, 5 червня компанія Light Years, яку щойно придбала Meituan, завершила свій раунд фінансування в розмірі 230 мільйонів доларів США, але цей раунд фінансування також було повернуто повністю після завершення придбання Meituan. Варто зазначити, що компанія Xihu Xinchen, заснована в 2021 році, завершила два послідовних фінансування в березні та квітні цього року, і швидкість фінансування є дуже швидкою.

У сфері інвестицій у масштабні моделі ШІ провідні венчурні капітали, такі як IDG Capital, Matrix Partners і ZhenFund, зробили менше кроків.

Згідно з неповною статистикою Titanium Media і Titanium News, Tencent Investment, Innovation Works, Qiji Chuangtan і Sequoia China є найактивнішими інвестиційними установами, з трьома інвестиційними компаніями, за якими йдуть BV Baidu Ventures і Zhipu AI, інвестиційні компанії займають 2 місця відповідно , і більшість установ інвестують лише в 1 компанію. Hillhouse Venture Capital і Shenzhen Venture Capital, які завжди були активними, не мають публічних даних про те, що вони інвестували у великомасштабні моделі ШІ. Можна побачити, що інвестори зацікавлені в Траса великомасштабного модельного підприємництва більш обережна.

Крім фінансування, в основі масштабного модельного змагання також лежать технічні можливості. Великі моделі мають високі вимоги до алгоритмів, обчислювальної потужності та даних. Великі моделі штучного інтелекту вимагають великих витрат на навчання та інвестицій у дослідження та розробки. Деякі великі інтернет-компанії та технологічні компанії мають більший капітал і технічні резерви.

Згідно з неповною статистикою Titanium Media·Tidu Tuwen, у 2022 році Huawei інвестує 161,5 мільярда юанів у витрати на дослідження та розробки, ставши компанією з найбільшою кількістю інвестицій у дослідження та розробки; по-друге, Tencent посідає друге місце з 61,4 мільярда юанів, а Ali займає 55,5 мільярда юанів. третій мільярд юанів. Інтернет-гіганти щороку інвестують десятки мільярдів у дослідження та розробки. Крім того, вони також мають сильну команду дослідників та розробників. Вони є заслуженими гравцями «першого ешелону» на трасі великомасштабних моделей.

Окрім капіталу та технологій, талант також є невід’ємною частиною великомасштабної конкуренції моделей.

У першому кварталі цього року різні компанії запустили конкурс на кращих талантів у галузі штучного інтелекту. Ван Хуйвен сказав, що використає 75% акцій, щоб запросити найкращих талантів у галузі науково-дослідних робіт. Лі Кайфу закликав залучати талантів світового класу з усього світу. Baidu найняв інженерів-алгоритмів великомасштабних моделей ШІ із зарплатою 25-40 тис. на місяць, і найняв інженера з архітектури моделей із зарплатою 20-40 тис./місяць; Алі набирає інженерів із навчання великомасштабних моделей та алгоритмів із зарплатою 40-70 тис./місяць, а великі компанії прагнуть талантів.

Відповідні дані показують, що в першому кварталі цього року кількість посад, пов’язаних із великими моделями штучного інтелекту, зросла на 10,16% у порівнянні з аналогічним періодом минулого року, що є сферою найбільшого зростання, пов’язаною з ChatGPT. Серед них середня річна зарплата інженерів з машинного навчання та алгоритмів досягла понад 400 000 юанів.

Проблеми розробки великомасштабних моделей китайського виробництва все ще мають деякі області, які перевершують міжнародні моделі

За останні півроку одна за одною вийшли великі моделі, яка їх сила зараз? Відповідно до оцінки 10 широкомасштабних моделей штучного інтелекту в країні та за кордоном, проведених відповідними установами, ChatGPT має явну лідируючу перевагу в цілому, посідаючи перше місце за всебічними даними. З точки зору підгалузей, вітчизняна широкомасштабна модель перевершує іноземну модель з точки зору розуміння слів і речень і питань знань, тобто вітчизняна широкомасштабна модель штучного інтелекту має сильнішу базову здатність до пізнання та навчання тексту.

Серед шести вітчизняних великомасштабних моделей продуктивність комплексних даних "Wen Xin Yi Yan" є відносно чудовою, особливо лідируючи серед вітчизняних великих мовних моделей з точки зору розуміння слів і речень, програмування, питань знань і перекладу; з точки зору бізнесу написання, вітчизняні продукти показують найкращі результати. Найкращим є "Xunfei Xinghuo"; з точки зору літературних запитань, вітчизняний продукт "Tiangong 3.5" має найвищий показник 88,33%, що відповідає ChatGPT; з точки зору логічних міркувань, «Wenxinyiyan» і «Xunfei «Spark» виступили досить добре.

Вітчизняні великомасштабні моделі дуже добре працюють у деяких розділених галузях, але все ще є певний розрив із іноземними продуктами того ж типу, і є ще багато можливостей для вдосконалення основних технологій, таких як дані та сценарії посадки.

На рівні даних розробка великих моделей вимагає високоякісних навчальних наборів даних. Наразі загальний обсяг китайських даних, необхідних для навчання великомасштабної моделі на основі китайської семантики в Китаї, недостатній, а якість невисока.Дефіцит високоякісного навчального корпусу китайської великомасштабної моделі також збільшує розрив.

З точки зору обчислювальної потужності, виходячи з потужності центрів обробки даних, провідними компаніями в цій галузі в 2022 році є Google, Microsoft, Amazon і Meta. Ці чотири платформи центрів обробки даних забезпечують понад 70% загальної потужності власноруч створених даних. Наразі, хоча деякі провідні технологічні компанії, такі як Alibaba, Baidu та Tencent, завершили будівництво центрів обробки даних у Китаї, все ще існує певний розрив щодо потужності порівняно з іншими країнами.

З точки зору сценаріїв посадки, вартість посадки в різних сценаріях поділу також є проблемою. Щоб отримати достатньо ефективну та просту у використанні велику модель, необхідно інвестувати достатній і цілеспрямований корпус, що означає, що реалізація різних сценаріїв підрозділу потребує великих інвестицій.

За оцінками, вартість підготовки великої моделі становить від 2 до 12 мільйонів доларів США. Через високі витрати на навчання компанія-розробник штучного інтелекту OpenAI у 2022 році втратить близько 540 мільйонів доларів США. Тому для комерційної реалізації великих моделей ШІ потрібен час.

На цьому висококонкурентному шляху, незважаючи на багато труднощів, вітчизняні великі моделі рухаються до більш досконалого технічного напрямку. Крім того, конкуренція на трасі також прискорить темпи розвитку внутрішньої технології великомасштабних моделей і сприятиме загальній технологічній модернізації індустрії ШІ Китаю.

*Джерело даних: Structure Research, InfoQ Research Center, Liepin Big Data, «China Artificial Intelligence Large Model Map Research Report» та інша загальнодоступна інформація зібрана не повністю.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити