Маючи 2,5 мільярда юанів, Zhipu AI більше не може залишатися в тіні

Джерело статті: 36 Криптон

У контексті сьогоднішнього наративу про великі моделі Zhipu AI має навчитися звикати стояти в центрі уваги.

Джерело зображення: Створено Unbounded AI

01 Спектр мудрості штучного інтелекту, що стоїть у центрі уваги

Понад 2,5 мільярда юанів, що є сукупною квотою фінансування, отриманою Beijing Zhipu Huazhang Technology Co., Ltd. (далі – Zhipu AI) цього року, і вона також стала одним із найбільших модельних стартапів із найвищим державним фінансуванням у Китаї.

Після виходу ChatGPT технологічний бум, розпочатий великими моделями, швидко перетворився на інвестиційний бум. Але, на відміну від минулого, широко визнано, що це більш Метью-трек, як для інвесторів, так і для стартапів.

З одного боку, на даному етапі великомодельне підприємництво в значній мірі покладається на важкі ресурси і сильні кошти, а кількість підприємств-початківців, які мають можливість вийти на ринок, невелика, і інвестори можуть зробити ставку набагато менше;

З іншого боку, більшість людей вважають, що велика модель – це можливість, порівнянна з Інтернетом або навіть перевершує його, оцінка компаній зростає, а відомим інвесторам та установам доводиться «купувати групами».

За даними 36Kr, сума фінансування, офіційно оголошена Zhipu AI, все ще є консервативною оцінкою, і фінансування все ще обговорюється.

З 2019 по 2023 рік загальний обсяг фінансування в трьох раундах по чотири роки Zhipu AI перевищив 3 мільярди юанів. З початку цього року і періодичність фінансування, і обсяг фінансування значно перевищили і раніше.

У 2019 році було офіційно засновано Zhipu AI з інвесторами раунду Pre-A, включаючи China Science and Technology Chuangxing і Tsinghua Holdings, інвесторами серії A, включаючи Dachen Caizhi та China Holdings Fund, а також інвесторами серії B, включаючи Legend Capital, Qiming Venture Capital тощо.

Згідно з інформацією, опублікованою Zhipu AI, її інвестиційними учасниками в основному є фонд соціального страхування Zhongguancun Independent Innovation Fund (керуючим фондом є Legend Capital), Meituan, Ant, Ali, Tencent, Xiaomi, Kingsoft, Shunwei, Boss Zhipin, Good Future, Sequoia, Hillhouse та інші установи, а також деякі старі акціонери, включаючи Legend Capital.

Джерело: IT Orange

Як зірковий стартап великої моделі, Zhipu AI має завидний список інвесторів, Zhipu AI не бракує джерел фінансування, капітал має обличчя, багато інвесторів сказали: «Тепер саме Zhipu вибирає інвесторів, а не навпаки». "

В даний час багато великих модельних стартапів в індустрії отримали високе фінансування, і на ринку не бракує грошей для інвестування у великі моделі, але брати чи ні, як брати, це те, що великі модельні стартапи повинні враховувати більше.

Аналізуючи список інвесторів Zhipu AI, можна побачити, що кошти – це не єдиний фактор, цінність, представлена фондами, може давати різні ресурси стартапам великих моделей.

Наприклад, фонд соціального страхування Zhongguancun Independent Innovation Fund. На прес-конференції Форуму Чжунгуаньцунь 2023 року, присвяченій головним науково-технічним досягненням, що відбулася наприкінці травня цього року, Фонд соціального забезпечення оголосив, що створить «Спеціальний фонд незалежних інновацій Фонду соціального забезпечення Чжунгуаньцунь», який має атрибут ідентичності «національна команда», з початковим масштабом 5 мільярдів юанів і періодом фонду понад 10 років, демонструючи довгострокові характеристики фонду.

Іншим прикладом є Meituan, Ant, Ali та Tencent та інші інтернет-гіганти, які не тільки можуть принести багаті кошти, але й означають потенційну промислову співпрацю, багато інтернет-бізнесів мають потенціал для трансформації на основі великих моделей, базова велика модель Zhipu AI може отримати доступ до величезних даних, бізнес-сценаріїв тощо, чого не вистачає багатьом стартапам.

У контексті сьогоднішнього наративу про велику модель Zhipu AI має навчитися звикати стояти в центрі уваги, що не дуже узгоджується зі стриманим стилем Zhipu AI.

02 Дим великої моделі вже давно горить

ChatGPT поза колом — це момент сингулярності AIGC, і це як точка поділу може чітко розділити два етапи, деякі великі компанії чи стартапи вже провели технічне попереднє дослідження або заснували нові компанії, щоб зосередитися на великих моделях, коли велика модель показує свої зерна, і значна частина компаній чітко бачить ChatGPT, перш ніж прийняти рішення про створення великої моделі.

Це призводить до когнітивних відмінностей, які можуть призвести до різних результатів.

Індустрія загалом вважає, що 2023 рік – це перший рік великої моделі, і в очах Чжан Пена, генерального директора Zhipu AI, «першим роком великої мовної моделі штучного інтелекту» має стати 2020 рік, тобто другий рік створення Zhipu AI.

Чжан Пен, генеральний директор Zhipu AI

У 2017 році на світ з'явився Transformer, і послідовно випускалася серія масштабних моделей Transformer, таких як GPT-1 і GPT-2, які мали масштабні параметри та потужні можливості узагальнення, вирішуючи багато завдань, які ми не могли вирішити раніше.

До 2020 року поява GPT-3 виводила генеративний ШІ в нову еру.

У 2020 році це також вузол, де Zhipu AI вирішила повністю розробити великі моделі. У той час, через високу вартість навчання та складний поріг досліджень і розробок, великі моделі не були оптимістичними для галузі, а розвиток спектру мудрості не був таким гучним, як зараз.

Однак після випуску ChatGPT Чжан Пен прямо сказав, що його почуття були «і схвильованими, і деяким тиском», схвильованим, що напрямок був більш певним, і тиск виходив від терміновості наздогнати нові технології.

При цьому все більше інвесторів шукають Zhipu AI, а дим великих моделей вже давно розгорівся, і інвестори сподіваються знайти людей, які зможуть звернути увагу на феєрверки в першу чергу.

Після деяких досліджень, стабільної команди засновників, достатньої кількості технологічних опадів і комерціалізації, досліджень та інших факторів Zhipu AI перетворився з нового на відомий.

З точки зору команди засновників, Zhipu AI був інкубований Tsinghua KEG (Лабораторія інженерії знань), і ця команда вийшла з лабораторії та вийшла на ринок, а Zhipu AI була офіційно створена.

Генеральний директор Чжан Пен закінчив факультет комп'ютерних наук Університету Цінхуа зі ступенем бакалавра, а його науковим напрямком на кафедрі комп'ютерних наук Університету Цінхуа є граф знань.

Голова Лю Дебін навчався під керівництвом академіка Гао Веня, був заступником директора Науково-технічного дослідницького центру великих даних Науково-дослідного інституту науки про дані Цінхуа, а президент Ван Шаолань є провідним доктором інновацій у Цінхуа.

У Кремнієвій долині і навіть у світовому академічному колі Zhipu AI давно відомий, в очах інвесторів Zhipu AI в період Цінхуа «має людей, технології, клієнтів», еквівалентний невеликому, але красивому стартапу, і весь основний персонал має період співпраці, відносно стабільний, за логікою інвестування в людей, інвестування в трек, Zhipu AI природно фаворит.

Технічний аспект також є сильною стороною Zhapu AI, яку можна простежити з ранніх досліджень Zhippu, від AMiner у 2006 році до створення компанії у 2019 році, а потім зосередитися на дослідженні алгоритмів великих моделей у 2020 році, GLM-10B у 2021 році, GLM-130B у 2022 році, ChatGLM-6B та ChatGLM, діалогової моделі на 100 мільярдів у березні 2023 року.

Повідомляється, що Zhipu AI також випустить нове покоління великої моделі на п'єдесталі 27 жовтня. У цьому охопленому війною жовтні великої модельної індустрії те, чи зможе Zhipu зайняти місце, залежить від продуктивності нового покоління моделей.

Дослідження Zhipu AI проводиться раніше, ніж переважна більшість учасників великих моделей у Китаї, і Zhipu перетворює перевагу першопрохідця на перемогу.

У світовій оцінці великих моделей, опублікованій Стенфордом, GLM-130B є єдиною обраною моделлю в Азії, з такою ж точністю та злістю, як і GPT-3, а надійність та похибка калібрування є відмінними серед усіх моделей.

14 березня 2023 року ChatGLM-6B отримав відкритий вихідний код і за кілька місяців отримав 48 000+ зірок і 6 800+ форків на GitHub, а також 8 000 000+ завантажень на Hugging Face, посівши перше місце в чотиритижневому тренді; Сотні проєктів на базі ChatGLM-6B, таких як LoRA, P-Tuning, langchain тощо. Посідає перше місце в оцінках третьої сторони за китайську природну мову, китайські розмови, китайські запитання та відповіді та завдання на міркування.

03 Довга пробіжка без кінця

Як загальна революційна технологія, велика модель не тільки визначає конкуренцію між індивідами і підприємствами, але і пов'язана з конкуренцією великих держав, а походження Чжипу визначає, що це не тільки підприємство, але і команда вченого типу з технократичними ідеалами.

На відміну від більшості компаній та установ, Spectrum AI йде своїм шляхом.

36Kr дізнався, що дослідження великих моделей багатьох великих вітчизняних виробників базуються на GPT, BERT і T5, як комерційна компанія зрозуміла, але з національної точки зору Китай повинен і повинен мати власну попередню підготовку, не для того, щоб слідувати, а для того, щоб піти зі свого власного шляху, GLM (General Language Model) є відповіддю на Zhipu.

Самостійна розробка великих моделей - справа непроста і вкрай ризикована. «Вплив GPT-3 на нас сповнений рішучості розробити щільну, 100-мільярдну, двомовну модель. Тому що після того, як ми закінчили дослідження того року, ми також знали, що інвестиції в таку справу були дуже великими, особливо в обчислювальну потужність, таланти, команду та дані. Чжан Пен раніше говорив 36Krypton.

Джерело: фото СК

"Китай не має власної структури для попередньо навчених моделей. Будь то GPT, BERT або T5, це базова технологія, запропонована західними вченими, і цей шлях монополізований Заходом. Ми хочемо зруйнувати монополію, тому не повністю повторюємо шлях OpenAI. – сказав він.

Звичайно, Zhipu AI активно відрізається від західної технічної системи, що також представляє потенційні ризики, і якщо подальша розробка зіткнеться з новими вузькими місцями, можуть виникнути додаткові труднощі.

В даний час Zhipu є одним з небагатьох великомодельних підприємств з вітчизняним капіталом/внутрішніми самодослідженнями, і має чіткий вітчизняний план адаптації чіпів, який більше підходить для китайських підприємств і може певною мірою компенсувати розбіжність маршрутів.

За результатами торгів «2023 Industrial Technology Basic Public Service Platform – Industrial Public Service Platform Project for Artificial Intelligence Large Model Engineering Technology and Application», нещодавно оприлюднених Департаментом науки та технологій Міністерства промисловості та інформаційних технологій, консорціум, у якому брав участь Zhipu AI, виграв тендер.

Згідно з повідомленнями, проект є першим великим спеціальним проектом великої моделі Міністерства промисловості та інформаційних технологій Китайської Народної Республіки та єдиним великим проектом великої модельної платформи суспільних послуг цього року, який підтримає переможця торгів та сприятиме дослідженням ключових технологій, інтелектуальній генерації та застосуванню великих моделей для ключових галузевих застосувань.

Відкритий вихідний код також є основною особливістю Zhipu AI, багато підприємств обрали шлях із закритим вихідним кодом, але Zhipu сподівається створити процвітаюче співтовариство та екологію, щоб ще більше сприяти розвитку великої моделі спільноти з відкритим вихідним кодом, Zhipu AI випустив ChatGLM2, сотні мільярдів моделей діалогу на п'єдесталі оновлені та відкриті вихідні коди, включаючи 6B, 12B, 32B, 66B, 130B різних розмірів, щоб задовольнити потреби клієнтів на різних рівнях.

«Наші академічні та технічні обміни та співпраця з продуктами є відносно відкритими, і великі моделі не можуть бути зроблені, покладаючись на одну компанію, але все одно потребують відкритої екології». Я думаю, що це відкритий вихідний код або безкоштовний, ці речі не призначені для комерційної вигоди. – сказав Чжан Пен.

З точки зору комерціалізації, Zhipu AI більш неквапливий, беручи за приклад сьогоднішню велику модель гарячої галузі, Zhipu AI не зробив велику модель для того, щоб задовольнити клієнтів, Zhipu AI вирішив «відкласти яйця на цьому шляху» на шляху до AGI, замість того, щоб взяти за мету велику модель галузі.

«Галузева модель – це, по суті, оболонка великої моделі та перевинахід колеса традиційного алгоритму». Чжан Пен вказав на обмеження великої моделі галузі: «Ми вважаємо, що лише певна шкала (загальних) великих моделей може досягти появи когнітивних здібностей, подібних до людських». "

Штучний інтелект – це біг на довгу дистанцію без кінця, велика модель – один із пам'ятників, кожен хоче викарбувати на ній своє ім'я, капітал – це засіб Zhipu AI до ідеалу технології, коли Zhipu загорнутий і його потрібно стояти перед сценою, він перевірить рішучість, впевненість і терпіння Zhipu.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити