Масштабні моделі крутилися пів року, а інвесторів, які заплатили реальні гроші, одиниці

2023-06-30 09:37:37

Автор｜Лю Яннань

Джерело｜Цзяцзи Світловий рік

На 136-й день після крику «бути китайською версією OpenAI» Ван Хуйвен продав «Світлові роки» Мейтуаню.

29 червня 2023 року Meituan оголосив на Гонконзькій фондовій біржі, що 29 червня 2023 року він повністю придбає 100% акцій «Light Years Beyond». Загальна ціна покупки включає: 233,673 мільйона доларів США готівкою + зобов’язання Борг 366,924 мільйона доларів США в юанях + 1 юань, що становить приблизно 2,065 мільярда юанів.

Важко уявити, що перша великомасштабна модель стартапу, заснована великим босом у Китаї, закінчиться таким чином.Цей кінець залишив незліченну кількість сумнівів і спекуляцій на ринку.

З точки зору загального бізнесу, придбання Meituan, що знаходиться на відстані світлових років, є лише звичайним придбанням серед підприємств. Але для вітчизняної індустрії штучного інтелекту це придбання, здається, свідчить про те, що хвиля великомасштабного підприємництва штучного інтелекту, яка була гарячою лише півроку, остигає.

Ринок капіталу має більш інтуїтивне сприйняття температури води в галузі. З 26 червня концептуальні акції AI, такі як HKUST Xunfei, Kunlun Wanwei і 360, разом різко впали.

Не тільки в Китаї люди навіть більше не прагнуть до ChatGPT, до якого колись були юрби.

Згідно з даними інструменту аналізу даних веб-сайту SimilarWeb, темпи зростання відвідувань ChatGPT на ранньому етапі були вражаючими: темпи зростання в місячному обчисленні становили 131,6% у січні, 62,5% у лютому та 55,8% у березні. У квітні він суттєво сповільнився, і темп зростання в місячному обчисленні склав 12,6%, а в травні цей показник становив лише 2,8%.

Коли популярність великих моделей зникає, люди легко задаються питанням: чи є велика модель хорошою можливістю почати бізнес?

Очевидно, що стандартної відповіді на це питання немає, і навіть думки великих хлопців досить різні. Буквально кілька днів тому Фу Шен, голова і генеральний директор Cheetah Mobile, і Чжу Сяоху, керуючий директор GSR Venture Capital Fund, «сперечалися» в колі друзів з цього приводу.

Когнітивні невідповідності великої моделі не зосереджені лише на окремій людині. Коли підприємці, інвестори та споживачі мають когнітивні упередження, «обережність і консервативність» із великими моделями стала звичним станом для більшості гравців.

На щорічній конференції China Film Capital у 2023 році, яка відбулася 16 червня, між інвесторами China Film Capital та компаніями, які займаються виробництвом жорстких і споживчих технологій, відбулася гаряча дискусія щодо того, як індустрія сприймає великомасштабні моделі та AIGC.

З точки зору "Jiazi Guangnian", ринок великомасштабних моделей терміново потребує раціональних голосів, темпи інновацій неможливо зупинити, і багато питань ще належить прояснити: чи можна створювати масштабні моделі? Як кастинг? Які проблеми з входом у велику модель? Чи повторить майбутня комерціалізація великих моделей помилки попередньої індустрії ШІ?

Незалежно від того, наскільки стурбовані люди, майже само собою зрозуміло, що галузь приймає велику модель - питання в тому, яким чином.

1. Обачливі інвестори

Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... З початку 2023 року до сьогоднішнього дня одна за одною виникли вітчизняні великі стартап-компанії. Сила кожного підприємства полягає у високому капіталі.

У той час не було рідкістю, коли певний зірковий підприємець залишав роботу, щоб розпочати бізнес, і переходив до великої моделі, щоб отримати величезне фінансування.

Наприклад, 1 червня повідомлялося, що MiniMax, вітчизняна масштабна модельна стартап-компанія, збиралася завершити раунд фінансування на суму понад 250 мільйонів доларів США, а оцінка компанії перевищила 1,2 мільярда доларів США;

У той час новини про фінансування Light Years Away, яку щойно придбала Meituan, були ще більш заплутаними.Ван Хуейвен одного разу заперечив, що компанія отримала 230 мільйонів доларів США фінансування від Source Code, Tencent, Wuyuan і Suhua, але врешті-решт це фінансування було відхилено. Це було підтверджено через оголошення про придбання, опубліковане Meituan.

Ця хвиля інвесторів, які шукають підприємців, змусила людей думати, що велика модель активізує весь національний круг венчурного капіталу ШІ, але це не так. Насправді, за винятком зіркових команд із власними ореолами, інвестори, швидше за все, будуть чекати, бачити та досліджувати масштабне підприємництво, і лише невелика кількість людей насправді витрачає реальні гроші.

Ще на початку цього року, коли хвиля ChatGPT охопила світ, «Цзяцзи Гуаннянь» вперше обмінявся думками з деякими інвесторами. За цей час майже всі швидко вчилися і запрошували фахівців для ведення науково-популярної роботи в компанії.

У той час у сфері штучного інтелекту точилася гаряча дискусія: чи є ChatGPT моментом iPhone у світі штучного інтелекту? У цьому відношенні відповідь Сяньфена полягає в тому, щоб не поспішати з висновками. «Ми ще не впевнені, наскільки великий цей вплив, але ми думаємо, що вона (велика модель) точно щось змінить», — сказав Лі Кан, віце-президент Xianfeng.

Однак деякі інвестиційні установи висловили занепокоєння щодо великої моделі. Інвестор первинного ринку сказав "Jiazi Guangnian", що він дуже стурбований надмірною реакцією Китаю. Після спалаху ChatGPT вітчизняні концептуальні запаси штучного інтелекту підірвалися. «Наш первинний і вторинний ринки повинні розглянути, чи можуть відповідні вкладені інвестиції принести відповідну віддачу. Якщо це короткострокові інтереси, такі інвестиції зрештою легко підуть даремно, оскільки ви насправді не сприяли розвитку технологій , але це концептуальна інвестиція».

На його думку, інвестори повинні зосередитися на вивченні більшої кількості фундаментальних наук, які мають вплив на майбутнє людства.Це справжня технологічна сила з глибокою потенційною ринковою вартістю. «Необхідно інтегруватися з ринковою динамікою, а також ринковою вартістю та реальним, майбутнім соціальним прогресом. Ми не повинні слідувати сліпо. Ми повинні чітко розуміти, що може змінити майбутнє. Це не повинно бути бульбашкою на хвилі».

Однак практикуючий FA сказав "Цзяцзи Гуаннянь": "Останнім часом інвестори поступово почали вкладати кошти у масштабні модельні проекти, але сума невелика".

«Основна проблема все ще полягає в недостатньому розумінні.» Щодо обережного ставлення інвесторів Чжан Гаонань, керуючий партнер Huaying Capital, висловив власне розуміння. Далі він заявив: «Майже ніхто не може чітко визначити велику модель. Нам потрібно визначити межі великої моделі, перш ніж обговорювати її. Велика модель, яку ви згадали, і велика модель, яку я згадав, — це, ймовірно, не одне й те саме».

На думку деяких людей, обережність інвесторів може бути негативним сигналом для великого підприємництва, і вона ллє холодну воду на масштабні моделі. Але з об'єктивної точки зору розсудливість не означає відкидання, а розумне обіймання після глибоких роздумів є дорожчим.

Незалежно від того, інвестори, підприємці чи традиційні компанії, які хочуть трансформувати та модернізувати свій власний бізнес за допомогою великих моделей, їм потрібно прояснити два питання, перш ніж вони справді вийдуть на ринок великих моделей: які межі можливостей великої моделі та чи є у них необхідність введення великої моделі?

2. Перш ніж взятися за велику модель, уточніть два запитання

Коли з’являється нова технологія, основним питанням у світі бізнесу є: де і як цю технологію можна використовувати?

Це особливо важливо для великих моделей, і це також питання, яке компанії, які насправді не вийшли на велику модель, повинні ретельно розглянути.

Щоб відповісти на це питання, спочатку необхідно окреслити межі можливостей великої моделі.

Особливістю великої моделі є те, що її внутрішній алгоритм моделі є величезним чорним ящиком, а процес генерації великої моделі є незрозумілим і непередбачуваним, тому важко визначити межі її можливостей. Але можна сказати точно те, що велика модель загального призначення не є панацеєю.

Лін Юнхуа, віце-президент і головний інженер Науково-дослідного інституту Чжиюань, одного разу зазначив, що з точки зору промислового впровадження «велика модель + оперативне навчання» не може замінити все.

Вона також зазначила, що для багатьох конкретних завдань або нових завдань вивчення підказок може дозволити великій моделі виводити необхідні результати через кілька раундів підказок, але велика модель «не може запам’ятати» цей процес, і якщо розробник додає всю підказку в кожен виклик, з одного боку, може зробити його довшим і довшим і перевищити можливості контексту великої моделі.З іншого боку, це неминуче призведе до збільшення вартості кожного міркування, і ефект буде важким контролювати. Ця нестабільність ще більш фатальна на етапі посадки продуктів, у які інвестовано реальні гроші.

Чжан Ітіан, головний експерт Національного центру мовленнєвих інновацій, також сказав на щорічній зустрічі Huaying Capital у 2023 році: «Велика модель — це генеративна логіка, і вона дає лише оптимальну кластеризацію словникового запасу, і немає причини й ефект між відповіддю та запитанням. Ми отримуємо лише «результат», який потрібно визначити, а не «відповідь». Отже, чи можна велику модель безпосередньо застосувати в таких серйозних сферах, як освіта, медичне обслуговування, і справедливість може бути проблемою. Але вона полягає в допомозі в прийнятті рішень. Це має сенс. З точки зору безпосереднього отримання результатів, якщо це буде комерціалізувати та виробити, ми вважаємо, що попереду ще довгий шлях».

Тому в галузі існує консенсус, що в майбутньому кожна галузь матиме власну вертикальну модель, і ключовим моментом є те, як інтегрувати можливості загальної моделі з власними галузевими даними компанії.

Але перш ніж по-справжньому розглядати реалізацію масштабного модельного проекту, підприємці повинні розглянути більш важливе, але легко упущене питання – чи є масштабна модель «просто необхідною» для підприємства?

У зв’язку з цим національна мультимодальна команда великомасштабних моделей одного разу повідомила «Jiazi Guangnian», що чи «просто потрібні» підприємствам великомасштабні моделі, потрібно розуміти з різних точок зору. Для деяких підприємств відсутність великомасштабної моделі еквівалентно втраті гостроти в ринковій конкуренції, і їм доводиться використовувати широкомасштабну модель, щоб завоювати прихильність клієнтів - це також «просто необхідно».

Але певною мірою це більше схоже на настрої ринку на початку розвитку технологій. У довгостроковій перспективі індустріалізація технологій, що розвиваються, в основному буде обумовлена потребами бізнесу. У цей час, чи потрібна підприємству велика модель, потрібно враховувати кілька факторів.

Крім конкретних питань реалізації проекту, компаніям також необхідно враховувати питання безпеки даних і вплив великих моделей на початкову структуру ринку.

Ці дві проблеми часто виникали в епоху інформації та цифрових технологій і не можуть бути викорінені.В епоху інтелекту ці проблеми можуть виявлятися в більш витончений спосіб.

«Багато споживчих або платформних компаній, якщо вони приймають велику модель без застережень, велика модель має сильну здатність протистояти галузі, оскільки це означає, що галузь легко передається з галузі. Поріг входу та когнітивний ключ ", - сказав Чжан Ітіан.

У контексті цифрової трансформації більшість галузей досягли цифрової трансформації та модернізації за допомогою таких технологій, як великі дані та хмарні обчислення. Але в той же час традиційні підприємства також передали велику кількість галузевих даних виробникам цифрових технологій.Постачальники цифрових технологій стали основним органом, який не можна ігнорувати в галузі, і початкова структура ринку була змінена.

Однак через невеликий обсяг даних у таких галузях, як промисловість і будівництво, а також через складність зв’язку даних між бізнес-напрямками традиційні підприємства все ще зберігають високі бар’єри для конкуренції.

Чжан Ітіан сказав: «На даний момент будівельна галузь є галуззю, яка найкраще захищена в контексті цифровізації. Зараз інформатизація будівельної галузі, за винятком Глодона, який може скласти бюджет, не може скоротити жоден гігант. Чому? Тому що архітектура має проектні креслення, будівельні креслення, креслення технічного обслуговування, креслення планування, креслення файлів та інші вісім креслень, усі креслення не пов’язані один з одним, і державні відомства не розпізнають один одного. Вартість відкриття цих восьми креслень уся будівля досить висока, тому будівельна галузь продовжує диверсифікацію такого роду конкуренції. Ми зазвичай вважаємо, що диверсифікація конкуренції є джерелом життєвої сили та сили для промислового розвитку».

Таким чином, на хвилі великомасштабних моделей для підприємств, чиї галузеві стандарти та конкурентні переваги не є досконалими, кожна компанія має ретельно розглянути, чи варто беззастережно приймати великомасштабні моделі.

3. Не існує стандартної відповіді щодо інженерної реалізації великих моделей

Абітурієнтам, які вклали реальні гроші у великий модельний ринок, наступне, що потрібно зробити – це вирішити власне проблему реалізації проекту.

У зв'язку з цим в індустрії поступово сформувався консенсус, що в майбутньому великі моделі та маленькі моделі будуть доповнювати одна одну в процесі промислового впровадження.

Лін Юнхуа одного разу сказав, що вузькі сценарії, які вимагають високої точності та низьких можливостей узагальнення, більше підходять для парадигми «мала модель + передача навчання». Такі як інспекція промисловості, інспекція промислової якості, аналіз медичного зображення тощо.

Крім того, Сюань Сяохуа, засновник Huayuan Computing, також сказав, що бізнес-модель компаній зі штучним інтелектом у майбутньому полягає в інтеграції загальної великої моделі, керованої великими даними, і моделі малих даних, керованої знаннями для вертикальних галузей для досягнення двох- колісний привід.

Чжан Гаонань також сказав «Jiazi Guangnian»: «Коли підприємства оптимізують власні моделі або тренують вертикальні моделі, вони можуть поєднувати їх із великими моделями. Їм не потрібні багатовимірні дані, як великі моделі, і їм не потрібно повністю застосовувати великі моделі. Однак технологію великих моделей можна поєднати з іншими технологіями для формування промислової вертикальної моделі з низькими вимогами до обчислювальної потужності, що є повчальним, і це аж ніяк не просте застосування великих моделей».

Наприклад, для проблеми «ілюзії» великих моделей, яку неодноразово критикували, може знадобитися об’єднати технологію ШІ попереднього покоління, щоб вирішити її в короткостроковій перспективі.

«Є багато причин для галюцинацій, і це може бути через те, що дані відносно рідкісні та недостатні в певній області. У цьому випадку нам потрібно надати більше даних моделі для навчання. Крім того, коли користувачі задають запитання, чітко надавайте Більше довідкова інформація також є способом зменшити галюцинації або знизити «температуру». Іноді галюцинації виникають через те, що запитання недостатньо повні, їм бракує передумов і передумов. Тому питання також дуже важливе, а техніка є ключовою. Крім того, якщо користувачі дійсно хочуть розв’язувати точні проблеми на 100%, їм все одно може знадобитися використовувати графи знань. Графи знань можуть забезпечити точність логічних міркувань, а також нові технології, включаючи «модель світу», запропоновану Янном Лекуном, головою Meta AI », - сказав Ву Сюенін, технічний директор Jinyou.com.

Окрім поєднання з попереднім поколінням технології штучного інтелекту, важливою частиною є також поєднання процесу навчання великих моделей із високоякісними галузевими даними.

Наприклад, як гібридна база даних, що обслуговує платформу AI PaaS, Tianyun Data пропрацювала більше десяти років, і тепер вона досягла стадії об'єднання з великими моделями.

Лі Конгву, віце-президент Tianyun Data, сказав, що поєднання самого себе та великої моделі буде розглядатися з двох аспектів: по-перше, як поєднати дані приватного домену з великою моделлю. Наприклад, Tianyun Data завершила подібний проект тлумачення політики для Комісії з регулювання цінних паперів Китаю. Поєднуючи різні дані, такі як нормативні акти, прецеденти та тлумачення, Tianyun Data створила тлумачення порушень, подібно до процесу судових санкцій. дані для розшифровки причини порушень.

По-друге, Tianyun Data розробляє гібридну базу даних і є однією з перших компаній у Китаї. Ще приблизно в 2018 році Tianyun Data запропонувала концепцію власної бази даних штучного інтелекту, яка насправді схожа на векторну базу даних, яка сьогодні підтримує великі моделі. Tianyun Data випустила векторну базу даних власної розробки та застосувала її до власних моделей.

Загалом, стандартної відповіді щодо інженерної реалізації великих моделей немає.

На шляху штучного інтелекту Китай точно прокладе шлях, який буде відрізнятися від інших країн. Важко розрізнити переваги та недоліки двох шляхів, і вони більше базуються на реалістичному виборі в різних національних умовах.

Лі Кан, віце-президент Xianfeng, одного разу провів аналогію з «Цзяцзи Гуаннянь» в інтерв’ю, і, здається, вона актуальна й сьогодні: «Несправедливо використовувати успіх OpenAI для опису багатьох проблем вітчизняних підприємців. це як двоє людей, які грають у карти. Це інше, інша сторона раптом зіграла велику руку та отримала стріт-флеш, ти просто скажеш, що він зіграв добре, я був надто обережним, але чому ти не сказав цього, коли я виграв?"

Чжан Ітіан поділився, що з точки зору центрального уряду, великі моделі, включно з проблемами штучного інтелекту, є важливим стратегічним інструментом, щоб отримати ініціативу в глобальній конкуренції, і важливою стратегією сприяння стрімкому розвитку науки і технологій моєї країни, оптимізація та модернізація індустріалізації та загальний стрибок продуктивності ресурсу.

«Коли у звіті 20-го Національного з’їзду Комуністичної партії Китаю говорилося про промислові питання, він пропонував штучний інтелект окремо від нового покоління інформаційних технологій. Тому, з точки зору політики, розвиток штучного інтелекту та великого Масштабні моделі — це не лише технічна та промислова проблема, а й основна конкуренція національної економіки. Питання влади, з глибшої точки зору, є політичним питанням, і кожен має розуміти це питання з вищої точки зору».

Якщо ми вискочимо з Китаю та розширимо графік технологічного розвитку, галас, викликаний ChatGPT, може стати лише крапкою в історії розвитку технологій штучного інтелекту, і всі судження можуть бути передчасними.

Зрештою, навіть техніки, які тривалий час були занурені на передову в дослідженнях штучного інтелекту, ще не дійшли консенсусу щодо майбутнього штучного інтелекту та перебувають у стані глибокої тривоги.

У нещодавно популярній книзі «Чому велич не можна спланувати» автори Кеннет Стенлі та Джоел Леман пишуть: «Ми повинні зіткнутися з неприємним фактом, що ми не можемо визначити, чи можуть будь-які емпіричні правила бути надійними провідниками в досягненні цілей ШІ. ."

На Пекінській конференції Чжіюань у 2023 році, яка завершилася нещодавно, Хуан Тіцзюнь, директор Науково-дослідного інституту Чжиюань, також мав дуже схоже занепокоєння. Він безпосередньо використав чотири слова «неможливо закрити» як назву промови на церемонії закриття. Він сказав: «Ми перебуваємо в невизначеному стані. Чи цей Near AGI сильніший за нас? Чи він розумніший за нас? Чи коли він перевершить нас? Я не знаю. Ми перебуваємо в стані повної відсутності контролю».

Наприкінці заключної промови він завершив таке речення: «Якщо ми можемо мати справу з ризиками з таким же ентузіазмом, як інвестування у великі моделі, то принаймні можливо зрозуміти майбутнє. Але чи вірите ви, що люди можуть це зробити?» це? Я не знаю".

Дивлячись на всі технології та індустрії, таке «відчуття втрати контролю» з боку провідних спеціалістів не є поширеним в інших галузях. Зараз майже всі переходять річку намацуючи каміння. Кожна компанія, яка сьогодні виходить на ринок, має потенціал стати піонером у технологічній цілині.

А час - найкращий доказ, щоб усе довести.

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 лайків

Нагородити
1
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
Dr.Han Joins Gate Square
2k Популярність
Gate VIP New Upgrade
7k Популярність
Nonfarm Payrolls Update
6k Популярність
4BTC
30228k Популярність
5contentstar
10719k Популярність
6NADA
11186k Популярність
7BOME
11564k Популярність
8BTC
30228k Популярність
9SMILE
9062k Популярність
10比特币
13325k Популярність

Закріпити

карта сайту