Розчарування AI: піврічна модель, все ще літає в небі

2023-08-04 06:52:59

Джерело: «Photon Planet» (ID: TMTweb), автор: Ву Кунянь, редактор: Ву Сяньчжі

Джерело зображення: створено Unbounded AI

Вогонь великої моделі палає на цій землі вже півроку. Оскільки прес-конференції Huawei, JD.com і Ctrip наздоганяють вечірні епізоди, відповідно до послідовної парадигми Інтернету, «нова річ» вітчизняних великомасштабних моделей також започаткувала свій власний піврічний тест.

Це просто відрізняється від піврічної перевірки інших підприємств. Піврічна перевірка бізнес-форм, таких як транспортні засоби з новою енергією, мобільні телефони та платформи електронної комерції, підтримується достатньою кількістю загальнодоступних даних для полегшення текстового аналізу. чорний ящик», немає чіткої бізнес-моделі, тому про так звану інформацію про дані та інші аргументи не можуть бути й мови.

Досить іронічно, що навіть з точки зору функції продукту велика модель ще не створила загального методу оцінки. З огляду на кінцеву мету AGI, природно, існують різні методи оцінки, такі як класичний «метод білочої рибки-мандаринки», на який покладаються домашні кінцеві користувачі C для «оцінки» великих моделей.

Або через це більшість вітчизняних виробників не відкривають власні великі моделі для використання, як OpenAI, але впроваджують внутрішні механізми тестування.

Дослідження великомасштабних моделей більше зосереджено на B-стороні та G-стороні, наприклад, провідні в галузі великомасштабні моделі Tencent, Pangu 3.0 Huawei, Jingdong Lingxi тощо. Як поточний трек, на якому зосереджуються провідні гравці, його велика модель зосереджена на демонстрації зрілих форм продукту, наскільки це можливо, з комерціалізацією як основною метою. Наприклад, для швидкої популяризації та сприяння комерціалізації цього типу великої моделі, крім орієнтації на бізнес-посадку, важливими контрольними показниками також стали можливості локалізованого розгортання.

Незважаючи на це, в очах інсайдерів галузі, широкомасштабній моделі промисловості, яка «доставляє чашу на фронт», все ще бракує компаній, які її купують. Вітер промислової моделі дме протягом місяця з червня, і там широкомасштабної комерційної співпраці поки що не було.

Тому неважко помітити, що на сучасному інвестиційному ринку інвестиції, пов’язані з великими моделями, зосереджені на вторинному ринку, а не на первинному. Навіть якщо рівень великої корови Ван Хуйвеня вийде на ринок, публічні джерела кажуть, що його фінансування A-round значно перевищує 230 мільйонів доларів США, а його фінансові можливості не такі, як у OpenAI, який отримує десятки мільярдів доларів. від Microsoft час від часу.

Інвестиційний ринок є кваліфікованим барометром. Очевидно, що бланки відповідей, подані вітчизняними масштабними моделями на піврічному вузлі іспиту, не влаштовують, і для втілення «історії» потрібен період спокою та шліфування.

Велика модель без бізнес-моделі?

Коли вітчизняні великомасштабні моделі потребують відповіді на сумніви ринку, на перше місце слід поставити бізнес-моделі.

Популярність ChatGPT, яка вже посіла перше місце в умах користувачів, значно впала.Baidu та Ali, перші випущені в країні великі моделі загального призначення, також «замовкли» після того, як за ними послідувала велика кількість гравців. вгору. Причина в тому, що бізнес-модель загальної великої моделі не спрацювала. Незважаючи на те, що він отримав схвалення користувачів у сфері громадської думки, комерційний замкнутий цикл так і не з'явився.

Взявши за приклад широкомасштабну модель Baidu з широким спектром тестів, платіжна модель її комерційного додатку Wenxin Qianfan базується на кількості токенів, згенерованих під час виклику, стандарт становить 0,012 юаня за тисячу токенів і коштує 0,12 юаня вивести рукопис на тисячу знаків.

Незалежно від швидкості відновлення, комісія в розмірі 0,012 юаня за тисячу токенів здається дешевою, але генерація тексту часто вимагає кількох взаємодій для отримання бажаних результатів. Кілька взаємодій нескінченно збільшують приховану вартість. Зрештою, Wenxin Qianfan не є персонал, який приходить і йде.

Подібним сценарієм є спільнота запитань і відповідей. Сунь Куан (псевдонім), академік, сказав Photon Planet, що досвід використання модельних програм схожий на пошук високоякісних відповідей у спільноті запитань і відповідей. мислення користувача полягає в деталізації запитання, а готовність платити часто виявляється лише у високоякісних відповідях. ЯКІСНІ ВІДПОВІДІ будуть отримані після. Таким чином, Baidu вибрала кількість текстів висновків як стандарт оплати, але вона все ще не в змозі покрити приховані витрати комерційного використання.

Якщо прийняти щомісячний платіж, який любить бачити сторона B, це лише перенесе витрати з користувачів на вас, що, очевидно, не є довгостроковим рішенням. Найкращим доказом є те, що ChatGPT все ще підозрюють у зниженні ціни за ціною 20 доларів на місяць для кінцевих користувачів C.

Зараз при комерціалізації великих моделей загального призначення важко досягти балансу беззбитковості незалежно від того, чи це на стороні B, чи на стороні C. У той же час, ймовірно, виникнуть ризики відповідності, такі як етика ШІ та нагляд. Таким чином, індустріалізація та вертикалізація великих моделей стали зміною парадигми під попитом на посадку.

На відміну від великомасштабної промислової моделі, хоча її товарна форма починається з посадки попиту, проблеми, які виникають при фактичній посадці, все ще потребують вирішення.

Одним із типів випадків, про який варто згадати, є вертикальна модель C, створена на основі власної екології продукту, наприклад Zhihaitu AI, який Zhihu раніше оголосив про проведення внутрішнього тестування продукту, і Ctrip.com, який був випущений незабаром тому.

Переваги обох, що виходять на трасу великомасштабної моделі, однакові, вони полягають у їхній власній екології спільноти та високоякісному вмісті спільноти, який випливає з цього. Вміст, як галузеві дані, може стати навчальним корпусом великих моделей після простого очищення. Тонка різниця між ними полягає в тому, що Zhihu був контент-спільнотою з самого початку, тоді як Ctrip почав зосереджуватися на контенті лише в останні роки.

Але з нинішньої точки зору, будь то Zhihu чи Ctrip, форма продукту його великої моделі, здається, не здатна задовольнити проблеми користувачів, а також не може достатньо покращити існуючі функції.

Анонсований наразі продукт Zhihaitu AI «Hot List Summary» використовує штучний інтелект для отримання високоякісних запитань і відповідей, а також полірування та переписування резюме для представлення користувачам, тоді як інший додаток «Search Aggregation» збирає думки з власних відповідей, щоб покращити інформацію про залучення користувачів і оперативність у прийнятті рішень.

Функції агрегації, такі як саморекомендація та гарячий список, є «традиційними художніми навичками Zhihu», і продуктивність розширення можливостей великої моделі не викликала сплеску на рівні користувача. Крім того, процес переписування та шліфування ШІ також охоплює персоналізовані функції популярних відповідей.Для користувачів функція цієї програми полягає лише в швидкому розумінні інформації, що суперечить диференційованому та персоналізованому спілкуванню, яке підтримує спільнота контенту.

Згідно з OTA, Ctrip запитав, на думку Лян Цзяньчжана, голови ради директорів Ctrip, що це «надійна бібліотека відповідей» для індустрії туризму. Щоб перевірити ефективність його продуктів, знадобиться час, але з точки зору позиціонування його також підозрюють у «жертві основами та гонитві за останнім».

В очах молодих користувачів немає стандартної відповіді на туризм, про що свідчить поява різноманітних форм туризму, таких як «спецназ», «штампування» та «занурення». Наприклад, якщо припустити, що велика кількість користувачів використовує штучний інтелект для розробки планування маршруту подорожі, те саме планування маршруту фактично вплине на спілкування та атмосферу в громаді та навіть призведе до зменшення часу перебування користувачів.

Взагалі кажучи, спроба приземлення вертикальної моделі на кінці C не є гладкою і може навіть стати «безповоротними витратами». Можливо, під впливом міфу про «підвищення ефективності» самої великої моделі позиціонування продукту здебільшого обмежується словом «ефективність», але ефективність є лише неосновним виміром користувацького досвіду.

Та сама парадигма також була продемонстрована у сфері до B, а на стороні B, яка переслідує ефективність, бізнес-модель і проблеми впровадження великої моделі галузі були більш детально продемонстровані.

Незрозумілий чорний ящик

«Штучний інтелект — це не фізика. Є кілька серйозних технологічних проривів у теорії, але більше тонкого налаштування та невеликої оптимізації розмірів структури моделі та якості даних. У багатьох випадках результати моделі навіть кращі, але команда не може знайти причину».

На думку інсайдера галузі, існує величезне когнітивне упередження у великих моделях за межами галузі, і причина полягає в тому, що навчання великих моделей та індустрія штучного інтелекту є «чорним ящиком» для зовнішнього світу, і це важко досліджувати великі моделі Процес міркування, який дає результат, невидимий і невідчутний.

Це змусило зовнішній світ обережно поставитися до «чорної скриньки» великої моделі, коли вони заспокоїлися після періоду божевілля, викликаного ChatGPT. Це призведе до дилеми великої моделі на землі, і це явище стає більш очевидним у процесі переходу на маршрут В.

Візьмемо, наприклад, продукти великих виробників, які зараз чітко визначили шлях до B, зокрема технологічне рішення MaaS, запущене Tencent Cloud, і велику модель Pangu, запущену Huawei Cloud Хмарне розгортання, локалізоване швидке розгортання тощо. Також є досягнення у взаємодії, експлуатації та подальшому додаванні нових галузевих даних ітераційної оптимізації.Можна сказати, що заради посадки поріг для великих моделей було знижено до надзвичайно низького рівня.

Однак когнітивну стіну, створену «розсудливістю», не було зламано. Незважаючи на те, що ChatGPT дме вже півроку, багато компаній не мають мотивації чи інтересу вивчати, як імпортувати великі моделі.

Подібну логіку можна побачити в індустрії хмарних обчислень кілька років тому. Хмарні обчислення – це послуга та похідна технологія, яка базується на визнанні цінності даних.Що стосується цінності великих моделей для підприємств, можна сказати, що цінність даних різко зросла. Також не вистачає технічних можливостей корпоративним клієнтам.Навіть популяризація хмарних обчислень на вітчизняних підприємствах ще далека від кінця, не кажучи вже про велику модель.

Корисна галузева модель чи ні, насправді вже не важливо, зрештою, споживчу цінність продукту врешті-решт повинен відкрити користувач. Більше того, зовнішній світ буде приблизно вимірювати рівень моделі за допомогою певних тестів і продуктивності, таких як «метод білкової мандаринки» або Huawei Pangu, який нещодавно ставився під сумнів через помилки в прогнозуванні місця приземлення та інтенсивності випромінювання. супертайфун "Дусурі". Модель погоди.

Можливо, через це нещодавно випущена широкомасштабна модель Jingdong Lingxi вирішила віддати перевагу власним бізнес-сценаріям, і очікується, що вона буде відкрита для «зовнішніх серйозних бізнес-сценаріїв» на початку наступного року.

Що ще варто згадати, так це те, що під «галузевим трендом» так звана індустріальна модель, орієнтована на комерціалізацію, замінила оригінальний «універсальний» наратив великої моделі, і в той же час це призвело до того, що багато людей «втратили» ".

Визначення так званої промислової моделі розпливчасте. Значення великої моделі (основної моделі) полягає не в кількості параметрів, а в загальних можливостях, які випливають із загального навчання даних. Якщо буде прийнята та сама архітектура моделі, але дані одного домену використовуються для даних, не тільки буде втрачено загальну здатність, але навіть проблеми домену не можна буде вирішити через нові знижки.

Якщо галузеві дані використовуються для вторинного попереднього навчання на основі вихідної великої моделі, це еквівалентно тонкому налаштуванню вихідної моделі, тоді сам продукт все ще перебуває на рівні моделі, який можна назвати галузевою великою моделлю. ; якщо знання домену додаються через або зовнішню базу даних, це лише для того, щоб стимулювати можливості вихідної моделі, і продукт також має належати до прикладного рівня над моделлю. Буде перебільшенням називати це галузевою моделлю.

Зараз більшість великих промислових моделей на великих заводах є першими, такими як Tencent, Jingdong, Huawei тощо. Останній з’являтиметься більше в спільноті з відкритим кодом через менші інвестиції та швидке покращення продуктивності моделі, такої як ChatLaw, велика юридична модель, яка деякий час тому викликала бурхливі дискусії.

«Порівняно з першим, другий є більш зрілим з точки зору форми продукту, що сприяє швидкому створенню можливостей моделі, але останній часто має вищу верхню межу після завершення процесу прищеплення знань про предметну область», — сказав інсайдер галузі.

Загрози з відкритим кодом

Нещодавно Meta надала свою останню велику модель Llama2 з відкритим кодом безкоштовно за відкритою комерційною ліцензією та представила її на платформі Microsoft Azure.Цей крок був оцінений як важлива віха для LLM з відкритим кодом і навіть почав загрожувати статусу закритого коду провідний виробник OpenAI.

Через Microsoft, великого спонсора моделі, Meta кидає виклик OpenAI більш відкритою позицією.

Фактично, «фракція відкритого коду» тихо виросла як третя сторона задовго до цього. «У нас немає рову, як і OpenAI», — йдеться у внутрішньому документі Google, який випадково просочився в травні. Загальна ідея полягає в тому, що на поверхні OpenAI і Google наздоганяють один одного у великій моделі, але справжній переможець може вийти не від цих двох.Причина такого судження полягає в дедалі більшій багатстві відкритого вихідного коду.

Екологія відкритого коду стає дедалі активнішою, і навіть з’явилися Llama2, яка представляє можливості моделі, і LORA, репрезентативна технологія парадигми Finetune (тонка настройка моделі).Все це перетворило виробників-гігантів, які прагнуть «прагнути до чудес» відчувають явний холодок.

Такі фактори, як обмін технологіями з відкритим вихідним кодом і передача талантів, також роблять чорну скриньку великої моделі більш «склоподібною». час, легко скасовується спільнотою з відкритим кодом.

Більшість провідних вітчизняних виробників відповідають на це «хапанням обома руками». Ліва рука «закриває двері, щоб побудувати автомобіль», безперервно відшліфовує форму продукту та можливості у вигляді невеликого внутрішнього тестування, а права рука «мозковий штурм», будує спільноту з відкритим вихідним кодом в екології на основі хмари Екологія розробника, але для цього потрібен лише власний рівень обчислювальної потужності виробника та макет повного стека рівня моделі до рівня додатків. Alibaba Cloud запустила масштабну спільноту з відкритим кодом GPT, Huawei Cloud, Baidu Cloud і Tencent Cloud також планують.

Загалом, незалежно від того, чи це галузь чи GM, C чи B, піврічне випробування великої моделі дає нам пряме відчуття, що її важко реалізувати, а очікування прибутку постійно повертається назад; ризик зростає сильніше, і важко сказати технічний бар'єр. Тож де шлях до виходу з нинішньої ситуації?

Наразі є два цікавих напрямки. Одна — векторна база даних, відома як «Пам’ять в епоху штучного інтелекту», а інша — інтелектуальне обладнання, наділене інтелектом моделі.

Так званий вектор відноситься до багатовимірних даних, які можуть представляти будь-що, включаючи текст, зображення, відео та звуки, які сьогодні є найважливішими в навчанні LLM. Ці форми вмісту чітко представлені в базі даних і підтримують семантичний пошук, тобто пошук за подібністю, наприклад, чоловік проти хлопчика. Іншими словами, для великих моделей векторний пошук є пошуковою оптимізації великих моделей.

Як згадувалося вище, знання домену може покращити побудову та використання галузевих моделей за допомогою можливостей векторної бази даних, тонкого налаштування або плагінів.Для великих виробників це, природно, є фокусом наступного етапу. Починаючи з травня, капітал вливається в треки, пов’язані з векторними даними. Як продукт прикладного рівня з більш певною перспективою, векторні дані також привернули пильну увагу багатьох венчурних компаній.

Що стосується вбудованої моделі розумного обладнання, то це стрибок у можливостях порівняно з попередніми розумними помічниками, такими як «siri» та «Xiaoai», а також є розширенням справжніх розумних пристроїв (мобільних телефонів, комп’ютерів). У співтоваристві з відкритим кодом були спроби вбудувати моделі з великими параметрами в MAC, тоді як великі виробники накопичили певну кількість потужностей для виробництва апаратного забезпечення в минулу епоху мобільного Інтернету, і, умовно кажучи, їхня перевага першопрохідця більш очевидна. .

Без піар-стилю весняно-осіннього стилю письма масштабні моделі, які стали основними вимогами, більше не є таємничими, а історій стає все менше і менше. важко працювати. Галузі потрібен наступний момент «ChatGPT», перш ніж ми побачимо, як дайвери спливають на поверхню та зіткнуться з ними.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків