модель, круто

Джерело зображення: створено Unbounded AI

Після більш ніж 200 днів великомасштабного підприємництва менталітет китайських дослідників змінився з ідеального захоплення на реальність.

До цього, окрім самої компанії, підприємницька модель штучного інтелекту наділялася іншими значеннями, такими як національні почуття та тенденція часу.Зіткнувшись із появою моделі загального призначення ChatGPT, китайські підприємці швидко досягли консенсусу щодо створення китайської версії OpenAI та ChatGPT.

Без сумніву, ChatGPT є найкращим гравцем у світі цього року. Завдяки цьому трафік веб-сайту OpenAI у квітні перевищив 1,8 мільярда, увійшовши до топ-20 у світовому рейтингу трафіку. Однак, згідно з даними, опублікованими компанією веб-аналітики Similarweb, після шести місяців стрімкого зростання відвідування ChatGPT вперше зазнало негативного зростання, а відвідування в червні впали на 9,7% порівняно з попереднім місяцем.

Раптове падіння трафіку ChatGPT спровокувало занепокоєння та дискусії у світовій технологічній спільноті щодо ризику бульбашки в індустрії штучного інтелекту. Журнал Economist навіть зробив висновок, що «шлях до більшого та кращого штучного інтелекту більше неможливий». Ідея стати «китайською версією ChatGPT» також віддаляється від китайського підприємницького кола.

Чжу Сяоху, партнер-засновник GSR, написав у Moments: «Не будьте забобонними щодо загальної моделі, тому що наступного року GPT-3.5 стане товаром (загальна інфраструктура), а через три роки також стане GPT-4. Для більшості підприємців сцена є пріоритетом, а дані — королем!»

Водночас зі зміною менталітету практиків великий підприємницький ринок почав розділятися.

Китайські компанії, що займаються великими моделями, більше не одержимі ідеалізованою метою «стати OpenAI Китаю», а також не одержимі пошуком параметричних моделей і обчислювальної потужності.Вони мають більш прагматичні відповіді та приділяють більше уваги вирішенню проблем у реальних промислових сценаріях.

Конкуренція великих моделей штучного інтелекту започаткувала новий трековий вузол.

Колективний прагматизм

На початку цього року Лян Цзяньчжан, засновник і голова ради директорів Ctrip, почав зв’язуватися з ChatGPT. Останніми роками він був активним в академічних і ділових колах як демограф, але він також був найпершим і наймолодшим програмістом у Китаї та майже став доктором філософії зі штучного інтелекту.

У віці 13 років Лян Цзяньчжан розробив програму для написання метричних віршів і отримав національну нагороду. У віці 15 років він був прийнятий до молодшого класу Університету Фудань. Після закінчення школи він поїхав до Сполучених Штатів на навчання та отримав ступінь магістра інформатики в Технологічному інституті Джорджії у віці 21 року. У віці 22 років Лян Цзяньчжан, який навчався на доктора філософії, раптом усвідомив обмеженість теоретичних знань і вирішив відмовитися від доктора філософії, щоб приєднатися до Oracle у Сполучених Штатах.

Поява ChatGPT змусила Лян Цзяньчжана порадувати, що він не продовжив навчання на докторську ступінь зі штучного інтелекту, тому що «Всі ці алгоритми обробки природної мови були повністю переможені ним (ChatGPT)». Він згадав, що коли він вперше зіткнувся з ChatGPT, він був «дуже, дуже шокований», а другим почуттям було смирення: «Найрозумніший алгоритм, який ми нарешті створили, був настільки близький до біологічної структури людського мозку».

Лян Цзяньчжан почав думати про поєднання великої моделі ШІ та бізнесу Ctrip.

На думку Лян Цзяньчжана, на тлі інтелектуального суспільства туризм, як «галузь духовного попиту, яку важко автоматизувати», попит на нього зростатиме разом із покращенням загального соціального достатку, а його частка в економіці також зростатиме. Він зупинився на вертикальній моделі індустрії туризму.

За останні шість місяців представники різних компаній Ctrip сформували технічну групу великомасштабних моделей Ctrip. На початковому етапі розробки великої моделі Ctrip відкоригував свою організаційну структуру відповідно до стратегічних вимог великої моделі та сформував різні відділи, включаючи загальну технічну групу, групу стратегії контенту, команду списку тощо, і адаптував технічну команду відповідно до постійного оновлення та ітерації продуктів великої моделі.

Лян Цзяньчжан сказав, що Ctrip докладе всіх зусиль, щоб інвестувати у велику модель: «Ми повинні інвестувати дуже серйозно в довгостроковій перспективі, якщо це цінно для наших клієнтів або торговців. Ця (велика модель) дуже нова, і технічна команда постійно оптимізує суму своїх інвестицій, але у нас немає обмежень».

У середині липня Ctrip офіційно випустив велику вертикальну модель індустрії туризму. Asked відібрав 20 мільярдів неструктурованих туристичних даних у поєднанні з існуючими структурованими даними Ctrip у реальному часі, історично навченими роботами та пошуковими алгоритмами Ctrip, а також провів власно розроблене навчання вертикальної моделі. «У той же час ми інвестували багато робочої сили у створення та перевірку загального вмісту відповідей на подорожі», — підкреслив Лян Цзяньчжан.

Перед тим, як опублікувати запитання, Ctrip провела внутрішнє тестування, і співробітники служби підтримки клієнтів Wang Yun, очевидно, відчули, що її робота зазнала великих змін. У минулому їй доводилося відповідати на понад 150 дзвінків на день, щоб відповідати на запитання клієнтів про скасування післяпродажних замовлень і втрату багажу; тепер Ван Юнь перетворилася на рекомендувач служби підтримки клієнтів перед поїздкою та заходить у кімнату для прямих трансляцій із-за лаштунків, щоб надати користувачам мережі послуги та пропозиції, які потрібно підготувати перед поїздкою.

На думку Лян Цзяньчжана, на основі широкомасштабної моделі загального призначення вирішення проблеми точності в індустрії туризму все ще є ключовим: "Подорожі – це індустрія, яка потребує великого споживання. Навіть якщо планування заощаджує півгодини, може бути 5% ймовірність того, що рекомендований готель або результат маршруту буде неправильним". Тому, порівняно з широкомасштабною моделлю загального призначення, як-от ChatGPT, Лян Цзяньчжан платить більше увагу на можливість вертикальної великомасштабної моделі.

Хоча вона не така хороша, як загальна велика модель з точки зору параметрів, і вона не має жорстких вимог до обчислювальної потужності та інших умов загальної великої моделі, але вертикальна велика модель висуває вищі вимоги до даних і сценаріїв.

Найбільша проблема під час навчання широкомасштабної моделі Ask полягає в тому, що на реальній сцені, у процесі отримання користувачами інформації про подорожі, багаторазових раундів інтерактивного збору та очищення даних, обсяг даних і точність даних потрібно постійно коригувати, особливо індустрія туризму зазнала величезних змін, а інформація про пункт призначення три роки тому може бути повністю застарілою, особливо вплив епідемії на світову індустрію туризму погіршив своєчасність даних.

Як і Ctrip, все більше компаній розміщують трек великих моделей у вертикальному полі.

Лист відповідей на великомасштабну модель Yanxi, переданий JD.com, також розглядає промислову великомасштабну модель як важливу особливість. За словами Сюй Рана, нового генерального директора Jingdong Group, розвиток технології штучного інтелекту в минулому кілька разів був на межі вибуху застосування, але врешті-решт він часто був недовгим, і однією з важливих причин є те, що технологія не знайшла надійного застосування в галузі**.

На прес-конференції Huawei Pangu Large Model 3.0 7 липня Чжан Пінган, генеральний директор Huawei Cloud, навіть прямо сказав: «У Pangu Large Model немає часу писати вірші та спілкуватися. Незалежно від того, скільки параметрів і наскільки гарна здатність до діалогу, якщо вона не зможе вирішити практичні проблеми, вона не принесе великої користі».

Tencent ще не оголосила про прогрес загальної великомасштабної моделі Hunyuan, але вона оголосила про маршрут великомасштабної моделі промисловості в гучній манері, викидаючи більше 50 рішень для 10 основних галузей промисловості одночасно. Лі Цян, віце-президент Tencent і президент відділу урядових і корпоративних компаній Tencent, також сказав: «Загальні великі моделі — не єдиний напрямок застосування моделей, і моделі для вертикальних галузей стануть переломним моментом цінності великих моделей».

Зміна мислення

Очевидний вузол у зміні менталітету великих підприємців почався, коли у Ван Хуйвеня діагностували депресію, і його придбав Meituan за світлові роки від його заснування. Всі раптом зрозуміли, що навіть та зіркова компанія, на яку всі чекали і покладали великі надії, може бути змушена припинити роботу через різні аварії.

Всього півроку тому інші торгові точки, здавалося, розвіялися за одну ніч, і лише велика модель була в позиції С. Підприємці та інвестори в технологічних колах Китаю летіли до Силіконової долини, щоб вчитися в OpenAI. Чжан Імін, Ма Хуатен і Ван Сін, особи № 1 або центральні особи, які приймають рішення в цих гігантах, раптово повернулися до стану хвилювання та цікавості, коли вони тільки починали свій бізнес, читаючи газети та обмінюючись технологіями пізно ввечері.

Тоді здавалося, що кожен дослідник китайських великомасштабних моделей думав про проблеми з почуттями родини та країни. Зіштовхнувшись зі швидким розвитком ChatGPT, китайські підприємці ставлять перед собою мету: як досягти обгону за який час.

Лі Яньхун сказав: «Baidu Wenxinyiyan перебував на стадії дослідження та розробки, і технічна команда Baidu провела порівняльний тест із ChatGPT. На той час розрив становив 40 балів, і він міг наздогнати за місяць.» Ван Сяочуань також сказав, що він створить найкращу велику мовну модель у Китаї до кінця року.

Чжоу Хонджі, засновник 360, заявив в інтерв'ю "Китайського підприємця", що великі моделі вже не є виміром комерційної конкуренції. Якщо закритості китайського Інтернету та проблема острова даних між програмами, спричиненими мобільним Інтернетом, не вирішується, це, ймовірно, призведе до обмежень підготовки штучної розвідки та підготовки двигуна.

Щодо того, чому жодна така компанія, як OpenAI, не народилася в Китаї, китайські підприємці навіть почали міркувати в той час.У минулому вітчизняні дослідження штучного інтелекту були надто прагматичними, і все було орієнтовано на KPI, тому не всім вистачило рішучості та терпіння інвестувати в це, тому вони пропустили такий важливий вузол.

З пристрастю, після того як Baidu Wenxin зробив перший постріл, більше 80 великих моделей штучного інтелекту з’явилося протягом півроку, і понад 30 великих моделей з’явилися на Всесвітній конференції зі штучного інтелекту 2023 року, що проходила тільки в Шанхаї. Не буде перебільшенням описати популярність великих моделей як «війну ста моделей».

Але чи дійсно нам потрібна така кількість великих моделей? Яка велика модель нам потрібна?

Фактично, Робін Лі дуже рано запропонував: «Стартапам немає особливого сенсу відтворювати ChatGPT. Я вважаю, що є чудова можливість розробляти програми на основі цієї великої мовної моделі. Немає потреби винаходити колесо. Після того, як колесо стане доступним, цінність виробництва автомобілів і літаків може бути більшою, ніж колесо».

Хе Сяодун, віце-президент із технологій у JD Group, також з самого початку усвідомлював: «Якщо велика модель має бути цінною, її потрібно розмістити в галузі, і найкраще бути в галузі з високою промисловою цінністю. Тільки так вона може справді стати довгостроковою стійкою річчю, інакше вона може стати короткочасною річчю».

НОВА ЗМІННА

Саме тоді, коли вітчизняні підприємці намагалися дослідити модель штучного інтелекту, великий крок Цукерберга привніс нові змінні в цю мінливу сферу.

Рано ввечері 19 липня за пекінським часом Meta випустила велику модель Llama 2 з відкритим вихідним кодом, яка знову підірвала коло ШІ: Llama 2 не тільки має таку саму продуктивність, як GPT-3, але також є безкоштовною, з відкритим вихідним кодом і комерційно доступною. Llama 2 є продовженням моделі Llama, випущеної Meta на початку березня цього року.

На наступній партнерській конференції Microsoft Inspire генеральний директор Microsoft Сатья Наделла оголосив про співпрацю між Meta та Microsoft, яка дозволяє запускати Llama 2 у хмарному сервісі Microsoft Azure. Водночас хмара Amazon AWS також приєдналася до співпраці з Meta.

Значення Llama 2 для підприємців великомасштабних моделей полягає в тому, що так само, як система Android для розробки APP, розробникам не потрібно винаходити колесо, а безпосередньо отримувати інфраструктуру великомасштабних моделей за найнижчою ціною, щоб вони могли більше зосередитися на власних промислових сценаріях.

Певною мірою це також означає, що для більшості підприємців вибір зосередитися на галузевих вертикальних додатках виявився більш практичним шляхом.

Однак, на відміну від звичайних великих моделей, **великі промислові моделі також висувають інші порогові значення та вимоги до учасників галузі:**З одного боку, великі промислові моделі вимагають від розробників певного технічного накопичення та сили; з іншого боку, великі промислові моделі також вимагають від операторів мати різноманітні сценарії практичного застосування в промисловості.

Лян Цзяньчжан сказав виданню «Chinese Entrepreneur»: «Найважливішим показником загальної великої моделі може бути кількість параметрів або кількість графічних процесорів тощо, але вертикальна велика модель і велика мовна модель є лише однією її частиною. Вона також має комбінацію з іншими даними, включаючи ручну перевірку тощо. Вони важливіші. Зрештою, це вказує на те, чи можливо перевірити ефективність, точність і надійність цих запитань і відповідей від клієнтів можна покращити».

«Найбільша проблема в туризмі — це надійність. Це справді складніше, ніж ШІ писати вірші, статті та романи. Це також довготривала робота. Усе, що може підвищити це до 80%, 90%, 95% або навіть 99%, варто робити», — сказав нарешті Лян Цзяньчжан.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити