Мода на великі моделі: найсолодший торт і найважчий

2023-08-11 08:43:43

Автор 丨Бай Цзяцзя

Американський редактор 丨Рибалка

Джерело: Silicon-Based Research Lab

Примітка редактора:

Одна сторона фанатична, а інша холодна. Це поточний стан великомасштабної індустрії китайських моделей. Можливо, "Епоха хаосу" є найбільш підходящою назвою для цієї галузі. За останні шість місяців технології та люди, технології та промисловість, людська цивілізація та технічна цивілізація вступили в новий етап реконструкції. За цією зміною стоїть не лише розвиток технологій, а й просування ключових людей і ключових компаній.

Як передовий спостерігач ери розуму, «Офіс досліджень на основі кремнію» приділяє увагу всім історіям, пов’язаним з технологіями. Сьогодні ми запустимо план «Епоха хаосу великомасштабних моделей», починаючи з деконструкції великомасштабних моделей, і повертаючи об’єктив на передній план цих хвиль, компанії та люди, діляться та інтерпретують свої унікальні ідеї для читачів.

Ця стаття є другою запланованою статтею в цій серії: «Божевільне захоплення застосуванням великих моделей: найсолодший торт і найскладніший пас». Частина 1: Хаотичний вік великих моделей: протиріччя, диференціація та майбутнє

Джерело зображення: створено інструментом Unbounded AI

«Я бачив речі, у які ви, люди, ніколи не повірите. Я спостерігав, як горять військові кораблі на краю Оріона, і я спостерігав, як C-промені мерехтять у темряві біля воріт Таннгаузера. Усі ці моменти з часом минуть, як сльози, що зникають у дощ."

Це фінальний монолог у фільмі «Той, що біжить по лезу», виголошений реплікантом Роєм Бетті.

Пізніше цей рядок був обраний британським «Обозревателем» як шостий з десяти найкращих класичних моментів в історії кіно, і часто цитується як представник науково-фантастичних творів.

Певним чином цей уривок стає реальністю. Сьогодні масштабна модель, яка спричинила божевілля у світі, поглинає глобальні знання з неймовірною швидкістю. Потік людей, речей і речей, що стоять за цими персонажами, може бути не таким простим, як Starheap Wars.

А вчені, інженери та бізнесмени, які зробили все це, все ще чекають, можливо, вони не можуть сказати, чого вони хочуть чекати, більш складних технологічних досліджень? Більш ефективні засоби виробництва? Супердодаток з більшими грошима?

Або реплікант, як Рой Бетті, який полегшує майже відчайдушну самотність людей, які дивляться на галактику.

це приходить

що це приносить

Як це виникло?

Де воно вперше проросло?

Чим Китай відрізняється від інших країн?

……

З огляду на сьогоднішні нескінченні масштабні моделі, хвилюватися або чекати надто пізно. Для цього партнера, який буде з нами протягом тривалого часу в майбутньому, найкраща церемонія привітання — дивитися на нього.

Сторона C переходить на сторону B, відкрите джерело впливає на закрите джерело

Поява ChatGPT схожа на штучний інтелект, який постукає у ваші двері.

Він був опублікований 30 листопада 2022 року. Лише за два місяці ChatGPT успішно перевищив 100 мільйонів активних користувачів щомісяця, що зробило його найшвидше зростаючим споживчим додатком в історії.

На початку березня Codeway Dijital розробила Chat with Ask AI на основі ChatGPT API. Завдяки потужній функції запитань і відповідей її дохід у першому півріччі перевищив 16 мільйонів доларів США (близько 112 мільйонів юанів). став треком AI+Chatbot з найбільшим завантаженням і прибутком.

**Успіх ChatGPT, здається, свідчить про те, що бізнес-логіка додатків штучного інтелекту для кінцевих користувачів C налагоджена: передайте продукт користувачам, і вони досліджуватимуть безмежні можливості штучного інтелекту. У процесі також буде чудова крива доходу Тоді виринайте. **

На жаль, не все так просто.

4 липня компанія веб-аналітики Similarweb опублікувала дані, згідно з якими глобальні відвідування ChatGPT у червні впали на 9,7% у порівнянні з місяцем, а кількість унікальних відвідувачів впала на 5,7% у порівнянні з місяцем.

На додаток до ChatCPT, кількість відвідувань Character.AI також зазнала різкого падіння в червні, зі зниженням на 32% порівняно з попереднім місяцем.

Character.AI може імітувати особистості знаменитостей індустрії розваг, історичних діячів і вигаданих персонажів для розмов, займаючи друге місце серед усіх подібних інструментів ШІ.

З цього приводу аналітик Similarweb Девід Карр сказав: «Відтепер чат-боти повинні довести свою цінність і не сприймати все як належне».

** Певною мірою зниження кількості відвідувань ChatGPT і Character.AI символізує те, що додатки ШІ для кінцевих користувачів C поступово досягли верхньої межі, і це свідчить про те, що—**

**Користувачі не дуже зацікавлені в самостійному дослідженні можливостей штучного інтелекту. Глибока інтеграція штучного інтелекту зі сценаріями додатків і «поставити молоток поруч із цвяхом» є необхідними умовами для отримання великих моделей. **

Корпорація Майкрософт взяла на себе лідерство в тому, щоб стати «молотком».

Використовуючи технологію OpenAI, материнської компанії ChatGPT, Microsoft запустила Microsoft 365 Copilot і на щорічній конференції Inspire 18 липня запропонувала ціну в 30 доларів США на місяць для комерційних клієнтів.

Згідно з повідомленнями, Microsoft 365 Copilot може допомогти підприємствам обґрунтувати всі бізнес-дані, зокрема генерувати останню інформацію з ранкових зустрічей, електронних листів і записів чату та надсилати їх команді; допомагаючи користувачам зрозуміти хід проектів минулого тижня; або з внутрішніх даних. файли та мережі Створіть SWOT-аналіз даних.

**Об’єднавши власні сценарії, Microsoft вийшла на більш надійний шлях монетизації, і це також модель багатьох великих компаній, які сьогодні тестують водний штучний інтелект. Весь процес є замкнутим циклом, і дані та моделі передаються лише між гігантами . **

Це ніби найдосконаліша технологія виробництва роботів у «Тому, що біжить по лезу» твердо контролюється корпорацією Тейлор.

Однак реальні події часто є драматичнішими, ніж фільми. Нещодавно компанія Meta, також інтернет-гігант, анонсувала базову модель Llama2 з відкритим кодом, яка розповсюджується Microsoft Cloud і доступна для безкоштовного комерційного використання підприємствами, зробивши перший постріл " антитехнологічна монополія».

Судячи з результатів оцінки, Llama2 все ще має певний відрив від GPT-4 і має свої переваги та недоліки з GPT-3.5.Наразі це найкраща модель з відкритим кодом на ринку.

Але що саме це означає?

Взявши за приклад поділ великих рівнів моделей Huawei, їх можна розділити на базові великі моделі (імітують людські функції, такі як мова та зір), великі промислові моделі (відповідно до галузевих підрозділів, функції кількох базових великих моделей можуть бути скоординовані) і моделі сценаріїв (що відповідають конкретним сценаріям у галузі, таким як помічники торгових точок, логістика ланцюга постачання та оптимізація малих молекул).

Llama2 з відкритим кодом Meta — це велика мовна модель у базовій великій моделі. Для навчання моделі не потрібна велика кількість даних, а лише великий корпус. Завдяки тонкому налаштуванню підприємці великомасштабної моделі можуть розробляти програми ШІ, які підходять для відповідних галузей або сценаріїв.

Подібно до того, як система Android підтримує екосистему мобільного Інтернету мобільних телефонів сторонніх виробників, Llama2 мінімізує витрати на розробку великомасштабних моделей для підприємств, щоб вони могли більше зосередитися на власних промислових сценаріях.

«Камера Miaoya», яка нещодавно раптово вибухнула в Китаї, є бенефіціаром відкритого коду.

Stable Diffusion (SD) — один із найпопулярніших інструментів малювання ШІ на даний момент. Це безкоштовний проект із відкритим вихідним кодом, який може розгортати та використовувати будь-хто безкоштовно. Згідно з ринковими прогнозами, принцип «Miaoya Camera» полягає у вирішенні проблеми випадковості виведення SD-зображень за допомогою плагіна моделі LoRA.

LoRA – це фактично безкоштовна та відкрита для громадськості технологія точного налаштування моделі. 25 липня Alibaba Cloud запустила план навчання та розгортання повної серії версій Llama2 у Китаї, включаючи тонке налаштування LoRA.

Від ChatGPT, який безпосередньо стикається зі споживачами C-end, до поєднання Microsoft великими моделями з власними сценаріями та їх подальшого поширення споживачам або підприємствам, а потім до Meta Llama2 з відкритим вихідним кодом, що надає основні великі моделі та послуги тонкого налаштування для підприємств, ** численні шляхи для просування великого масштабу. За розміщенням моделі стоять гравці великої моделі, які намагаються якнайшвидше відкрити замкнутий цикл бізнесу, і розгляд вилучення коштів для підтримки технологічної ітерації також є довгостроковим інвестиції в створення індустріальної екології штучного інтелекту та змагання за право слова. **

Варто зазначити, що хоча в статті використовуються як приклади Microsoft, OpenAI і Meta, це не означає, що вони обмежені відповідними шляхами.Насправді, завдяки підтримці технологій і коштів, провідні компанії мають сили для розгортання кількох шляхів, і це також робило бойову обстановку тривожнішою.

Наприклад, згідно зі статтею, опублікованою The Information 24 липня, широкомасштабна мовна модель з відкритим кодом, яку розробляє OpenAI, наразі має кодову назву G3PO, а розклад випуску ще не визначено внутрішньо.

Цікаво, що хоча Цукерберг заявив у Facebook, що «відкритий код сприяє інноваціям, оскільки він дозволяє більшій кількості розробників використовувати нові технології... Я вважаю, що якщо екосистема більш відкрита, буде досягнуто більше прогресу», але під час телефонної конференції через кілька днів він запропонував стягувати частину доходу від перепродажу послуг великим хмарним компаніям, таким як Microsoft, Amazon і Google.

Дані можуть стати найсильнішим ровом для китайських компаній

Дай Юсен, керуючий партнер ZhenFund, має геніальну аналогію для цього раунду великомасштабного модельного підприємництва: поява GPT-3 еквівалентна відкриттю нового континенту, а ChatGPT-4 схожа на відкриття золота на новому континенті.

Наздоганяюча подорож китайської компанії схожа на те, щоб знати Новий Світ і де знаходиться золото, і знати, що OpenAI пливе на човні, і знати загальний вигляд човна, але без детальної карти.

Тому для китайських гравців великомасштабних моделей пошук берегових припасів під час цього довгого плавання є питанням життя і смерті.

Стиковка полягає в тому, щоб знайти місце посадки для великої моделі та сформувати стійку бізнес-модель.

Незаперечним є те, що все ще існує певний розрив між вітчизняними чіпами штучного інтелекту та стандартами світового рівня.Обмежені санкціями щодо чіпів, китайським компаніям важко розширити масштаби обчислювальної потужності.

Крім того, з боку алгоритмів, включаючи різні великі моделі, такі як обробка природної мови, комп’ютерне бачення, аудіо та мультимодальність, Китай має певні переваги, але сам алгоритм і обчислювальна потужність доповнюють один одного, тому він також тимчасово в така ж позиція, як OpenAI та інші лідери галузі.

У цій поточній ситуації вітчизняні підприємства повинні наполегливо працювати над даними, якщо вони хочуть не відстати від цієї хвилі ШІ.

**Іншими словами, одна з основних перешкод для китайських гравців великомасштабної моделі в цьому раунді конкуренції базується на даних, сформованих на китайському ринку. **

У процесі розробки великої моделі дані є вирішальним фактором, а якість і масштаб даних безпосередньо впливають на вартість розробки та ефект кінцевого представлення моделі.

Однак високоякісні дані часто містять велику кількість корпоративних секретів, які заборонено навіть вивантажувати в зовнішні мережі, не кажучи вже про передачу іншим компаніям для масштабної розробки моделі.

У березні цього року корейський «економіст» повідомив, що було три випадки неправильного використання та зловживання ChatGPT у Samsung, у результаті чого дані вимірювань напівпровідникового обладнання, вихід продукту та інший вміст зберігалися в навчальній базі даних ChatGPT, що спричинило великі збитки компанії.

Саме через ризик витоку інформації та високу ціну довіри між підприємствами іноземні компанії, що займаються моделюванням великого масштабу, часто починають збільшувати масштаб великомасштабних моделей, створювати промислову екологію, а потім розробляти програми.

Певною мірою «Лист про добровільні зобов’язання», нещодавно підписаний такими компаніями, як Microsoft, OpenAI та Amazon у Білому домі, є не лише відповіддю на соціальні занепокоєння, викликані стрімким розвитком штучного інтелекту, але й сигналом для ринку. , сподіваючись отримати більше громадських організацій та довіри бізнесу.

** У Китаї, під керівництвом національної влади, державні підприємства та органи місцевого самоврядування відносно відкриті для великомасштабних моделей, і застосування, екологія та будівництво моделей розвиваються одночасно. **

Наприклад, великомасштабна модель Pangea від Huawei приземлилася в сучасному великомасштабному поперечному стволі «Вугільна шахта Лілоу» з найбільшими запасами видобутку та найдовшим терміном служби шахти в провінції Шаньдун.

У жовтні 2022 року Huawei підписала договір про співпрацю з Yunding Technology, дочірньою компанією Shanneng Group, щодо повного запуску шахт, штучного інтелекту, ІКТ-інфраструктури, розумних парків, навчання талантів, розумних носіїв, терміналів для майнінгу та ІКТ-рішень для галузевих сценаріїв. співробітництво.

З тих пір експерти з обох сторін пішли глибоко на передову лінію шахти та глибоко брали участь у застосуванні великомасштабних моделей.У фактичному виробництві 21 майор у 9 дисциплінах, включаючи видобуток вугілля, розкопки, основний транспорт, допоміжний транспорт, підйом, нагляд за безпекою, анти-зачищення, промивання та коксування були розкопані.Сценарії застосування, постійне оновлення моделі, і офіційно випущена перша велика модель штучного інтелекту в галузі видобутку корисних копалин 18 липня цього року.

Зрозуміло, що однією з функцій великої моделі Pangu є допомога відділу захисту від забруднень у стандартній перевірці проектів захисту від забруднень і скидання тиску, що може зменшити робоче навантаження на перевірку вручну на 82% і досягти 100 % прийнятності проектів проти замивання.

Подібні історії також траплялися з такими компаніями, як Baidu та HKUST Xunfei.

27 червня цього року Пекін оприлюднив першу партію з 10 типових випадків застосування моделей великої промисловості, більшість з яких є «важкими» сферами, такими як міське управління, розумне фінансування, охорона здоров’я та промислова модернізація.

Сюди входить «Помічник з перевірки роботи обладнання, оснащений великою моделлю Power Industry NLP Large Model», спільно розроблений Baidu та дослідницьким підрозділом State Grid Smart Grid, який може покращити показники F1 професійної сегментації електроенергії та розпізнавання чутливих об’єктів маркетингу електроенергії. 9,27% і 13,28%, досягаючи 92,376% і 94,947%;

«Велика модель міського мозку», спільно розроблена iFLYTEK і Zhongguancun Science City City Brain, вирішує такі проблеми, як обмежений доступ і застосування ресурсів даних міського управління, слабка здатність узагальнення моделей послуг міського управління та інформаційна безпека в епоху штучного інтелекту.

**Таким чином китайські компанії пішли на унікальний шлях — від промислових великих моделей до загальних великих моделей, а потім подивилися, яка технологія великомасштабних моделей потрібна для широкомасштабного впровадження програм. **

**І цей процес також узгоджується із загальним консенсусом галузі щодо виробництва високоякісних даних — знизити поріг, популяризуючи ШІ, і водночас запровадити ШІ в галузі, а потім накопичувати та збирати більше високоякісних даних, і, нарешті, проштовхніть модель вперед Швидко ітеруйте. **

Причина, чому вітчизняні сценарії застосування великомасштабних моделей відрізняються від сценаріїв за кордоном, по суті, полягає в тому, що в умовах, коли обчислювальна потужність і алгоритми не домінують, країна та підприємства формують спільну силу для прискорення розробки «дані-модель-дані». " маховик.

**І те, що дійсно визначає майбутній напрямок під час цього раунду стикування, це те, чи можна побудувати в Китаї ринок даних високої якості, ліквідності та безпеки. **

Кілька днів тому Китайська асоціація стандартів зв’язку та Китайська академія інформаційно-комунікаційних технологій опублікували «Звіт про дослідження розвитку баз даних (2023)». У звіті зазначено, що розмір світового ринку баз даних у 2022 році становитиме 83,3 мільярда доларів США, і розмір китайського ринку баз даних становитиме 5,97 мільярдів доларів США (близько 40,36 мільярдів доларів США) мільярдів юанів, що становить 7,2% світового ринку.

Очікується, що до 2027 року загальний розмір китайського ринку баз даних досягне 128,68 мільярдів юанів, а річний темп зростання ринку (CAGR) складе 26,1%.

Де найсолодший торт?

Підводячи підсумок, можна сказати, що у великому модельному треку в цілому можна виділити дві тенденції.

**Одна з них полягає в тому, що провідні компанії переходять від додатків на стороні C до сторони B. Деякі гравці вирішують інтегрувати власні ресурси та створити повноцінну систему обслуговування від бази даних до промислових додатків. Інша частина обирає створення великої Платформа масштабної моделі для інтеграції з малими та середніми підприємствами Сформуйте спільну силу для нападу на провідних гравців. **

**По-друге, закордонні компанії першими впроваджують масштабні моделі у власні сценарії, а вітчизняні компанії глибоко інтегровані з реальними галузями промисловості, щоб сформувати маховик даних. **

Між припливом і відпливом поступово спливав «найсолодший шматок пирога» на прикладному рівні індустрії AI.

** Судячи з поточної ситуації, мовні великомасштабні моделі та візуальні великомасштабні моделі є найбільш чіткими шляхами комерціалізації та найбільш концентрованими великомасштабними моделями на ринку. **На додаток до додатків для споживачів, таких як ChatGPT і Miaoya Camera, він також досягає стабільного прогресу в таких сферах, як офіс для спільної роботи, редагування зображень і інтелектуальне обслуговування клієнтів.

Однак ступінь однорідності таких додатків є відносно високим. Якщо технологія не буде настільки провідною, як OpenAI, ефект не буде суттєво іншим. Більше того, навіть OpenAI потребує постійного впровадження нових функцій, щоб утримувати клієнтів.

20 і 21 липня ChatGPT збільшив кількість повідомлень, які можна надсилати через GPT-4, і запустив функцію спеціальних команд.

Навпаки, багатокористувацькі онлайн-ігри (MMO) мають вищі галузеві бар’єри, також засновані на можливостях створення графіки. Функція глибокого навчання штучного інтелекту відповідає багатогранним характеристикам гри та відіграє провідну роль у поточному процесі розробки ігрових технологій, надаючи гравцям більш інтелектуальний, насичений та персоналізований ігровий досвід.

На тлі стабільного розподілу номерів версій ігор, ігрова індустрія, як очікується, стане найсолодшим шматком пирога в короткостроковій перспективі для масштабних модельних додатків.

**У довгостроковій перспективі велика модель є, по суті, інструментом для підвищення якості та ефективності галузі. Готовність клієнтів купувати послуги чи продукти безпосередньо пов’язана з перевагами, які може отримати велика модель. Тому, щоб знайти найбільш творчі сценарії застосування в майбутньому, ключовими показниками, які необхідно дослідити, є масштаб самої галузі та висота рову. **

«Офіс досліджень на базі кремнію» вважає, що транспортні засоби з новою енергією є найбільш творчим полем для майбутніх великомасштабних моделей.

З точки зору перспектив розвитку, нові транспортні засоби на енергії відповідають глобальній тенденції споживання «з низьким вмістом вуглецю та екологічності», що сприяє зменшенню споживання енергії в нафтохімічній промисловості.

Наприклад, у червні 2022 року міністри навколишнього середовища 27 країн ЄС досягли згоди щодо нового законодавства про захист клімату.З 2035 року в ЄС дозволять їздити на дорогах лише автомобілі з нульовим рівнем викидів вуглекислого газу.

З точки зору лише зменшення викидів CO2, великі моделі можуть знайти свій шлях.

На додаток до водіння, весь ланцюг автомобільної промисловості також є основним викидом вуглецю, а виплавка металевої сировини, транснаціональне транспортування, виробництво та інші ланки є основними напрямками скорочення викидів вуглецю. Однак через складний промисловий ланцюг, тривіальні дані та широкі сценарії застосування автомобільним компаніям важко збирати й оцінювати вуглецевий слід усього життєвого циклу автомобілів.

З інтелектуалізацією ланцюга автомобільної промисловості різні дані передаються в хмару, і поступово стає можливим визначити чіткий шлях скорочення викидів вуглецю. У цьому процесі очікується, що маховиком даних великої моделі стане " п'ятий" автомобіля. "колесо", щоб зруйнувати бар'єри даних між ланками та сформувати інтелектуальний шлях у промисловому ланцюзі.

** З іншого боку, поєднання великих моделей і транспортних засобів з новою енергією є безпрограшним шляхом. **

Висока вартість логічних висновків для великих моделей є причиною, чому багато підприємств відмовляються від цього. З розвитком технологій великі моделі випускаються з хмари в продукти, а сама машина також може виконувати певну міру завдань на основі вбудованого чіпа та передавати результати в хмару. Для власників автомобілів це означає, що транспортні засоби з новою енергією все ще зберігатимуть певний рівень «розумності» без підключення до Інтернету, що є бонусом для досвіду користувача.

**Однак ще потрібно подолати кілька труднощів, перш ніж велика модель зможе по-справжньому розширити можливості індустрії нових енергетичних автомобілів. **

Наприклад, проблеми зі зберіганням даних.

Ще в 2017 році в Китаї пройшла хвиля промислового буму великих даних, типовим сценарієм якого було раннє попередження та обслуговування ключового обладнання. З точки зору непрофесіонала, це передбачити, коли обладнання може вимкнутися за допомогою даних, отриманих від датчика, і підказати, яке обладнання слід замінити.

Однак після фактичного впровадження було виявлено, що для формування повної моделі даних потрібні принаймні 2-3 цикли даних, а лише вартість зберігання досягає десятків мільйонів, що є надто ризикованим для підприємств.

І це актуально й сьогодні, тому що дослідження та розробка великих моделей і подальші ітерації також вимагають масивних даних як підтримки, тому сучасні автомобільні компанії більш схильні спочатку створювати платформи, об’єднувати дані та бізнес, а потім використовувати великі моделі для створення деяких підходить.

**По-друге, порівняно з генеративними великими моделями промислова сфера приділяє більше уваги стабільності. **

Щоб навести простий приклад, ми використовуємо ChatGPT для написання віршів, очікуючи, що це буде творчо, кожен твір відрізняється, але в промисловій сфері, якщо кожна інструкція відрізняється, це спричинить великі проблеми.

Таким чином, поглиблена інтеграція великих моделей і виробничих ліній має бути подібною до написання кодів для створення промислових інструкцій або пропозиції оптимізаційних рішень для конкретних ланок, і неможливо реально втрутитися у виробництво.

Як говориться, благословення приходять від нещасть, а нещастя приходить від благословень. Дві труднощі для великомасштабних моделей увійти в індустрію нових енергетичних транспортних засобів насправді є ровами для компаній, які досягнуть успіхів у цій галузі в майбутньому. постійний розвиток технологій зберігання даних і поява нових цифрових фабрик, таких як «фабрики чорного світла», опір підключенню великих моделей до нової енергетичної галузі також зменшується.

У деяких більш передових галузях вони почали проводити хімічні реакції.

В даний час впровадження великомасштабних моделей у сфері транспортних засобів з новою енергією в основному зосереджено на автономному водінні. Baidu, Tesla, Huawei та Google розгорнули. Демонстраційний майданчик на дорозі.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.