Подібно до конференцій, пов’язаних зі штучним інтелектом (ШІ) протягом кількох попередніх тижнів, на Форумі саміту зі штучного інтелекту Global Digital Economy Conference 2023 підприємці та науковці обговорювали вплив великомасштабних моделей і генеративних технологій ШІ на суспільство та промисловість.
«Останні кілька місяців усі обговорювали, коли OpenAI і Китай зможуть створити власні великомасштабні моделі. За останні кілька місяців масштабні моделі з’явилися одна за одною. Я бачу, що багато інвесторів починають Чжоу Хуні, голова 360, сказав у своїй промові на форумі. Він сказав, що реальні можливості для великомасштабних моделей є в Китаї, особливо на ринку корпоративного рівня, включаючи уряди та міста, а також великі китайські компанії. масштабна модель повинна скористатися можливістю промислового розвитку Інтернету.
Тан Веньбінь, співзасновник Megvii Technology, Чжан Пен, генеральний директор Zhipu AI, Чжоу Бовен, засновник Lianyuan Technology і професор кафедри Huiyan Університету Цінхуа, та інші гості також погодилися з цією думкою.Вони загалом вважали, що великі моделі не повинні Багато грошей витрачається на загальні великомасштабні моделі із сотнями мільярдів параметрів, такі як ChatGPT. Натомість необхідно створювати великомасштабні промислові моделі з індустрією мільярдного рівня, заглиблюватись у галузь To B рішення та розв’язувати практичні задачі у вертикальних полях.
Насправді, оскільки ChatGPT спричинив сплеск інвестицій і промислового розвитку великих моделей штучного інтелекту в Китаї, компанії наслідували ChatGPT і прагнули стати «китайською версією OpenAI».Тепер понад 80 великих моделей пройшли публічні випробування.
**Але проблема полягає в тому, що багато інвесторів і підприємців виявили, що технічний поріг великомасштабних моделей не є високим після семи місяців «розгортання». Комерційні рішення, тоді як членська служба ChatGPT «20 доларів на місяць» Plus може стати лише «безкоштовною». » у Китаї, і безперервні інвестиції в технологію штучного інтелекту OpenAI неможливі в Китаї. **
**Зрештою було виявлено, що платити за «велику модель» можуть лише клієнти в кількох вертикальних галузях, таких як урядові справи, фінанси та медичне обслуговування. **
Додаток Titanium Media редагує та публікує останню інформацію про вітчизняні дані широкомасштабних моделей ШІ
Підприємства більше не конкурують із технологією великомасштабних моделей ШІ, а повертаються до комерціалізації
Приблизно за останні шість місяців технології великомасштабних моделей, представлені ChatGPT і GPT-4, очолили новий виток глобальних інновацій ШІ. Широкомасштабні дослідження моделей у країні та за кордоном повторюються з високою швидкістю, різноманітні моделі з’являються нескінченним потоком, і продуктивність моделей продовжує вдосконалюватися.
У Китаї, від Baidu Wenxin Yiyan, Ali Tongyi Qianwen, великої моделі Huawei Pangu до 360 smart brain, Zhipu AI ChatGLM тощо, усі верстви суспільства створюють великі моделі. За словами директора Пекінського муніципального бюро економіки та інформаційних технологій Цзян Гуанчжі, наразі в Китаї випущено понад 80 великомасштабних моделей, з яких на Пекін припадає близько половини (більше 40).
«Здається, ми довго піднімалися на гору і нарешті побачили нову вершину та новий світанок.» Цзян Гуанчжі сказав у своїй промові, що за останні два десятиліття ми випробували Інтернет, смартфони, хмарні обчислення, великі дані, Інтернет речей, серія серйозних змін в ІТ-технологіях, кардинально змінила всі аспекти нашого виробництва та життя, і тепер ми започаткували нову еру загального ШІ.
Однак у порівнянні з платіжною моделлю платформ споживчого рівня, таких як ChatGPT, китайські великі моделі штучного інтелекту зазвичай безкоштовні для внутрішнього тестування, і користувачі можуть отримати ліцензію на використання, якщо подають заявку на внутрішнє тестування на платформі. Мало того, під час «війни сотень моделей» усі виготовляють великі моделі, і важко створювати перешкоди для самого підприємства та галузі. Крім того, вартість обчислювальної потужності AI висока, а комерціалізація великих моделей не так легко, як уявлялося.
Простіше кажучи, вітчизняна модель ШІ далека від бізнес-моделі та вартості технології OpenAI. OpenAI може інвестувати сотні мільйонів доларів у витрати на навчання обчислювальної потужності, чого не можуть досягти вітчизняні малі та середні компанії штучного інтелекту, особливо більшість з яких зосереджені на стороні додатків.
«Кількість параметрів насправді є діалектичною проблемою. Сотні мільярдів трильйонів параметрів просто представляють ваші найвищі здібності, але високі параметри означають вищі вимоги до здібностей до мислення та високої обчислювальної потужності, а клієнтські сценарії не обов’язково вимагають таких високих вимог до обчислювальної потужності. Тому що не всі сценарії можуть прийняти вартість 100 мільярдів параметрів.» Дай Веньюань, засновник і генеральний директор 4Paradigm, сказав Titanium Media App у травні цього року, що через різні обмеження та компанії, які шукають прибутку, клієнти To B почали вибирати вартість. - ефективний контрольований вертикальний макет ШІ.
**На 2023 Global Digital Economy Conference Artificial Intelligence Summit Forum, Zhou Hongyi, Zhang Peng, Zhou Bowen та інші гості загалом згадували про «індустріалізацію» та «вертикалізацію» великих моделей і заглибились у такі галузі, як урядові справи, фінанси , створення культури та розширення медичного обслуговування, а також обговорення безпеки моделі, надійності та керованості. **
Чжоу Хуні вважає, що реальна можливість для великомасштабних моделей лежить на ринку корпоративного рівня, і Китай повинен скористатися можливістю промислового розвитку, коли мова йде про великомасштабні моделі. Однак, коли поточні загальнодоступні великі моделі використовуються в сценаріях на рівні підприємств, таких як уряди, міста та галузі, є чотири недоліки, включаючи недостатню глибину галузі, приховані загрози в безпеці даних, нездатність гарантувати надійний вміст і високий рівень навчання. і витрати на розгортання.
«Є багато ризиків безпеки даних у загальнодоступній великій моделі. Власне внутрішнє ноу-хау кожного підприємства є основним активом, і публічна велика модель точно не буде навчатися; використання загальнодоступної великої моделі призведе до витоку даних, тому що багато ідей і планів. Ви повинні розповісти йому, щоб він міг написати хорошу статтю; загальнодоступна велика модель є генеративним ШІ, а характеристика її власного алгоритму полягає в тому, що він може говорити нісенітниці, і це серйозні та впевнені нісенітниці . Ця функція використовується для створення романів і сценаріїв, як чат-робот, ефект дуже хороший, але це велика проблема на корпоративному рівні. Якщо ви дійсно приймаєте рецепт, призначений медичною моделлю, смійте повірити це, не посмійте взяти; публічна велика модель не може усвідомити вартість Це можна контролювати, тому що висока вартість великої моделі також сильно перебільшена. Одноразове навчання коштує 10 мільйонів доларів США, яка обчислювальна потужність і скільки потрібні графічні карти, а вертикальній великій моделі на підприємстві не потрібно шукати всеосяжних знань або всебічних можливостей.Десятки мільярдів моделей можуть бути достатніми, але параметри від 100 мільярдів до 10 мільярдів здаються вдесятеро меншими, і економія витрат на навчання та розгортання значно перевищує десять разів».
Чжоу Хуні прямо заявив, що широкомасштабна модель, яка справді потрібна ринку корпоративного рівня в майбутньому, повинна відповідати характеристикам індустріалізації, підприємництва, вертикалізації, мініатюризації та пропрієтаризації. Мало того, але, на його думку, конструкція великих моделей на рівні підприємства повинна відповідати таким трьом принципам:
Безпека: Перш за все, принцип безпеки. Великі моделі мають такі ризики, як мережева безпека, безпека даних і безпека алгоритмів. Особливо з точки зору безпеки вмісту, деякі люди використовували AIGC для створення різного підробленого вмісту для шахрайства. Пошукові системи набагато складніші. Тому питання безпеки штучного інтелекту потрібно вивчати відтепер.
Достовірність: другий принцип достовірності, який може вирішити проблему «ілюзії» великих моделей і проблему того, що знання не можуть бути оновлені вчасно шляхом виправлення бази знань підприємства та пошуку. «Як вирішити проблему точного вихідного вмісту? Тепер це можна виправити за допомогою векторної бази даних, корпоративного пошуку та зовнішньої бази знань».
Керованість: останнім є принцип керованості. Чжоу Хун'ї вважає, що коли велика модель все ще трохи ненадійна, пропонується, що при використанні великої моделі підприємства та уряди можуть зробити невеликий крок на початку та зробити не відкриті API та плагіни до нього. І шаблон функції все ще потрібно наполягати на тому, що він є помічником, остання особа знаходиться в «петлі» прийняття рішень. Він згадав у PPT, що слід застосувати методи моніторингу та аудиту, щоб «замкнути великий горизонтальний тип у клітку».
Стосовно того, як підприємства використовують великі моделі, Чжоу Хонгі підкреслив, що великі корпоративні моделі повинні спочатку добре використовувати загальні можливості та повністю використовувати найкращі та найзріліші можливості великих моделей; зосередитися на больових точках і жорстких потребах підприємств, невеликих скороченнях. , велика глибина, така як аналіз інформації та прийняття рішень, сценарії Office, такі як пошук і керування корпоративними знаннями, співпраця в офісі та інтелектуальне обслуговування клієнтів є найбільш підходящими точками входу.
У той же час Чжоу Хун'ї також запропонував підприємствам спочатку ввімкнути режими «помічник» і «другий пілот» при використанні великої моделі, щоб велика модель могла залишатися відносно незалежною від існуючої бізнес-системи та підтримувати ізоляцію, що також є більш безпечним і контрольованим для підприємства. Крім того, модель великого підприємства повинна використовуватися як керівниками, так і співробітниками, щоб ШІ був інклюзивним.
«Великим моделям завжди важко виконувати роботу самостійно, і багато співробітників не сприймають великих моделей. Великим моделям все ще важко виконувати роботу самостійно. Більше позиціонування — справа людини. Хороші інструменти та помічники зі знаннями, тому розробка великих моделей має бути орієнтована на людей». Чжоу Хунґі зазначив, що легкість у використанні є основним принципом розробки великих моделей.
Чжоу Хонгі вважає, що цифрова людина стане важливою формою входу та транспортування великих моделей корпоративного рівня. «Душевний» цифровий помічник, випущений 360 Smart Brain, може вирішити проблему зручності використання великих моделей. На місці події Чжоу Хун’ї також показав налаштовані «Обслуговування клієнтів Пекіна не може запитати» та «Продавці міста Пекіна», двох великих цифрових людей, навчених для Пекіна, щоб вирішувати деякі основні потреби в уряді та підприємствах.
Не лише Чжоу Хонгі, але й генеральний директор Zhipu AI Чжан Пен згадав, що з точки зору комерційного впровадження Zhipu AI запропонував концепцію обслуговування великих моделей MaaS (модель як послуга), сподіваючись оновити сотні мільярдів високоточних великих моделей. Багато людей і підприємств можуть користуватися розширеними можливостями ШІ.
«У нас є три версії: одна — це послуга наскрізного навчання моделям, і ми допомогли вам пройти деякий тренінг із міграції моделей на власно створену обчислювальну потужну платформу; інша — надавати послуги зі створення моделей і ліцензії; третя — співпрацювати з постачальниками хмарних обчислень, запропонованих викликів API та служб екземпляра моделі, щоб допомогти кожному швидко створювати потужні можливості інфраструктури", - сказав Чжан Пен.
Titanium Media App дізнався, що Zhipu AI розробляє новий широкомасштабний модельний продукт ChatGLM2, який зменшує кількість параметрів, але покращує якість даних. Можливості було значно покращено. У багатьох оцінках ChatGLM2 набрав більше балів, ніж GPT-4 і ChatGPT.
Чжоу Бовен, засновник Lianyuan Technology і професор кафедри Huiyan Університету Цінхуа, сказав, що те, чи зможе Аль повністю інтегруватися з бізнесом, є ключовим фактором, який визначає, чи зможе Аль реалізувати економічну цінність. Тільки за допомогою бізнес-орієнтованої розробки стратегії штучного інтелекту, повної допоміжної структури, достатньої кількості талантів у галузі штучного інтелекту та надійного механізму внутрішнього навчання можна повністю інтегрувати штучний інтелект із потребами розвитку бізнесу та максимізувати економічні вигоди.
Фан Хан, генеральний директор Kunlun Wanwei, вважає, що наразі великомасштабні моделі перебувають у стані зниження витрат на стороні B та підвищення ефективності на стороні C.
Він вважає, що китайські компанії B-end сервісу бачать, що будь-якій компанії важко монополізувати весь B-end сервіс. У зв’язку з великим попитом моделі на галузеві дані, кожна велика модельна компанія неминуче може досягти першочергового успіху в одній або двох галузях.Жодна компанія не може досягти успіху в усіх галузях, і будь-якій компанії важко отримати дані уся галузь; і С-кінець неодмінно буде фрагментованим. Оскільки платіжні звички на китайському ринку насправді сильно відрізняються від закордонних, безкоштовні звички китайських користувачів дуже очевидні. Усі компанії, які надають послуги для С-кінцевих користувачів має базуватися на Безкоштовний режим є основним, а VIP-режим доповнюється.
«Велика хвиля підніметься, і приземлення стане королем. Ми сподіваємося, що ця хвиля підприємництва та інвестицій у загальний штучний інтелект відрізнятиметься від попередньої хвилі, і вона може приземлитися швидше та приносити користувачам і прибутку», — теорія Фан Хана. все ще упереджена Комерціалізація великих моделей. Він зазначив, що створені штучним інтелектом музичні продукти, розроблені Kunlun Wanwei, вже приземлилися на культурну та туристичну сцену, і підписав угоду з пекінським районом Dongcheng у квітні цього року.
Чжан Сінь, заступник генерального директора Центру великих даних і штучного інтелекту China Telecom Group, оголосив про велику модель TeleChat, розроблену ним на місці, яка підтримує виведення кодів і написання промов. Чжан Сінь зазначив, що метою досліджень і розробок China Telecom Digital Technology Co., Ltd. є створення кабіни алгоритмів штучного інтелекту на 10 000 рівнів, щоб стати постачальником послуг штучного інтелекту на рівні 10 мільярдів. Продукти охоплюють алгоритми штучного інтелекту, платформи, програми , обладнання та великі моделі.
Це перший випадок, коли China Telecom анонсувала свої масштабні моделі продуктів. Чжан Сінь також сказав, що в порівнянні з іншими великими моделями більшість продуктів TeleChat використовують внутрішні китайські великі дані, 90% з яких переважно внутрішні, і базуючись на Tianyi Cloud і базі злиття хмарних мереж China Telecom, TeleChat використовується для параметрів навчання моделі. У той час ємність може досягати 47%, а ефективність навчання моделі та можливості алгоритму моделі все ще покращуються.
У прикладному сценарії виробники почали інтелектуалізувати модель TeleChat від China Telecom, щоб вирішити проблеми нестачі кадрів і недостатнього покриття деяких голосових операторів. Завдяки вдосконаленню технології ШІ можна реалізувати модернізацію можливостей соціального управління та зменшити витрати.
Гуо Фан, віце-президент відділу інновацій Unisound, якось згадав, що демонстраційне застосування системи створення амбулаторних медичних записів на основі великої моделі гір і морів, спільно розробленої Unisound і Beijing Friendship Hospital, у сфері інтелектуальної медичної допомоги на основі Очікується, що на 70-мільярдній автоматичній шкалі параметрів Unisound досліджуйте велику модель «Гори і море» в поєднанні з інтерфейсною обробкою звукових сигналів, розпізнаванням відбитків голосу, розпізнаванням мовлення, синтезом мовлення та іншими технологіями повної інтелектуальної голосової взаємодії. оперативність введення електронних медичних карт лікарів більш ніж на 400%, економія часу на консультацію пацієнта понад 40%, підвищення ефективності амбулаторного обслуговування лікарів більш ніж на 66%.
Насправді, великі моделі зазвичай є зоною, де переможець отримує все. Потрібно більше грошей, більше обчислювальної потужності та кращі таланти. Оскільки краща обчислювальна потужність означає більше людей, які використовують її, більше людей використовують більше даних, а більше даних означає кращі результати обчислювальної потужності. Велика модель має стати полем битви для гігантів, які мають гроші, технології та, що важливіше, дані.
Але компанії-початківці мають надто багато проектів, а їхні кошти надто розпорошені, особливо на підприємстві, вони в кінцевому підсумку витрачають кошти на купівлю карт Nvidia A100 і хмарних сервісів без кількісного визначення процесу розвитку підприємства. Особливо, коли компаніям зі штучним інтелектом і SaaS-компаніям загалом важко отримувати прибуток і робити кров, компаніям-початківцям потрібно комерціалізувати та отримувати прибуток за допомогою великих моделей.
Таким чином, поточна вітчизняна широкомасштабна модель штучного інтелекту формується на основі великомасштабної моделі загального призначення та центру обчислювальної потужності, створеного такими великими компаніями, як Ali, Tencent, Baidu, Huawei та SenseTime, а також Momo. Zhixing, Tianyancha, Yunzhisheng і Китай Великі вертикальні або галузеві моделі домену, створені такими компаніями, як Kewenge та Megvii, зосереджуються лише на одній або двох сферах для вирішення основних проблем.
Уряд підтримує посадку масштабних модельних сцен
На цьому форумі Пекінське економічне та інформаційне бюро ще раз оголосило про другу групу учасників Пекінської загальної програми інноваційного партнерства в галузі штучного інтелекту, і було відібрано 63 компанії.
Відомо, що станом на 30 червня загалом 416 великомасштабних дослідницьких і дослідно-конструкторських компаній у Пекіні та за його межами подали заявку на участь у другій партії «Програми партнерства». Зрештою, 63 компанії, у тому числі Beijing Baidu Netcom Technology Co., Ltd., China Power Data Service Co., Ltd., і Beijing Jizhi Future Artificial Intelligence Industry Innovation Base Co., Ltd., були обрані та оголошені. Серед них 10 партнерів з обчислювальної потужності, 10 партнерів з даних, 10 партнерів з моделей, 24 партнери з додатків і 9 партнерів з інвестицій. Крім того, було оцінено 30 спостерігачів моделі.
За оцінками Titanium Media App, на даний момент більше 80 компаній і установ були обрані для участі в Пекінській загальній інноваційній програмі штучного інтелекту.
**Наразі Пекін швидко просуває створення великомасштабних моделей ШІ та промислових макетів. **
21 травня Пекінський муніципальний народний уряд оприлюднив повідомлення про «План реалізації для Пекіна прискорення будівництва всесвітньо впливового джерела інновацій штучного інтелекту (2023-2025 рр.)». До 2025 року інноваційні технології штучного інтелекту та промисловий розвиток Пекіна будуть досягнуті. вступити в нову еру На етапі розвитку фундаментальні теоретичні дослідження зробили прорив, вплив оригінальних інноваційних досягнень продовжував зростати, а масштаби індустрії штучного інтелекту продовжували збільшуватися, утворюючи промисловий кластер з міжнародною конкурентоспроможністю та технологічне домінування.
23 травня Генеральний офіс Пекінського муніципального народного уряду опублікував повідомлення про «кілька заходів для сприяння інноваціям і розвитку загального штучного інтелекту в Пекіні», вимагаючи повного використання керівної ролі уряду та каталітичної ролі інноваційних платформ. для інтеграції інноваційних ресурсів, посилення розподілу елементів і створення інновацій екології, надавати важливого значення запобіганню ризикам і просувати загальний штучний інтелект Пекіна для досягнення інноваційного лідерства та раціонального та здорового розвитку.
Titanium Media App на місці помітив, що все більше випадків і корпоративних учасників щодо впровадження широкомасштабних моделей штучного інтелекту в державних справах беруть участь такі компанії, як Ali, Huawei, Autohome і Shibui Technology.
Відповідальна особа Пекінського бюро обслуговування муніципального управління зазначила в прямому ефірі, що для того, щоб підтримати будівництво платформи «Jingce», уряду необхідно впровадити загальну широкомасштабну модельну технологію в області сценаріїв, щоб покращити управління політикою та точні можливості обслуговування. «Поглиблене дослідження та аналіз масивних даних про звернення громадян забезпечує сильнішу підтримку для прийняття рішень керівництвом, низового управління та міського управління».
Відповідальна особа, згадана вище, зазначила, що з точки зору вдосконалення сцени на ранній стадії буде використовуватися відкрита невелика модель інтерфейсу, а пізніше будуть виконуватися приватизовані поглиблені програми. У довгостроковій перспективі вони відкриють високоякісні та надійні державні набори даних шляхом встановлення механізмів цифрового захисту та технічних оцінок за умови безпеки даних та керованості.
Ван Чжаншен, керівник Zhongke Wenge Delivery Center, зазначив в обміні з Titanium Media App, що державні клієнти мають високі вимоги до великих моделей штучного інтелекту, і ця сфера також вимагає безпеки даних і управління даними при застосуванні великих моделей.Умови, особливо високі. - якісне навчання даних, щоб краще вирішувати практичні прикладні проблеми в цій галузі.
Технічний директор Midu Лю Ідун розповів Titanium Media App, що минулого року компанія почала використовувати інфраструктурні продукти Huawei Cloud для запуску бізнесу в урядових справах, ЗМІ та інших сферах, а тепер компанія збирається випустити масштабні моделі продуктів для вертикальних галузей, які зосереджені на громадська думка в Інтернеті.
«Уряд почав платити за «велику модель». З одного боку, це політичні вказівки та вимоги до практичних сценаріїв застосування. З іншого боку, підприємства самі повинні вирішувати проблеми витрат і комерціалізації за допомогою великих моделей». Інсайдер галузі проаналізував Titanium Media App. Вітчизняна індустрія великомасштабних моделей повертається до періоду, коли компанії штучного інтелекту та уряд об’єднувалися для комерціалізації та отримували державні субсидії.
Цзян Гуанчжі сказав, що в даний час Пекін прискорює будівництво національної експериментальної зони інновацій та розробки штучного інтелекту нового покоління та національної пілотної зони застосування інновацій штучного інтелекту, щоб створити всесвітньо впливове джерело інновацій у сфері штучного інтелекту. Конкретні заходи включають наступне. три точки:
Один з них полягає в посиленні політичних інновацій і стандартних інструкцій. Вирішіть проблеми відносно невеликої кількості даних, складного забезпечення якості, високої вартості збору та маркування та сумісного використання. Сплануйте та запровадьте політику «ваучера на обчислювальну потужність» для підтримки малих і середніх підприємств на основі сценаріїв посадкових додатків для отримання диверсифікованої, недорогої та високоякісної обчислювальної потужності, а також підтримки підприємств штучного інтелекту в цьому місті та пов’язаних галузевих організацій у розробка національних стандартів, галузевих стандартів і місцевих стандартів для штучного інтелекту. Відіграйте провідну роль і беріть участь у розробці технічних стандартів щодо продуктивності моделі, безпеки даних і захисту конфіденційності.
По-друге, збільшити кількість сценаріїв і взяти на себе лідерство у впровадженні еталонних програм. Сприяти міським державним установам, громадським установам, державним підприємствам та іншим організаціям, які виконують функції управління громадськими справами, активно купувати та використовувати безпечні та надійні продукти та послуги, пов’язані з великомасштабними моделями, взяти на себе провідну роль у впровадженні додатків у державних службах , розумні міста та інші сфери, а також покращити рівень модернізації можливостей міського управління.
По-третє, сприяти поглибленню та міцності плану партнерства. У поточній програмі партнерства понад 10 партнерів з обчислювальної потужності планують надати не менше 4000P недорогих і високоякісних обчислювальних потужностей для малих і середніх підприємств штучного інтелекту в Пекіні для проведення широкомасштабного навчання моделі та міркування. 10 партнерів із обробки даних випустили 18 високоякісних наборів даних майже 500 тис. для масштабного корпоративного навчання. У той же час це також прискорить просування широкомасштабних модельних галузевих додатків, повною мірою відтворить роль партнерської програми, орієнтованої на ринок платформи для стикування та співпраці, а також створить хорошу екологію для інновацій, співпраці та застосування масштабних моделей у Пекіні.
Цзян Гуанчжі підкреслив, що Пекінське економічне та інформаційне бюро продовжуватиме посилювати розподіл високоякісних елементів ресурсів, ефективно інтегрувати інноваційні ресурси, активно створювати інноваційну екологію та закладати міцну основу для розвитку індустрії штучного інтелекту.
«Великі моделі не можуть бути створені однією компанією. Найкраще для всіх сформувати кілька великих екосистем на рівнях обчислювальної потужності, моделей і даних. Особливо під керівництвом державних відомств компанії можуть формувати партнерства в екосистемі, щоб "Кожен більше про співпрацю, ніж про конкуренцію. У майбутньому велика модель може сформувати відносини з екологією, партнерами та взаємовигідною кооперацією", - сказав Цзі Хайцюань, виконавчий директор Legend Capital.
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Минуло 7 місяців, а китайська модель штучного інтелекту не може навчатися у ChatGPT
Джерело: Titanium Media
Автор: Лінь Чжіцзя
Подібно до конференцій, пов’язаних зі штучним інтелектом (ШІ) протягом кількох попередніх тижнів, на Форумі саміту зі штучного інтелекту Global Digital Economy Conference 2023 підприємці та науковці обговорювали вплив великомасштабних моделей і генеративних технологій ШІ на суспільство та промисловість.
«Останні кілька місяців усі обговорювали, коли OpenAI і Китай зможуть створити власні великомасштабні моделі. За останні кілька місяців масштабні моделі з’явилися одна за одною. Я бачу, що багато інвесторів починають Чжоу Хуні, голова 360, сказав у своїй промові на форумі. Він сказав, що реальні можливості для великомасштабних моделей є в Китаї, особливо на ринку корпоративного рівня, включаючи уряди та міста, а також великі китайські компанії. масштабна модель повинна скористатися можливістю промислового розвитку Інтернету.
Тан Веньбінь, співзасновник Megvii Technology, Чжан Пен, генеральний директор Zhipu AI, Чжоу Бовен, засновник Lianyuan Technology і професор кафедри Huiyan Університету Цінхуа, та інші гості також погодилися з цією думкою.Вони загалом вважали, що великі моделі не повинні Багато грошей витрачається на загальні великомасштабні моделі із сотнями мільярдів параметрів, такі як ChatGPT. Натомість необхідно створювати великомасштабні промислові моделі з індустрією мільярдного рівня, заглиблюватись у галузь To B рішення та розв’язувати практичні задачі у вертикальних полях.
Насправді, оскільки ChatGPT спричинив сплеск інвестицій і промислового розвитку великих моделей штучного інтелекту в Китаї, компанії наслідували ChatGPT і прагнули стати «китайською версією OpenAI».Тепер понад 80 великих моделей пройшли публічні випробування.
**Але проблема полягає в тому, що багато інвесторів і підприємців виявили, що технічний поріг великомасштабних моделей не є високим після семи місяців «розгортання». Комерційні рішення, тоді як членська служба ChatGPT «20 доларів на місяць» Plus може стати лише «безкоштовною». » у Китаї, і безперервні інвестиції в технологію штучного інтелекту OpenAI неможливі в Китаї. **
**Зрештою було виявлено, що платити за «велику модель» можуть лише клієнти в кількох вертикальних галузях, таких як урядові справи, фінанси та медичне обслуговування. **
Підприємства більше не конкурують із технологією великомасштабних моделей ШІ, а повертаються до комерціалізації
Приблизно за останні шість місяців технології великомасштабних моделей, представлені ChatGPT і GPT-4, очолили новий виток глобальних інновацій ШІ. Широкомасштабні дослідження моделей у країні та за кордоном повторюються з високою швидкістю, різноманітні моделі з’являються нескінченним потоком, і продуктивність моделей продовжує вдосконалюватися.
У Китаї, від Baidu Wenxin Yiyan, Ali Tongyi Qianwen, великої моделі Huawei Pangu до 360 smart brain, Zhipu AI ChatGLM тощо, усі верстви суспільства створюють великі моделі. За словами директора Пекінського муніципального бюро економіки та інформаційних технологій Цзян Гуанчжі, наразі в Китаї випущено понад 80 великомасштабних моделей, з яких на Пекін припадає близько половини (більше 40).
«Здається, ми довго піднімалися на гору і нарешті побачили нову вершину та новий світанок.» Цзян Гуанчжі сказав у своїй промові, що за останні два десятиліття ми випробували Інтернет, смартфони, хмарні обчислення, великі дані, Інтернет речей, серія серйозних змін в ІТ-технологіях, кардинально змінила всі аспекти нашого виробництва та життя, і тепер ми започаткували нову еру загального ШІ.
Однак у порівнянні з платіжною моделлю платформ споживчого рівня, таких як ChatGPT, китайські великі моделі штучного інтелекту зазвичай безкоштовні для внутрішнього тестування, і користувачі можуть отримати ліцензію на використання, якщо подають заявку на внутрішнє тестування на платформі. Мало того, під час «війни сотень моделей» усі виготовляють великі моделі, і важко створювати перешкоди для самого підприємства та галузі. Крім того, вартість обчислювальної потужності AI висока, а комерціалізація великих моделей не так легко, як уявлялося.
Простіше кажучи, вітчизняна модель ШІ далека від бізнес-моделі та вартості технології OpenAI. OpenAI може інвестувати сотні мільйонів доларів у витрати на навчання обчислювальної потужності, чого не можуть досягти вітчизняні малі та середні компанії штучного інтелекту, особливо більшість з яких зосереджені на стороні додатків.
«Кількість параметрів насправді є діалектичною проблемою. Сотні мільярдів трильйонів параметрів просто представляють ваші найвищі здібності, але високі параметри означають вищі вимоги до здібностей до мислення та високої обчислювальної потужності, а клієнтські сценарії не обов’язково вимагають таких високих вимог до обчислювальної потужності. Тому що не всі сценарії можуть прийняти вартість 100 мільярдів параметрів.» Дай Веньюань, засновник і генеральний директор 4Paradigm, сказав Titanium Media App у травні цього року, що через різні обмеження та компанії, які шукають прибутку, клієнти To B почали вибирати вартість. - ефективний контрольований вертикальний макет ШІ.
**На 2023 Global Digital Economy Conference Artificial Intelligence Summit Forum, Zhou Hongyi, Zhang Peng, Zhou Bowen та інші гості загалом згадували про «індустріалізацію» та «вертикалізацію» великих моделей і заглибились у такі галузі, як урядові справи, фінанси , створення культури та розширення медичного обслуговування, а також обговорення безпеки моделі, надійності та керованості. **
Чжоу Хуні прямо заявив, що широкомасштабна модель, яка справді потрібна ринку корпоративного рівня в майбутньому, повинна відповідати характеристикам індустріалізації, підприємництва, вертикалізації, мініатюризації та пропрієтаризації. Мало того, але, на його думку, конструкція великих моделей на рівні підприємства повинна відповідати таким трьом принципам:
У той же час Чжоу Хун'ї також запропонував підприємствам спочатку ввімкнути режими «помічник» і «другий пілот» при використанні великої моделі, щоб велика модель могла залишатися відносно незалежною від існуючої бізнес-системи та підтримувати ізоляцію, що також є більш безпечним і контрольованим для підприємства. Крім того, модель великого підприємства повинна використовуватися як керівниками, так і співробітниками, щоб ШІ був інклюзивним.
«Великим моделям завжди важко виконувати роботу самостійно, і багато співробітників не сприймають великих моделей. Великим моделям все ще важко виконувати роботу самостійно. Більше позиціонування — справа людини. Хороші інструменти та помічники зі знаннями, тому розробка великих моделей має бути орієнтована на людей». Чжоу Хунґі зазначив, що легкість у використанні є основним принципом розробки великих моделей.
Чжоу Хонгі вважає, що цифрова людина стане важливою формою входу та транспортування великих моделей корпоративного рівня. «Душевний» цифровий помічник, випущений 360 Smart Brain, може вирішити проблему зручності використання великих моделей. На місці події Чжоу Хун’ї також показав налаштовані «Обслуговування клієнтів Пекіна не може запитати» та «Продавці міста Пекіна», двох великих цифрових людей, навчених для Пекіна, щоб вирішувати деякі основні потреби в уряді та підприємствах.
«У нас є три версії: одна — це послуга наскрізного навчання моделям, і ми допомогли вам пройти деякий тренінг із міграції моделей на власно створену обчислювальну потужну платформу; інша — надавати послуги зі створення моделей і ліцензії; третя — співпрацювати з постачальниками хмарних обчислень, запропонованих викликів API та служб екземпляра моделі, щоб допомогти кожному швидко створювати потужні можливості інфраструктури", - сказав Чжан Пен.
Titanium Media App дізнався, що Zhipu AI розробляє новий широкомасштабний модельний продукт ChatGLM2, який зменшує кількість параметрів, але покращує якість даних. Можливості було значно покращено. У багатьох оцінках ChatGLM2 набрав більше балів, ніж GPT-4 і ChatGPT.
Чжоу Бовен, засновник Lianyuan Technology і професор кафедри Huiyan Університету Цінхуа, сказав, що те, чи зможе Аль повністю інтегруватися з бізнесом, є ключовим фактором, який визначає, чи зможе Аль реалізувати економічну цінність. Тільки за допомогою бізнес-орієнтованої розробки стратегії штучного інтелекту, повної допоміжної структури, достатньої кількості талантів у галузі штучного інтелекту та надійного механізму внутрішнього навчання можна повністю інтегрувати штучний інтелект із потребами розвитку бізнесу та максимізувати економічні вигоди.
Фан Хан, генеральний директор Kunlun Wanwei, вважає, що наразі великомасштабні моделі перебувають у стані зниження витрат на стороні B та підвищення ефективності на стороні C.
Він вважає, що китайські компанії B-end сервісу бачать, що будь-якій компанії важко монополізувати весь B-end сервіс. У зв’язку з великим попитом моделі на галузеві дані, кожна велика модельна компанія неминуче може досягти першочергового успіху в одній або двох галузях.Жодна компанія не може досягти успіху в усіх галузях, і будь-якій компанії важко отримати дані уся галузь; і С-кінець неодмінно буде фрагментованим. Оскільки платіжні звички на китайському ринку насправді сильно відрізняються від закордонних, безкоштовні звички китайських користувачів дуже очевидні. Усі компанії, які надають послуги для С-кінцевих користувачів має базуватися на Безкоштовний режим є основним, а VIP-режим доповнюється.
«Велика хвиля підніметься, і приземлення стане королем. Ми сподіваємося, що ця хвиля підприємництва та інвестицій у загальний штучний інтелект відрізнятиметься від попередньої хвилі, і вона може приземлитися швидше та приносити користувачам і прибутку», — теорія Фан Хана. все ще упереджена Комерціалізація великих моделей. Він зазначив, що створені штучним інтелектом музичні продукти, розроблені Kunlun Wanwei, вже приземлилися на культурну та туристичну сцену, і підписав угоду з пекінським районом Dongcheng у квітні цього року.
Це перший випадок, коли China Telecom анонсувала свої масштабні моделі продуктів. Чжан Сінь також сказав, що в порівнянні з іншими великими моделями більшість продуктів TeleChat використовують внутрішні китайські великі дані, 90% з яких переважно внутрішні, і базуючись на Tianyi Cloud і базі злиття хмарних мереж China Telecom, TeleChat використовується для параметрів навчання моделі. У той час ємність може досягати 47%, а ефективність навчання моделі та можливості алгоритму моделі все ще покращуються.
У прикладному сценарії виробники почали інтелектуалізувати модель TeleChat від China Telecom, щоб вирішити проблеми нестачі кадрів і недостатнього покриття деяких голосових операторів. Завдяки вдосконаленню технології ШІ можна реалізувати модернізацію можливостей соціального управління та зменшити витрати.
Гуо Фан, віце-президент відділу інновацій Unisound, якось згадав, що демонстраційне застосування системи створення амбулаторних медичних записів на основі великої моделі гір і морів, спільно розробленої Unisound і Beijing Friendship Hospital, у сфері інтелектуальної медичної допомоги на основі Очікується, що на 70-мільярдній автоматичній шкалі параметрів Unisound досліджуйте велику модель «Гори і море» в поєднанні з інтерфейсною обробкою звукових сигналів, розпізнаванням відбитків голосу, розпізнаванням мовлення, синтезом мовлення та іншими технологіями повної інтелектуальної голосової взаємодії. оперативність введення електронних медичних карт лікарів більш ніж на 400%, економія часу на консультацію пацієнта понад 40%, підвищення ефективності амбулаторного обслуговування лікарів більш ніж на 66%.
Насправді, великі моделі зазвичай є зоною, де переможець отримує все. Потрібно більше грошей, більше обчислювальної потужності та кращі таланти. Оскільки краща обчислювальна потужність означає більше людей, які використовують її, більше людей використовують більше даних, а більше даних означає кращі результати обчислювальної потужності. Велика модель має стати полем битви для гігантів, які мають гроші, технології та, що важливіше, дані.
Але компанії-початківці мають надто багато проектів, а їхні кошти надто розпорошені, особливо на підприємстві, вони в кінцевому підсумку витрачають кошти на купівлю карт Nvidia A100 і хмарних сервісів без кількісного визначення процесу розвитку підприємства. Особливо, коли компаніям зі штучним інтелектом і SaaS-компаніям загалом важко отримувати прибуток і робити кров, компаніям-початківцям потрібно комерціалізувати та отримувати прибуток за допомогою великих моделей.
Таким чином, поточна вітчизняна широкомасштабна модель штучного інтелекту формується на основі великомасштабної моделі загального призначення та центру обчислювальної потужності, створеного такими великими компаніями, як Ali, Tencent, Baidu, Huawei та SenseTime, а також Momo. Zhixing, Tianyancha, Yunzhisheng і Китай Великі вертикальні або галузеві моделі домену, створені такими компаніями, як Kewenge та Megvii, зосереджуються лише на одній або двох сферах для вирішення основних проблем.
Уряд підтримує посадку масштабних модельних сцен
На цьому форумі Пекінське економічне та інформаційне бюро ще раз оголосило про другу групу учасників Пекінської загальної програми інноваційного партнерства в галузі штучного інтелекту, і було відібрано 63 компанії.
Відомо, що станом на 30 червня загалом 416 великомасштабних дослідницьких і дослідно-конструкторських компаній у Пекіні та за його межами подали заявку на участь у другій партії «Програми партнерства». Зрештою, 63 компанії, у тому числі Beijing Baidu Netcom Technology Co., Ltd., China Power Data Service Co., Ltd., і Beijing Jizhi Future Artificial Intelligence Industry Innovation Base Co., Ltd., були обрані та оголошені. Серед них 10 партнерів з обчислювальної потужності, 10 партнерів з даних, 10 партнерів з моделей, 24 партнери з додатків і 9 партнерів з інвестицій. Крім того, було оцінено 30 спостерігачів моделі.
За оцінками Titanium Media App, на даний момент більше 80 компаній і установ були обрані для участі в Пекінській загальній інноваційній програмі штучного інтелекту.
**Наразі Пекін швидко просуває створення великомасштабних моделей ШІ та промислових макетів. **
21 травня Пекінський муніципальний народний уряд оприлюднив повідомлення про «План реалізації для Пекіна прискорення будівництва всесвітньо впливового джерела інновацій штучного інтелекту (2023-2025 рр.)». До 2025 року інноваційні технології штучного інтелекту та промисловий розвиток Пекіна будуть досягнуті. вступити в нову еру На етапі розвитку фундаментальні теоретичні дослідження зробили прорив, вплив оригінальних інноваційних досягнень продовжував зростати, а масштаби індустрії штучного інтелекту продовжували збільшуватися, утворюючи промисловий кластер з міжнародною конкурентоспроможністю та технологічне домінування.
23 травня Генеральний офіс Пекінського муніципального народного уряду опублікував повідомлення про «кілька заходів для сприяння інноваціям і розвитку загального штучного інтелекту в Пекіні», вимагаючи повного використання керівної ролі уряду та каталітичної ролі інноваційних платформ. для інтеграції інноваційних ресурсів, посилення розподілу елементів і створення інновацій екології, надавати важливого значення запобіганню ризикам і просувати загальний штучний інтелект Пекіна для досягнення інноваційного лідерства та раціонального та здорового розвитку.
Відповідальна особа Пекінського бюро обслуговування муніципального управління зазначила в прямому ефірі, що для того, щоб підтримати будівництво платформи «Jingce», уряду необхідно впровадити загальну широкомасштабну модельну технологію в області сценаріїв, щоб покращити управління політикою та точні можливості обслуговування. «Поглиблене дослідження та аналіз масивних даних про звернення громадян забезпечує сильнішу підтримку для прийняття рішень керівництвом, низового управління та міського управління».
Відповідальна особа, згадана вище, зазначила, що з точки зору вдосконалення сцени на ранній стадії буде використовуватися відкрита невелика модель інтерфейсу, а пізніше будуть виконуватися приватизовані поглиблені програми. У довгостроковій перспективі вони відкриють високоякісні та надійні державні набори даних шляхом встановлення механізмів цифрового захисту та технічних оцінок за умови безпеки даних та керованості.
Ван Чжаншен, керівник Zhongke Wenge Delivery Center, зазначив в обміні з Titanium Media App, що державні клієнти мають високі вимоги до великих моделей штучного інтелекту, і ця сфера також вимагає безпеки даних і управління даними при застосуванні великих моделей.Умови, особливо високі. - якісне навчання даних, щоб краще вирішувати практичні прикладні проблеми в цій галузі.
Технічний директор Midu Лю Ідун розповів Titanium Media App, що минулого року компанія почала використовувати інфраструктурні продукти Huawei Cloud для запуску бізнесу в урядових справах, ЗМІ та інших сферах, а тепер компанія збирається випустити масштабні моделі продуктів для вертикальних галузей, які зосереджені на громадська думка в Інтернеті.
«Уряд почав платити за «велику модель». З одного боку, це політичні вказівки та вимоги до практичних сценаріїв застосування. З іншого боку, підприємства самі повинні вирішувати проблеми витрат і комерціалізації за допомогою великих моделей». Інсайдер галузі проаналізував Titanium Media App. Вітчизняна індустрія великомасштабних моделей повертається до періоду, коли компанії штучного інтелекту та уряд об’єднувалися для комерціалізації та отримували державні субсидії.
Цзян Гуанчжі сказав, що в даний час Пекін прискорює будівництво національної експериментальної зони інновацій та розробки штучного інтелекту нового покоління та національної пілотної зони застосування інновацій штучного інтелекту, щоб створити всесвітньо впливове джерело інновацій у сфері штучного інтелекту. Конкретні заходи включають наступне. три точки:
Цзян Гуанчжі підкреслив, що Пекінське економічне та інформаційне бюро продовжуватиме посилювати розподіл високоякісних елементів ресурсів, ефективно інтегрувати інноваційні ресурси, активно створювати інноваційну екологію та закладати міцну основу для розвитку індустрії штучного інтелекту.
«Великі моделі не можуть бути створені однією компанією. Найкраще для всіх сформувати кілька великих екосистем на рівнях обчислювальної потужності, моделей і даних. Особливо під керівництвом державних відомств компанії можуть формувати партнерства в екосистемі, щоб "Кожен більше про співпрацю, ніж про конкуренцію. У майбутньому велика модель може сформувати відносини з екологією, партнерами та взаємовигідною кооперацією", - сказав Цзі Хайцюань, виконавчий директор Legend Capital.