Комерціалізація великих моделей загального призначення ще рано, а генеративний ШІ тільки почався

2023-07-31 07:06:57

Джерело: Titanium Media

Автор: Qin Conghui

Джерело зображення: створено Unbounded AI

Від фанатичної гонитви до повернення до спокою погляди людей на великі моделі тихо змінюються. З одного боку, через відповідність, нормативні та інші причини потрібен час для комерціалізації великомасштабних моделей загального призначення; з іншого боку, промисловість лише почала інвестувати в пілотні галузі, такі як фінанси та медичної допомоги, і ефект видно не відразу.

Таким чином, коли божевільна спіраль поступово сповільнювалася, різні голоси поступово малювали справжню картину «великої моделі».

Серед них, чи використовувати «загальну широкомасштабну модель» чи «галузеву широкомасштабну модель», кожна компанія зробила вибір після певного обмірковування; і з конкуренцією великомасштабних моделей «генеративний ШІ» увійшов до прожектор . Треба сказати, що ChatGPT — це не що інше, як постріл у руку розвитку індустрії штучного інтелекту, щоб вийти на новий етап, і він підштовхне штучний інтелект назад у центр епохи.

Битва між загальною моделлю та галузевою моделлю

ChatGPT поінформував індустрію про величезну силу великих моделей загального призначення, і це призвело до бізнес-спектаклю «Війни сотень моделей» у майбутньому. Незліченні інвестори та підприємці не могли спати через це, а ресурси GPU стали "Папір Лояна дорогий" на деякий час.

Серед них є багато технологічних компаній на вершині галузі, які змушені піти на «Ляншань». Інсайдер індустрії великомасштабних моделей одного разу розповів Titanium Media App поточну ситуацію в своїй компанії: «Якщо немає великомасштабної моделі, буде надто соромно виходити і говорити про це. Давайте зробимо це зараз, і це важко пояснити, якщо немає великомасштабної моделі". Тож вони лише можуть оприлюднити зовнішній світ новини про те, що вони працюють над великомасштабною моделлю загального призначення, і водночас прискорити дослідження та розробки внутрішній прогрес.

Однак загальна велика модель все-таки займає багато часу та трудомісткості. OpenAI знадобилося 6 років, щоб ітерувати GPT1. Почав навчання кілька років тому. Таким чином, якщо немає базового накопичення технологій і даних ШІ, дуже важко реалізувати комерціалізацію загальних великих моделей у короткостроковій перспективі.

Крім того, велика модель загального призначення, природно, потребує загальнодоступних даних для навчання, а розміщення власних даних у великій моделі загального призначення також означає, що дані будуть надані за замовчуванням. Тому деякі галузі з високими вимогами до конфіденційності даних навряд чи отримають доступ до великих моделей загального призначення без підготовки.

За таких обставин велика галузева модель стала «другим найкращим рішенням» у галузі, окрім загальної великої моделі, і може отримати дивіденд від великої моделі швидше. Чжоу Хуні, засновник 360 Group, також прямо сказав: «Майбутні можливості для великомасштабних моделей штучного інтелекту полягають у поступовому ринку корпоративного рівня, а «вертикалізація» великомасштабних моделей є напрямком розвитку». технічний керівник великого заводу також розповів Titanium Media App. «З точки зору нашого планування великомасштабної моделі, ми продовжуватимемо ітерацію великомасштабної моделі загального призначення та продовжуватимемо розкладати на цій основі для навчання промислових вертикальних великомасштабних моделей».

Не так давно, на Всесвітній конференції зі штучного інтелекту 2023 року, Тан Даошен, старший виконавчий віце-президент Tencent Group і генеральний директор Cloud and Smart Industry Business Group, також заявив, що широкомасштабне застосування моделей на підприємствах має комплексно враховувати професіоналізм галузі. , безпека даних, безперервна ітерація та повна вартість та інші фактори. Виходячи з моделі великої промисловості, створення власної ексклюзивної моделі може бути кращим варіантом для підприємств. Причина полягає в тому, що великі промислові моделі вимагають менше параметрів, ніж великі моделі загального призначення, вартість навчання та міркування нижча, а оптимізація моделі легша.

Однак Titanium Media App також дізнався від людей у галузі, що в деяких випадках велика модель загального призначення не є необхідною умовою для вертикальної великомасштабної моделі, а це означає, що платформа для навчання промислових моделей не має взяти за основу універсальну великомасштабну модель. «Якщо визначена загальна великомасштабна модель — це модель із сотнями мільярдів параметрів, тоді загальна великомасштабна модель не є необхідною умовою для моделі великомасштабної промисловості». Про це повідомляє Titanium Media App. Однак він також сказав, що хоча великі моделі загального призначення не є необхідною умовою для великомасштабних промислових моделей, різні основні технології для навчання великих моделей загального призначення, таких як Transformer, також є важливими елементами для навчання великомасштабних промислових моделей. .

Постійно «100 мільярдів» параметрів, «ігноруючи» зв’язок із загальною великою моделлю, поріг вертикальної великої моделі був ще більше знижений, що надає більше можливостей для подальшого розвитку генеративного ШІ.

Крім великих моделей, вартий уваги також генеративний ШІ

Коли справа доходить до великих моделей, генеративний ШІ (Generative Al) буде йти рука об руку. Просто зрозумійте взаємозв’язок між ними: велику модель можна розуміти як механізм, який реалізує генеративний ШІ, тобто здатність генеративного ШІ забезпечується моделлю машинного навчання або великою моделлю, а генеративний ШІ є вищим. ніж велика модель, а генеративний ШІ може Залежно від необхідного сценарію ви можете вирішити, яку велику модель викликати ChatGPT є одним із типових застосувань генеративного ШІ.

Ще у 2020 році генеративний ШІ було обрано до циклу ажіотажу нових технологій Gartner, а у 2022 році генеративний ШІ було внесено до списку основних стратегічних технологічних трендів, і технологія досягла піку завищених очікувань від стадії запуску інновацій. Gartner вважає, що генеративний штучний інтелект стане технологією загального призначення, яка матиме вплив, подібний до впливу парової машини, електрики та Інтернету. У міру поступового впровадження генеративного штучного інтелекту ажіотаж навколо концепції поступово згасає, а вплив на людей і підприємства в їх повсякденній роботі та житті зростатиме.

Кредит зображення @Gartner

Глобальний гігант хмарних обчислень Amazon Cloud Technology також приділяє більше уваги генеративному ШІ. Адам Селіпскі, генеральний директор Amazon Cloud Technology, сказав в ексклюзивному інтерв’ю Bloomberg, CNBC та іншим ЗМІ: «Генеративний ШІ дуже важливий у чат-ботах і пошуку. . Переваги застосування генеративного ШІ очевидні для всіх, але це лише верхівка айсберга багатьох можливостей. У майбутньому генеративний ШІ принесе зміни в усіх сферах життя". Він вважає генеративний ШІ "проривом". " зміна, і вона може бути власною. Найбільша зміна з моменту народження Інтернету.

«Уявіть собі, в епоху, коли комп’ютери використовують перфокарти як інтерфейс, лише кілька вчених мають можливість використовувати комп’ютери; коли графічні інтерфейси та миші стають інтерфейсами взаємодії між людиною та комп’ютером, кожен зможе використовувати комп’ютери», — сказав Адам Селіпскі.

Отже, як відображатимуться зміни, спричинені генеративним ШІ?

Можна помітити, що в автомобільній галузі деякі компанії використовували генеративний ШІ для синтезу даних для навчання автономному водінню, щоб пришвидшити процес навчання; у сфері виробництва генеративний ШІ може допомогти проаналізувати велику кількість телеметричних даних IoT, виконати прогнозування технічне обслуговування та скорочення простоїв виробничих ліній. Покладаючись на генеративний штучний інтелект, Autodesk працювала з виробниками літаків, щоб успішно завершити частину конструкції перегородки та представила нову конструкцію, яка на 45% легша. Якщо цю польотну стіну застосувати до глобального автопарку, це дозволить заощадити паливо, еквівалентну споживанню палива 93 000 автомобілів.

Однак слід підкреслити, що генеративний штучний інтелект, на який покладається Autodesk, — це не певна велика модель, а керований штучним інтелектом інструмент проектування, створений за допомогою моделі машинного навчання.

Тому для реалізації генеративного ШІ велика модель є лише варіантом, і в майбутньому велика модель не буде домінувати. Titanium Media App стурбований тим, що коли більшість підприємств розглядають доступ до великомасштабних моделей, вони не просто вводять одну великомасштабну модель, а вибирають доступ до кількох. Тож серед цих великих моделей у майбутньому не можна виключити співпрацю між вертикальними великими моделями та загальними великими моделями.

Візьміть як приклад UFIDA та WPS, два вітчизняні програми. UFIDA нещодавно випустила YonGPT, модель обслуговування великого підприємства. Згідно з Titanium Media App, загальна велика база моделей, до якої YonGPT планує отримати доступ, включає Zhipu ChatGLM, Wenxinyiyan і Zhiyuan Wudao Tianying тощо. ; WPS раніше запустив WPS AI. Згідно з останніми новинами, загальною великомасштабною базою моделей WPS AI у материковому Китаї є MiniMax, а його щойно запущена закордонна версія підтримується OpenAI та PaLM2.

У світі генеративного ШІ не можна покладатися на велику модель, і не тільки велика модель визначає успіх генеративного ШІ.

Незаперечним є те, що впровадження генеративного ШІ також є результатом багатьох аспектів, і «вторинні» виклики, пов’язані з впровадженням генеративного ШІ, оголюються.

«Вторинний» виклик під генеративним ШІ

«Скажіть мобільному телефону «Якщо кіт біжить по дивану, нагадайте мені», тоді, коли кіт біжить по дивану, мобільний телефон отримає тривожне повідомлення». Старший постачальник відеорішень Shandong Zhongwei Century Technology Co., Ltd Віце-президент Ван Чженбінь згадав у своїй промові сценарій застосування інтелектуального відеодетектора в розумному будинку.

Але це така, здавалося б, проста сцена.На додаток до мультимодальної великої моделі, що стоїть за нею, мережа та обчислення на межі також дуже важливі. «У генеративному додатку ШІ, такому як ChatGPT, якщо рівень втрати мережевих пакетів досягає 1%, продуктивність навчальної платформи великої моделі впаде до 5% від її максимальної продуктивності, що означає втрату 95%. Можливості мережі Продуктивність вся платформа великомасштабної моделі є дуже важливим фактором», — сказав Чжан Юй, головний технічний директор Intel China Network and Edge Division та старший головний інженер Intel зі штучного інтелекту.

Передбачається, що зі зростанням попиту на штучний інтелект розгортання штучного інтелекту на периферії буде втричі більше, ніж у базі даних. Це також означає, що впровадження периферійного штучного інтелекту є серйозною проблемою для наступного кроку в розвитку. штучного інтелекту.

«Вартість часу та робочої сили для розгортання штучного інтелекту на межі, наприклад на фабричній виробничій лінії, все ще високі, і більше половини розгортання периферійного штучного інтелекту виявляється невдалим», — сказав Сачін Катті, старший віце-президент і генеральний менеджер Intel. нещодавно відділ мереж і периферії Говорячи про периферійні обчислення в епоху великих моделей, він сказав. З одного боку, причина в тому, що обладнання застаріле, а периферійних обчислювальних ресурсів недостатньо; з іншого боку, дуже важливо, як використовувати власні унікальні дані для розгортання ШІ. Ці виклики стримають розгортання багатьох периферійних ШІ.

У той же час краща продуктивність генеративного штучного інтелекту в кінцевому підсумку повинна підтримуватися даними.Наразі галузь сподівається забезпечити безпеку даних у генеративному штучному інтелекті, з одного боку, а з іншого боку, вона також сподівається створювати дані джерела рясні та доступні.

Вирішення цих проблем також триває. «Сьогоднішня система великої моделі та система штучного інтелекту сильно залежать від даних і є інтелектуальними системами, керованими даними. Ця система має дуже високі вимоги до об’єму та неупередженості даних. Якщо припустити, що дані дуже упереджені, їх важко ефективно підтримувати. . Розробка системи штучного інтелекту", - сказав Вей Тао, віце-президент і головний спеціаліст з технічної безпеки Ant Group, тому можна побачити, що вже існують інструменти для зворотної перевірки безпеки даних ШІ.

Що стосується розробки джерел даних, нещодавно Шеньчженьська цифрова біржа об’єдналася майже з 50 підрозділами, щоб створити «Альянс відкритих обчислень», а співавторами є Tencent Cloud, Huada Genomics, Yuntian Lifei, Obi Zhongguang і UBTECH, Китай. Unicom Guangdong Branch, Huaao Data та інші підприємства, Shenzhen Artificial Intelligence Society та інші асоціації, National Supercomputing Shenzhen Center та інші мозкові центри та дослідницькі установи. Однією з головних цілей створення Обчислювального альянсу є координація формулювання відповідних стандартів, таких як елементи даних, управління даними, навчальні дані, маркування даних і синтетичні дані навколо високоякісних китайських навчальних даних і мультимодальних навчальних даних , а також сприяти обміну даними для збільшення нових категорій і нових областей, пов’язаних із моделлю.

Проблеми, з якими доводиться стикатися при розробці генеративного штучного інтелекту, неможливо вичерпати словами, і глобальна буря штучного інтелекту, спровокована ChatGPT, не закінчується ChatGPT. Після відкриття нового світу штучного інтелекту велика модель і генеративний штучний інтелект у зародковому стані також виявив багато проблем і викликів, але водночас він надав можливості для досліджень та інновацій у всіх сферах життя.

Індустрія поспішає до генеративного ШІ, що аж ніяк не погано для розвитку штучного інтелекту чи навіть людини.

Переглянути оригінал

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.