Автор: репортер The Paper Хуан Яньхун, стажист Чень Сяоруй
Джерело зображення: створено інструментом Unbounded AI
Технологія Generative AI змінює індустрію штучного інтелекту.Всього за півроку розробка вітчизняних великомасштабних моделей завершила стрибок від технології до продукту, а потім і до бізнесу, і проникла у вертикальні галузі. Під час Всесвітньої конференції зі штучного інтелекту 6 липня газета запросила Ван Даньцзюня, віце-президента Beisen Talent Management Research Institute, Yu Zhonghai, заступника генерального директора відділу досліджень CICC, і Zhang Jie, віце-президента Zhongguancun Kejin Technology, чат-кімната Metaverse для обговорення можливостей бізнес-інновацій під час «появи» великих моделей. Ведучим діалогу був Шао Вень, репортер The Paper.Під час годинного діалогу гості обговорили ряд пов’язаних питань, зокрема:
Як великі моделі загального призначення та великомасштабні моделі вертикального поля знаходять власну цінність у майбутніх бізнес-сценаріях?
Як підприємства можуть скористатися бізнес-можливостями великих моделей? Що є ключовим моментом, щоб скористатися можливістю?
Минуле життя і майбутнє великої моделі
**澎湃科技: Зараз на внутрішньому ринку склалася ситуація «війни сотень моделей». Як ви думаєте, чому вітчизняні великомасштабні моделі розвиваються так швидко? Який вплив це має на ваше поле? **
**Ван Даньцзюнь (віце-президент Beisen Talent Management Research Institute): **З технічної точки зору розробка великих моделей — це не те, що відбувалося за останні два роки. В академічній сфері багато років тому всі почали займатися дослідженнями. Просто зі збільшенням обсягу даних і вдосконаленням рівня технологій за останні роки, особливо після того, як OpenAI випустив ChatGPT, він привернув широку увагу.
Для кожної галузі кожен думає про те, як застосувати таку нову технологію у своїй галузі та як покращити свою бізнес-модель.
Наприклад, наш Науково-дослідний інститут управління талантами Beisen належить до галузі людських ресурсів, а клієнтами, яких ми обслуговуємо, є всі групи підприємств з управління персоналом. Ми вважаємо, що застосування великих моделей у сфері людських ресурсів може мати певну руйнівну цінність у майбутньому, наприклад, воно дійсно може підвищити ефективність роботи кожного; це певною мірою допоможе нашим партнерам, незалежно від того, чи то відділ кадрів, чи працівники Це може краще керувати розвитком співробітників; водночас це також може допомогти компаніям відповісти на багато питань управління людськими ресурсами, включно з тим, що ми часто задаємо під час найму співробітників: хто більше підходить і хто може принести більше переваг. як визначати заробітну плату тощо. Я думаю, що розробка та застосування великих моделей змінить індустрію людських ресурсів за дуже короткий період часу.
**Ю Чжунхай (заступник генерального директора відділу досліджень CICC): **Дін Ван згадав дуже важливий момент, тобто технологія великомасштабних моделей виникла не просто сьогодні. У 2017 році Google написав відому статтю під назвою Attention Is All You Need (увага — це все, що вам потрібно) і запропонував архітектуру трансформатора.
Фактично, практики китайської індустрії штучного інтелекту дуже рано виявили потенціал технології великомасштабних моделей. У 2021 році ми також написали відповідний звіт про дослідження. Тоді ми були шоковані розвитком моделей штучного інтелекту. Тепер спеціальний продукт ChatGPT робить велику модель відомою простим людям. Незалежно від того, розумієтеся ви на технологіях чи ні, ви можете відчути її чарівність, доки граєте в неї, тому велика модель популярна.
Здатність великих моделей так швидко застосовуватися в тисячах галузей також залежить від рівних прав у технологіях, що є дуже важливою концепцією, яку ми висуваємо. Завдяки розвитку спільноти з відкритим кодом і природному поширенню знань багато компаній швидко створили власні великі моделі.
Крім того, я хотів би додати, що цього разу ми бачили, як усе технологічне коло і навіть усе суспільство сформувало спільну силу, тобто «кожен вважає це дуже важливим», що рідко можна побачити в минулому.
**Чжан Цзе (віце-президент Zhongguancun Kejin Technology): **Я думаю, що перший рік великої моделі можна віднести до запуску GPT3 у 2020 році. Чому він так швидко розвивався за останні півроку? Думаю, є три причини:
Перший аспект полягає в тому, що деякі компанії та університети раніше багато накопичували, як-от Baidu, Huawei, Університет Цінхуа тощо, у них були попередньо підготовлені мовні моделі або великі моделі раніше, і останні шість місяців було оновлення версій ітерація для них;
Другий аспект полягає в тому, що різні підприємства, включаючи деякі інвестиційні інститути, збільшили свої інвестиції;
Третій аспект полягає в тому, щоб покладатися на відкритий код.Спільнота відкритого коду спонукала підприємства до запуску різних моделей великих доменів.
Що стосується впливу великих моделей на поле, це двостороння вигода для клієнтів і нас. Zhongguancun Kejin є провідним постачальником розмовних технологічних рішень штучного інтелекту. Велика модель знижує наші витрати на налаштування та розробку різних моделей сцен, що є гарною новиною для нас. Для наших клієнтів зниження вартості інтелектуальних проектів змусило багато малих і середніх підприємств розглянути можливість створення проектів, і весь ринок виріс у розмірах.
**澎湃科技: Нещодавно Tencent Cloud і OpenAI послідовно запропонували великий магазин моделей для індивідуального програмного забезпечення моделей, який дещо схожий на форму магазину програм. Як ви розумієте цю тенденцію? **
**Ван Даньцзюнь:**Незалежно від того, чи є ви інвестором чи практиком у цій галузі, я вважаю, що всі очікують побачити цю тенденцію, оскільки вона спонукає більше людей брати участь у спільному створенні цієї галузі. Ми віримо, що постачальники базових послуг у майбутньому обов’язково будуть тяжіти до моделі магазину, що полегшить наближення до клієнтів. Модель сховища великої моделі також дозволяє користувачам, які отримують послуги, краще використовувати велику модель для створення деяких нових сценаріїв додатків і вартості послуг.
Ю Чжунхай: Насправді це питання, яке дуже хвилює ринок капіталу. Я вважаю, що розробка великих моделей буде більше схожа на китайську публічну хмару та приватну хмару в майбутньому.
У той час публічна хмара фактично називалася IaaS (інфраструктура як послуга, інфраструктура як послуга), а коли йдеться про великі моделі, ми називаємо це MaaS (модель як послуга). Існує відома за кордоном компанія Hugging Face, яка розміщує багато моделей в Інтернеті, і ви можете використовувати різні моделі ШІ, просто викликавши її API (Application Program Interface, інтерфейс прикладного програмування).
Однак є також багато підприємств, яким необхідно розгорнути власну великомасштабну модель і використовувати власні знання, щоб покращити її, щоб виконати власне тонке налаштування через такі вимоги, як відповідність вимогам безпеки та реалізація розділеної сцени. Це може бути схоже на приватну хмару. ринок Китаю..
Загалом кажучи, великі моделі насправді не підходять для безпосереднього використання всіма, включаючи ChatGPT, який фактично упакований у продукт на основі великої моделі, так що кожна звичайна людина може це випробувати. Таким чином, створення додатків на основі великих моделей насправді є дуже широким ринком, який може створити багато бізнес-моделей, таких як цифрові співробітники та концепцію магазину додатків, щойно згадану організатором.
Насправді ChatGPT також розглядається багатьма людьми як портал трафіку. Наскільки я знаю, деякі великі виробники мобільних телефонів також можуть зрештою здійснювати пошук. Тоді це зовсім інше питання. Його доступний ринок буде з підприємства Витрати на ІТ стають витратами на маркетинг. Китайські підприємства можуть витрачати в середньому 1%-3% доходу на ІТ, але можуть витрачати 30% доходу на маркетинг. Отже, коли у вас є трафік, бізнес-модель може сильно змінитися, що дуже цікаво.
Чжан Цзе: Я думаю, що OpenAI і Tencent Cloud мають різні акценти. Можливо, OpenAI все ще зосереджується на базовій великій моделі. Він використовує деяких екологічних партнерів, щоб допомогти їй компенсувати брак точності чи професіоналізму базової великої моделі в деяких фрагментованих сценаріях. Однак Tencent Cloud не робить надмірного акценту на власній базовій моделі, але наголошує на необхідності бути великою моделлю для вертикальних галузей.
Їх різні акценти вказують на спільну проблему, тобто базову велику модель неможливо безпосередньо використовувати в деяких конкретних галузях або сценаріях з високим професіоналізмом, і вона також потребує рівня адаптації. Я думаю, що тут може бути нова бізнес-модель, тобто все більше і більше знань можна буде капіталізувати в майбутньому. Виявляється, коли всі використовують ШІ, технічна парадигма інша. Таким чином, активи, якими кожен може поділитися, - це необроблені дані. Після отримання необроблених даних використовуються різні технічні засоби для їх обробки. Під час цього процесу проміжна форма даних не може торгуватися.
Однак велика модель в основному об’єднує багато завдань штучного інтелекту разом, і вся парадигма дослідження та процес обробки зближуються, що робить багато проміжних продуктів доступними для торгівлі, наприклад дані з мітками, дані для вирівнювання інструкцій, слова підказок та ланцюжок підказок, що складається з фраз підказок. тощо, і навіть роботи чи помічники, навчені певним сценаріям, можуть виконувати деякі транзакції та капіталізуватись. У майбутньому це може стати новою бізнес-моделлю.
Загальна велика модель проти великої моделі у вертикальному полі
**Паперова технологія: Насправді ви троє щойно згадали, що існує два різних бізнес-шляхи: велика модель домену та загальна велика модель. Чи можете ви детальніше розповісти про можливості та проблеми цих двох різних бізнес-моделей? **
Ван Даньцзюнь: У майбутньому бізнес навколо великих моделей обов’язково стане бізнес-екологією, і головною особливістю бізнес-екології є її багатошаровість. Перш за все, деякі виробники будуть надавати базові послуги, оскільки великі моделі потребують бази даних і обчислювальної потужності. Велика модель служить основною системою. Хоча вона має потужні можливості, вона не розуміє знання конкретних доменів, моделей обслуговування та потреб клієнтів.
Разом із цим постають великі макети вертикалей. Деякі з великих моделей у цих вертикальних доменах є власними великими моделями виробників доменів, а деякі навчаються на основі базових великих моделей. З точки зору неспеціаліста, це зробити ці моделі експертом. Наприклад, у фінансовій сфері можуть існувати деякі служби, які допомагають інвесторам приймати бізнес-рішення, а в сфері людських ресурсів можуть існувати служби, які допомагають компаніям приймати рішення щодо талантів.
Може бути багато розділених полів. Ці підрозділи також можуть вимагати накопичення галузі, навчання та розуміння того, як вирішувати проблеми клієнтів, і навіть залучення до рівня взаємодії з користувачем інтерактивного інтерфейсу. Ці накопичення насправді є одними з можливостей магазину програм, про який ми говорили раніше.
Ю Чжунхай: З нашої точки зору, ці два типи ринків насправді дуже різні.
Перш за все, також важливо побудувати хороший маховик даних для загальної великої моделі.
Наприклад, сьогодні я вчу вас грати в настільний теніс і кажу, що ви повинні грати так. Тоді я подаю м’яч, а ти його не ловиш, ти знаєш, що це не правильний спосіб бити. Потім змініть інший шлях, цього разу ви зловите його, ви запам'ятаєте правильний шлях. Тоді я продовжую подавати тобі м’яч, а ти продовжуєш ловити його, поступово налаштовуючи свою м’язову пам’ять, щоб знайти найкращий шлях. Власне, тренування моделі теж є таким процесом. Кожен раз, коли ви спілкуєтеся з ChatGPT, під ним буде ставитися лайк або дизлайк. Або бувають моменти, коли ви нічого не говорите і просто дуже розчаровані, що відновили один. Або, наприклад, кожного разу, коли ви використовуєте Midjourney для малювання, він відображатиме чотири зображення, а потім ви вибираєте третє за замовчуванням, збільшуєте його, завантажуєте його, і він дізнається, що це здається кращим, і піде до цього в майбутньому Напрямок трохи більш упереджений, і модель трохи навчиться. Без зворотного зв’язку з даними модель залишається тут і не може вдосконалюватися. Отже, ми наголошуємо на цьому маховику даних, підкреслюючи позицію картки сцени. Як універсальна велика модель, головне, щоб нею хтось користувався, що також є перевагою Китаю. Китайці люблять сприймати технології, і вони більше сприймають великі моделі. У нас є багато людей, які можуть залишити відгук.
Я вважаю, що для великих моделей домену важливіше ноу-хау (технічне ноу-хау та досвід, необхідні для участі в певній галузі чи виконання певної роботи).
Ключем до моделі великої області є задоволення потреб клієнтів і розуміння ноу-хау клієнтів у певній глибокій області. Такі підприємства, як Zhongguancun Kejin, мають тут свої переваги: вони розуміють ноу-хау замовника та розуміють болючі точки замовника в конкретних польових сценаріях.
**Чжан Цзе: **Дякую за ваше визнання. Я розумію, що загальна велика модель і велика модель домену — це стосунки вгору та вниз за течією, а не конкурентні відносини. Загальна модель є великою та всебічною, а модель домену — це невеликий, але красивий бізнес.
Загальна широкомасштабна модель характеризується «трьома максимумами», тобто високими інвестиціями та високим прибутком, але також високою невизначеністю. Оскільки навчання базової великої моделі вимагає високих вимог щодо алгоритмів, даних і талантів. Наприклад, обчислювальна потужність повинна бути не менше 10 000 кат рівня обчислювальної потужності.
Чому невизначеність така висока? Оскільки виробники, які увійшли до короткого списку, є в основному великими інтернет-компаніями чи технологічними гігантами, технічні вимоги до навчених великих моделей є дуже високими, щоб мати загальні можливості та нові можливості.Якщо ви хочете закріпитися на ринку, ви повинні принаймні вміти запустити, лише вигравши модель з відкритим кодом, вона зможе вижити. На майбутньому ринку, я думаю, буде співіснувати багато базових великих моделей, але їх може бути не надто багато.
Макет домену може бути невеликим, але красивим треком. Навчання моделі великої області не потребує дуже високої обчислювальної потужності. Згідно з нашими експериментами, ітерація моделі великої області займає лише один тиждень. Дві картки можуть міркувати в реальному часі. З точки зору даних, нам все ще потрібно встановити деякі власні порогові значення, що є ефектом маховика даних, про який щойно згадав пан Ю.
Найважливішим моментом змагань є талант. Велика доменна модель зрівняла технологічний ланцюжок усієї галузі. Ваші таланти повинні не лише розуміти алгоритми, але й добре розробляти алгоритми, розуміти сценарії, розуміти бізнес і навіть розуміти дизайн продукту. Необхідно стимулювати комплексні здібності талантів, а потім стимулювати ініціативу та креативність талантів, що є перевіркою організаторських здібностей.
**У якій сфері велика модель найбільш корисна? **
**Паперова технологія: які три найперспективніші напрямки вертикального застосування? **
Юй Чжунхай: Ми розглянули багато напрямків, і найперспективнішим напрямком зараз є AI Answer, це слово, яке ми створили самі, яке відноситься до категорії продуктів. Наприклад, ви сьогодні тестували мене з одного питання і запитали, яку марку коляски краще купити. Я вважаю, що у кожного повинна бути подібна ситуація. Запитайте трьох друзів, прочитайте п'ять статей Сяохуншу, а потім знайдіть десять публікацій в Інтернеті. Нарешті, прочитавши це, я підсумував три моделі, а потім подивився на ціну і прийняв рішення.
Насправді те саме стосується багатьох речей, коли ви запитуєте штучний інтелект. Велика модель має певну пам’ять. Вона знає, що ці речі пов’язані, але у неї будуть галюцинації. Як це виглядає. Тому компанії часто роблять певні запити на основі внутрішньої бази знань, а потім роблять підсумки на основі цих речей. Крім того, є запитання та відповідь, резюме або порівняння на основі документа, наприклад положення про страхування на сотнях сторінок. Або дайте відповідь на основі пошуку. Ми спільно називаємо ці продукти AI Answer. Крім того, ми також приділяємо більше уваги таким можливостям, як робота в офісі та навчальні машини зі штучним інтелектом.
Чжан Цзе: Я думаю, ми можемо розглянути це спочатку за галузями, а потім за сценами. Ідеальною галуззю для великомасштабних моделей домену є галузь із високою щільністю знань, сильною логікою процесів і чутливістю до безпеки та конфіденційності. Наприклад, такі галузі, як фінанси, медичне обслуговування, право та державні справи, можуть бути ідеальними галузями для впровадження великомасштабних моделей домену в майбутньому.
Сцена може бути наділена повноваженнями для внутрішніх співробітників на початку. Наприклад, проведіть кілька тестів на знання, а потім тренування та спаринги. Після розширення повноважень внутрішніх співробітників, давайте подивимося, як надати певні послуги C (клієнтам) або надати можливість торговому персоналу та персоналу обслуговування клієнтів стати помічниками маркетингового обслуговування клієнтів. Коротше кажучи, під час подання заявки ви можете спочатку почати з місця події з відносно високою відмовостійкістю.
Ван Даньцзюнь: Ми також віримо, що в кожному прикладному досвіді великі моделі допомагають нам вирішувати більшість проблем у наукомістких галузях. У сфері To B, наприклад Beisen або Zhongguancun Kejin, справді будуть деякі компанії, які з більшою ймовірністю отримають від цього вигоду. Наприклад, в управлінні людськими ресурсами підприємства всі сподіваються, що велика модель може вирішити деякі нудні та нудні речі для людей, наприклад, відповісти на різні загальні проблеми працівників. Бейсен і Чжунгуаньцунь Кеджін також обговорюють співпрацю в цій сфері, сподіваючись у майбутньому створити деяких цифрових співробітників за допомогою основних засобів великої моделі та відповісти на ці запитання, які, здається, не вимагають людського досвіду та знань.
Крім того, ми виявили, що є деякі важливі сфери, такі як коучинг корпоративного лідерства. Підприємство має кілька рівнів менеджерів, і кожен керівник щодня стикається з різними викликами, але він не має так багато можливостей запитати поради в інших. Ми вважаємо, що AIGC може надати дуже хорошу допомогу в цьому сценарії, і він цілком може вирішити деякі особисті вимоги до конфіденційності.
**澎湃科技:Microsoft нещодавно оголосила про співпрацю з OpenAI, щоб відкрити екологію додатків. Чжунгуаньцунь Кеджін є представником великих виробників додатків у Китаї. Який поточний прогрес у розміщенні та застосуванні продукту? Чи кожна компанія матиме свою ексклюзивну модель у майбутньому? **
Чжан Цзе: Я думаю, не кожній компанії потрібна власна ексклюзивна модель, тому що я вважаю, що технологію великих моделей можна розділити на три рівні: від дрібного до глибокого:
На першому рівні, якщо галузь або підприємство не має стільки знань чи документів, або специфіка самого підприємства недостатня, немає необхідності використовувати спеціальну модель, і можна використовувати загальну велику модель безпосередньо. На загальній великій моделі, відповідно до вимог конкретної сцени, достатньо налаштувати (підказати). Протягом цього періоду підприємствам потрібен оперативний інструмент керування словами з хорошим користувальницьким досвідом і низьким порогом. Деяким бізнес-експертам може знадобитися накопичити деякі корисні підказки в конкретних сценаріях; для більш складних підказок необхідно перетворити деякі підказки на невеликий набір підказок, а потім сформувати ланцюжки між різними наборами, і ланцюжки послідовно логічно достатньо мати інструмент швидкого керування ланцюгом.
Другий шар трохи складніше. Деякі підприємства мають багато фрагментованих знань. Наразі слів підказок або ланцюжків підказок може бути недостатньо. Необхідно додати базу знань поверх загальної великої моделі, щоб керувати низькочастотними та довгими знаннями. Якщо загальна велика модель стикається з конкретними проблемами, перейдіть до бази знань, щоб знайти відповіді. Це технічний шлях загальної великої моделі + база знань + оперативне проектування.
Третій рівень, для підприємств з великим обсягом знань про предметну область, необхідно побудувати модель великої предметної області, ексклюзивну для підприємства, і ввести загальні знання в цій області в мозок великої моделі, яка не тільки підтримує загальні розум і міркування, а також має досвід у цій галузі. Знання та навички роблять великих моделей від студентів гуманітарних факультетів до експертів у галузі. Це шлях великої моделі домену + бази знань домену + оперативного проектування.
Zhongguancun Kejin має певну практику застосування для трьох вищезазначених ситуацій. Деякий час тому ми намагалися вирішити три технічні труднощі, і після вирішення ми сформували два набори програм-помічників. Які три технічні труднощі?
Перше — вирішити проблему галюцинацій, які часто виникають у великих моделей, тобто серйозної нісенітниці. Для цього потрібна база знань у цій галузі, щоб дати великій моделі знати, що коли їй задають запитання, їй потрібно знайти відповідні знання в базі знань. Під час побудови бази знань часто необхідно обробляти документи у форматі форматованого тексту.Для великої моделі необхідно спочатку зрозуміти макет документа, а потім зрозуміти його вміст.
Другий — запобігти проблемі забування під час процесу навчання під час навчання великих моделей у домені. Інакше, коли ви подаєте нові знання в його мозок, він забуде старі знання. Тут будуть використані ефективні технічні засоби тонкого налаштування, щоб він міг не лише отримати оригінальні загальні знання, але й навчитися здоровому глузду в цій галузі.
По-третє, як змусити користувачів використовувати його зручніше та дешевше. Незалежно від того, чи йдеться про велику модель предметної області, базу знань про предметну область чи швидкі слова, це неможливо зробити за одну ніч і потребує постійного зворотного зв’язку та ітерацій. Це вимагає від клієнтів наявності можливостей обслуговування, а дизайн продукту та інженерна упаковка повинні бути зроблені добре на рівень інструменту.
**澎湃科技: Я хотів би запитати пана Ю з точки зору інвестицій, порівняно з інвестиційною логікою в епоху мобільного Інтернету та жорстких технологій, у цьому раунді великомасштабного зростання моделі, основний фокус відбору проектів , включаючи пункти прийняття інвестиційних рішень, що це таке **
**Юй Чжунхай:**Це питання також вивчає капітал. За останні півроку ринок великих моделей також зазнав багато витків еволюції. На початку багато людей розглядали це як тематичну інвестицію. У той час компаніями, пов’язаними зі штучним інтелектом, спекулювали, і всі високо цінували компанії з реальними базовими можливостями великомасштабних моделей. Пізніше з'явилася "Війна сотень моделей". Усі вважали, що велика модель здається надто складною. Вони виявили, що обчислювальна потужність, здається, була виграшем від купівлі лопат у Наггетсів, тому оцінка компаній, пов'язаних з обчислювальною потужністю, зросла багато. У травні та червні цього року ми припустили, що «додатки штучного інтелекту започаткували вибуховий кембрійський період». Багато компаній придумали власні продукти, і застосування ШІ знову почало зростати.
Насправді, ритм інвестицій у великі моделі також поступовий.З самого початку, поки це компанія штучного інтелекту, вона може збільшуватися, а потім вона випустить програму, і тоді всі почнуть досліджувати, чи ця програма чи платять клієнти за це, і чи є реальні замовлення. Я думаю, що, можливо, через рік чи близько того всі задумаються про те, чи є перешкоди для цього застосування та чи є бізнес стійким у довгостроковій перспективі. Насправді ми найбільше оптимістичні щодо рівня додатків.Ми надаємо великого значення підприємствам, які справді можуть поєднувати великі моделі та корпоративні програми, і вони справді можуть створювати цінності.
**The Paper: Наступне запитання до Діна Ванга. З точки зору талантів, велика модель зараз будує нові виробничі відносини співпраці людини та машини. Отже, який вплив це матиме на управління талантами підприємств? **
Ван Даньцзюнь: Це особливо гарне запитання. Оскільки ми бачимо, що на соціальному рівні всі можуть бути дуже зацікавлені в обговоренні «Чи моя робота буде замінена великою моделлю в майбутньому?» Щодо цього питання, я пропоную подивитися на нього з двох аспектів:
З одного боку, всі більше обговорювали те, що здатність великомасштабних моделей стає все сильнішою, а застосування вертикальних полів стає все глибшим і глибшим, що може замінити роботу багатьох загальних працівників у майбутньому. В останні роки, навіть без фону масштабної розробки моделі, всі дуже стурбовані зниженням витрат і підвищенням ефективності, що передбачає частку витрат на оплату праці на підприємствах. Якщо деякі нові технології можна використовувати для зниження витрат на оплату праці, це буде дуже цінно для підприємства, що є важливою причиною його сталого розвитку.
З іншого боку, поява великих моделей і поява більш вертикальних польових інструментів у майбутньому стане благословенням для співробітників. Позитивним є те, що якщо працівники зможуть краще використовувати співпрацю людини і машини, це може створити більшу цінність для компанії.
Ми прогнозуємо, що в майбутньому будуть певні зміни в організаційній формі. Зараз більшість компаній мають функціональну структуру. Різні функції обслуговують одних і тих самих клієнтів. Існує багато проблем співпраці та зв’язку між функціями, що є великим споживанням для компанії. Але в майбутньому, коли окремі співробітники або групи матимуть всебічні можливості за допомогою інструментів, організаційна одиниця неминуче стане меншою, і вона стане більш спритною, гнучкою та чуйною.
**Paper Technology: я хотів би запитати вас трьох, які можливості найбільше потрібні компаніям у контексті війни сотень моделей? **
**Чжан Цзе: **Для основних виробників великомасштабних моделей найбільше їм потрібні потужні та унікальні технічні можливості. Щоб перевершити широкомасштабні моделі з відкритим кодом, а потім мати деякі унікальні технології в мультимодальних або складні міркування пол. Для виробників великомасштабних моделей у цій галузі найбільше потрібні складні таланти, а організаторські навички дуже важливі. Тому що необхідно дати повну свободу ініціативі та творчості талантів, підключити його до передових бізнес-можливостей і дати йому знати, що потрібно клієнтам. Крім того, повинні бути певні інженерні можливості та алгоритмічні можливості.
Юй Чжунхай: Я вважаю, що дані дуже важливі, особливо для компаній, які хочуть використовувати великі моделі, дані дійсно важливі. Насправді дані незабаром стануть для нас перешкодою. Такі компанії, як Zhongguancun Kejin, які надають програми великомасштабних моделей, мають найбільшу перевагу в даних.
**Ван Даньцзюнь: **Насправді, для переважної більшості підприємств більш імовірно, що вони будуть споживачами великих моделей у майбутньому, а не творцями великих моделей. Активне впровадження великих моделей може значно прискорити їхній процес цифрового керування . І організаціям, і окремим особам може знадобитися прийняти зміни. Керівники на всіх рівнях повинні підвищити свою обізнаність щодо прийняття цієї нової можливості, а співробітники повинні підтримувати постійну здатність до самостійного навчання.
**Паперова технологія: у цьому процесі підприємства у вертикальній сфері мають перевагу галузевого ноу-хау. Чи легше їм пройти через карткові точки великих даних моделі? **
Чжан Цзе: Я вважаю, що галузеві ноу-хау потрібно розглянути детально, і може бути кілька форм, які потребують особливої уваги.
Найбільш очевидною формою галузевого ноу-хау є деякі дані в документах, які є символічними виразами. Як викопувати (підказувати слова) чи підказувати ланцюжки з документа – це проблема, яка потребує вирішення на даному етапі. Багато компаній мають велику кількість документів, і багато з цих документів у форматі PPT або PDF. Необхідно розуміти як його формат, так і зміст.
Окрім ноу-хау цього типу галузі, існують також знання, приховані в головах галузевих експертів або сценаріїв. Йому потрібно дати інструмент, який можна коротко описати словами. Шаблоном є галузь ноу-хау з більшою щільністю.
Існує також відносно прихований тип галузевого ноу-хау, який є колективною мудрістю, прихованою в системних журналах. Після видобутку цих журналів можна перетворити розрізнені знання на структуровані ланцюгові знання. Потім із тисяч ланцюжків це узагальнюється та перетворюється на найкращу практику за конкретним сценарієм. Наприклад, продавці здійснюють багато телефонних дзвінків щодня, і щодня накопичуються мільйони журналів розмов. Завдяки адаптації відповідно до різних результатів, таких як виконання замовлення, порядок потоку або завершення дзвінка, найкращі навички мовлення для маркетингу нових продукти можуть випадати в осад.практ.
Ці три типи питань насправді є дуже хорошим галузевим ноу-хау. Тут також є деякі технічні проблеми, наприклад, як викопати слова підказки та ланцюжки підказок із документів і журналів. doc2 і log2 є центром дослідження, у яке варто інвестувати.
Юй Чжунхай: Насправді Чжан Цзе завжди мав вислів, який мене глибоко вразив.Він сказав, що запис орбіт восьми планет Сонячної системи за десятки мільйонів років не такий хороший, як абстрактний закон сила тяжіння, яка може краще пояснити речі. Природа.
Я вважаю, що це ноу-хау. Компанії у вертикальних сферах мають великий досвід у суміжних галузях. Дозвольте навести вам приклад. Після того, як штучний інтелект став популярним, усі сказали, що є нова професія під назвою інженер із річною зарплатою в один мільйон.
Це інженер пішов писати. Чому ж вони такі цінні? Я також використовую інструменти малювання штучного інтелекту. Одного разу я хотів намалювати людину в костюмі, але перепробував багато ключових слів, і це не спрацювало. Пізніше я ввів «краватка», і людина відразу одягнула костюм, і ви побачите, що це чарівне слово.
Велика модель трохи схожа на ймовірнісну гру. Насправді вона має багато попередніх ймовірностей. У цій сцені краватка є дуже важливим словом, яке відповідає костюму. І інженер знає, які ключові слова можуть заважати моделі, і він знає, які речі ми хочемо написати.Це його цінність. Тоді, якщо ми поставимо це питання в сценарій застосування, це фактично вартість компаній у вертикальних сферах. Він розуміє як штучний інтелект, так і галузеві ноу-хау.
Ван Даньцзюнь: Наразі здається, що окрім основних великих модельних компаній, вертикальні компанії є другою партією компаній, на які всі звертатимуть пильну увагу на ринку. Я думаю, що це буде дуже складно для них у наступний період часу. Досвід компаній у вертикальних сферах не обов’язково може бути безпосередньо трансформований у нову творчість під благословенням нових технологій. Потрібно витратити більше часу, щоб спочатку навчитися, щоб зрозуміти, яка основна логіка роботи великої моделі, щоб дізнатися, як це може мені допомогти, навіть щоб допомогти мені видобути наші знання або допомогти нам надавати послуги клієнтам. Я думаю, що ще деякий час вони першими зіткнуться з цим викликом. На цій основі знайдіть нові можливості для створення цінності для клієнтів на основі цих моделей.
**Паперова технологія: нещодавно з’явилися нові тенденції, наприклад, уповільнення кількості відвідувачів ChatGPT. Насправді він не існував як супервхід. Існує думка, що ChatGPT не може представляти майбутнє GPT, а лише продукт, представлений на ринку OpenAI і Microsoft. Що ви троє думаєте про цю точку зору? **
Юй Чжунхай: Ця точка зору справді досить цікава. Особисто я налаштований відносно оптимістично, тому що я людина, яка часто використовує масштабні продукти. І я хотів би додати, що поточний ChatGPT не є його остаточною формою. Я думаю, що Google Assistant (Google Assistant) у системі Android наступного покоління від Google буде підтримуватися власною великою моделлю, тому що це також дуже важливий вхід у трафік.
Ван Даньцзюнь: Для багатьох людей у галузі всі дуже оптимістичні. Як новий продукт, на цьому етапі розробки, природно, буде певна диференціація. Кінцеві користувачі зацікавляться такими інструментами, охоче спробують і продовжуватимуть їх використовувати. Навіть якщо частота використання зменшується, а ступінь уваги знижується, поведінку користувачів важко змінити.
Чжан Цзе: Я думаю, що рано чи пізно відбудеться уповільнення темпів зростання ChatGPT. Зрештою, трафік має стелю. Рано чи пізно трафік досягне піку або ентузіазм громадськості щодо прикладних сценаріїв спілкування в чаті впаде.Зрештою, спілкування в чаті не є високочастотним жорстким попитом, але воно приносить вам особливо гарне натхнення.
З одного боку, навколо Chat є багато програм, таких як генерування зображень, відео, звітів, PPT тощо через чат, наприклад ChatDoc, ChatPdf і ChatBI. Іншим сценарієм є щойно згадана велика доменна модель, як-от фінансовий GPT, юридичний GPT і медичний GPT.Все це може стати новим бізнесом у майбутньому.
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Можливості для бізнесу під час «появи» великих моделей: хто переможе у «Війні сотень моделей»
Джерело: The Paper
Автор: репортер The Paper Хуан Яньхун, стажист Чень Сяоруй
Технологія Generative AI змінює індустрію штучного інтелекту.Всього за півроку розробка вітчизняних великомасштабних моделей завершила стрибок від технології до продукту, а потім і до бізнесу, і проникла у вертикальні галузі. Під час Всесвітньої конференції зі штучного інтелекту 6 липня газета запросила Ван Даньцзюня, віце-президента Beisen Talent Management Research Institute, Yu Zhonghai, заступника генерального директора відділу досліджень CICC, і Zhang Jie, віце-президента Zhongguancun Kejin Technology, чат-кімната Metaverse для обговорення можливостей бізнес-інновацій під час «появи» великих моделей. Ведучим діалогу був Шао Вень, репортер The Paper.Під час годинного діалогу гості обговорили ряд пов’язаних питань, зокрема:
Як великі моделі загального призначення та великомасштабні моделі вертикального поля знаходять власну цінність у майбутніх бізнес-сценаріях?
Як підприємства можуть скористатися бізнес-можливостями великих моделей? Що є ключовим моментом, щоб скористатися можливістю?
Минуле життя і майбутнє великої моделі
**澎湃科技: Зараз на внутрішньому ринку склалася ситуація «війни сотень моделей». Як ви думаєте, чому вітчизняні великомасштабні моделі розвиваються так швидко? Який вплив це має на ваше поле? **
**Ван Даньцзюнь (віце-президент Beisen Talent Management Research Institute): **З технічної точки зору розробка великих моделей — це не те, що відбувалося за останні два роки. В академічній сфері багато років тому всі почали займатися дослідженнями. Просто зі збільшенням обсягу даних і вдосконаленням рівня технологій за останні роки, особливо після того, як OpenAI випустив ChatGPT, він привернув широку увагу.
Для кожної галузі кожен думає про те, як застосувати таку нову технологію у своїй галузі та як покращити свою бізнес-модель.
Наприклад, наш Науково-дослідний інститут управління талантами Beisen належить до галузі людських ресурсів, а клієнтами, яких ми обслуговуємо, є всі групи підприємств з управління персоналом. Ми вважаємо, що застосування великих моделей у сфері людських ресурсів може мати певну руйнівну цінність у майбутньому, наприклад, воно дійсно може підвищити ефективність роботи кожного; це певною мірою допоможе нашим партнерам, незалежно від того, чи то відділ кадрів, чи працівники Це може краще керувати розвитком співробітників; водночас це також може допомогти компаніям відповісти на багато питань управління людськими ресурсами, включно з тим, що ми часто задаємо під час найму співробітників: хто більше підходить і хто може принести більше переваг. як визначати заробітну плату тощо. Я думаю, що розробка та застосування великих моделей змінить індустрію людських ресурсів за дуже короткий період часу.
**Ю Чжунхай (заступник генерального директора відділу досліджень CICC): **Дін Ван згадав дуже важливий момент, тобто технологія великомасштабних моделей виникла не просто сьогодні. У 2017 році Google написав відому статтю під назвою Attention Is All You Need (увага — це все, що вам потрібно) і запропонував архітектуру трансформатора.
Фактично, практики китайської індустрії штучного інтелекту дуже рано виявили потенціал технології великомасштабних моделей. У 2021 році ми також написали відповідний звіт про дослідження. Тоді ми були шоковані розвитком моделей штучного інтелекту. Тепер спеціальний продукт ChatGPT робить велику модель відомою простим людям. Незалежно від того, розумієтеся ви на технологіях чи ні, ви можете відчути її чарівність, доки граєте в неї, тому велика модель популярна.
Здатність великих моделей так швидко застосовуватися в тисячах галузей також залежить від рівних прав у технологіях, що є дуже важливою концепцією, яку ми висуваємо. Завдяки розвитку спільноти з відкритим кодом і природному поширенню знань багато компаній швидко створили власні великі моделі.
Крім того, я хотів би додати, що цього разу ми бачили, як усе технологічне коло і навіть усе суспільство сформувало спільну силу, тобто «кожен вважає це дуже важливим», що рідко можна побачити в минулому.
**Чжан Цзе (віце-президент Zhongguancun Kejin Technology): **Я думаю, що перший рік великої моделі можна віднести до запуску GPT3 у 2020 році. Чому він так швидко розвивався за останні півроку? Думаю, є три причини:
Перший аспект полягає в тому, що деякі компанії та університети раніше багато накопичували, як-от Baidu, Huawei, Університет Цінхуа тощо, у них були попередньо підготовлені мовні моделі або великі моделі раніше, і останні шість місяців було оновлення версій ітерація для них;
Другий аспект полягає в тому, що різні підприємства, включаючи деякі інвестиційні інститути, збільшили свої інвестиції;
Третій аспект полягає в тому, щоб покладатися на відкритий код.Спільнота відкритого коду спонукала підприємства до запуску різних моделей великих доменів.
Що стосується впливу великих моделей на поле, це двостороння вигода для клієнтів і нас. Zhongguancun Kejin є провідним постачальником розмовних технологічних рішень штучного інтелекту. Велика модель знижує наші витрати на налаштування та розробку різних моделей сцен, що є гарною новиною для нас. Для наших клієнтів зниження вартості інтелектуальних проектів змусило багато малих і середніх підприємств розглянути можливість створення проектів, і весь ринок виріс у розмірах.
**澎湃科技: Нещодавно Tencent Cloud і OpenAI послідовно запропонували великий магазин моделей для індивідуального програмного забезпечення моделей, який дещо схожий на форму магазину програм. Як ви розумієте цю тенденцію? **
**Ван Даньцзюнь:**Незалежно від того, чи є ви інвестором чи практиком у цій галузі, я вважаю, що всі очікують побачити цю тенденцію, оскільки вона спонукає більше людей брати участь у спільному створенні цієї галузі. Ми віримо, що постачальники базових послуг у майбутньому обов’язково будуть тяжіти до моделі магазину, що полегшить наближення до клієнтів. Модель сховища великої моделі також дозволяє користувачам, які отримують послуги, краще використовувати велику модель для створення деяких нових сценаріїв додатків і вартості послуг.
Ю Чжунхай: Насправді це питання, яке дуже хвилює ринок капіталу. Я вважаю, що розробка великих моделей буде більше схожа на китайську публічну хмару та приватну хмару в майбутньому.
У той час публічна хмара фактично називалася IaaS (інфраструктура як послуга, інфраструктура як послуга), а коли йдеться про великі моделі, ми називаємо це MaaS (модель як послуга). Існує відома за кордоном компанія Hugging Face, яка розміщує багато моделей в Інтернеті, і ви можете використовувати різні моделі ШІ, просто викликавши її API (Application Program Interface, інтерфейс прикладного програмування).
Однак є також багато підприємств, яким необхідно розгорнути власну великомасштабну модель і використовувати власні знання, щоб покращити її, щоб виконати власне тонке налаштування через такі вимоги, як відповідність вимогам безпеки та реалізація розділеної сцени. Це може бути схоже на приватну хмару. ринок Китаю..
Загалом кажучи, великі моделі насправді не підходять для безпосереднього використання всіма, включаючи ChatGPT, який фактично упакований у продукт на основі великої моделі, так що кожна звичайна людина може це випробувати. Таким чином, створення додатків на основі великих моделей насправді є дуже широким ринком, який може створити багато бізнес-моделей, таких як цифрові співробітники та концепцію магазину додатків, щойно згадану організатором.
Насправді ChatGPT також розглядається багатьма людьми як портал трафіку. Наскільки я знаю, деякі великі виробники мобільних телефонів також можуть зрештою здійснювати пошук. Тоді це зовсім інше питання. Його доступний ринок буде з підприємства Витрати на ІТ стають витратами на маркетинг. Китайські підприємства можуть витрачати в середньому 1%-3% доходу на ІТ, але можуть витрачати 30% доходу на маркетинг. Отже, коли у вас є трафік, бізнес-модель може сильно змінитися, що дуже цікаво.
Чжан Цзе: Я думаю, що OpenAI і Tencent Cloud мають різні акценти. Можливо, OpenAI все ще зосереджується на базовій великій моделі. Він використовує деяких екологічних партнерів, щоб допомогти їй компенсувати брак точності чи професіоналізму базової великої моделі в деяких фрагментованих сценаріях. Однак Tencent Cloud не робить надмірного акценту на власній базовій моделі, але наголошує на необхідності бути великою моделлю для вертикальних галузей.
Їх різні акценти вказують на спільну проблему, тобто базову велику модель неможливо безпосередньо використовувати в деяких конкретних галузях або сценаріях з високим професіоналізмом, і вона також потребує рівня адаптації. Я думаю, що тут може бути нова бізнес-модель, тобто все більше і більше знань можна буде капіталізувати в майбутньому. Виявляється, коли всі використовують ШІ, технічна парадигма інша. Таким чином, активи, якими кожен може поділитися, - це необроблені дані. Після отримання необроблених даних використовуються різні технічні засоби для їх обробки. Під час цього процесу проміжна форма даних не може торгуватися.
Однак велика модель в основному об’єднує багато завдань штучного інтелекту разом, і вся парадигма дослідження та процес обробки зближуються, що робить багато проміжних продуктів доступними для торгівлі, наприклад дані з мітками, дані для вирівнювання інструкцій, слова підказок та ланцюжок підказок, що складається з фраз підказок. тощо, і навіть роботи чи помічники, навчені певним сценаріям, можуть виконувати деякі транзакції та капіталізуватись. У майбутньому це може стати новою бізнес-моделлю.
Загальна велика модель проти великої моделі у вертикальному полі
**Паперова технологія: Насправді ви троє щойно згадали, що існує два різних бізнес-шляхи: велика модель домену та загальна велика модель. Чи можете ви детальніше розповісти про можливості та проблеми цих двох різних бізнес-моделей? **
Ван Даньцзюнь: У майбутньому бізнес навколо великих моделей обов’язково стане бізнес-екологією, і головною особливістю бізнес-екології є її багатошаровість. Перш за все, деякі виробники будуть надавати базові послуги, оскільки великі моделі потребують бази даних і обчислювальної потужності. Велика модель служить основною системою. Хоча вона має потужні можливості, вона не розуміє знання конкретних доменів, моделей обслуговування та потреб клієнтів.
Разом із цим постають великі макети вертикалей. Деякі з великих моделей у цих вертикальних доменах є власними великими моделями виробників доменів, а деякі навчаються на основі базових великих моделей. З точки зору неспеціаліста, це зробити ці моделі експертом. Наприклад, у фінансовій сфері можуть існувати деякі служби, які допомагають інвесторам приймати бізнес-рішення, а в сфері людських ресурсів можуть існувати служби, які допомагають компаніям приймати рішення щодо талантів.
Може бути багато розділених полів. Ці підрозділи також можуть вимагати накопичення галузі, навчання та розуміння того, як вирішувати проблеми клієнтів, і навіть залучення до рівня взаємодії з користувачем інтерактивного інтерфейсу. Ці накопичення насправді є одними з можливостей магазину програм, про який ми говорили раніше.
Ю Чжунхай: З нашої точки зору, ці два типи ринків насправді дуже різні.
Перш за все, також важливо побудувати хороший маховик даних для загальної великої моделі.
Наприклад, сьогодні я вчу вас грати в настільний теніс і кажу, що ви повинні грати так. Тоді я подаю м’яч, а ти його не ловиш, ти знаєш, що це не правильний спосіб бити. Потім змініть інший шлях, цього разу ви зловите його, ви запам'ятаєте правильний шлях. Тоді я продовжую подавати тобі м’яч, а ти продовжуєш ловити його, поступово налаштовуючи свою м’язову пам’ять, щоб знайти найкращий шлях. Власне, тренування моделі теж є таким процесом. Кожен раз, коли ви спілкуєтеся з ChatGPT, під ним буде ставитися лайк або дизлайк. Або бувають моменти, коли ви нічого не говорите і просто дуже розчаровані, що відновили один. Або, наприклад, кожного разу, коли ви використовуєте Midjourney для малювання, він відображатиме чотири зображення, а потім ви вибираєте третє за замовчуванням, збільшуєте його, завантажуєте його, і він дізнається, що це здається кращим, і піде до цього в майбутньому Напрямок трохи більш упереджений, і модель трохи навчиться. Без зворотного зв’язку з даними модель залишається тут і не може вдосконалюватися. Отже, ми наголошуємо на цьому маховику даних, підкреслюючи позицію картки сцени. Як універсальна велика модель, головне, щоб нею хтось користувався, що також є перевагою Китаю. Китайці люблять сприймати технології, і вони більше сприймають великі моделі. У нас є багато людей, які можуть залишити відгук.
Я вважаю, що для великих моделей домену важливіше ноу-хау (технічне ноу-хау та досвід, необхідні для участі в певній галузі чи виконання певної роботи).
Ключем до моделі великої області є задоволення потреб клієнтів і розуміння ноу-хау клієнтів у певній глибокій області. Такі підприємства, як Zhongguancun Kejin, мають тут свої переваги: вони розуміють ноу-хау замовника та розуміють болючі точки замовника в конкретних польових сценаріях.
**Чжан Цзе: **Дякую за ваше визнання. Я розумію, що загальна велика модель і велика модель домену — це стосунки вгору та вниз за течією, а не конкурентні відносини. Загальна модель є великою та всебічною, а модель домену — це невеликий, але красивий бізнес.
Загальна широкомасштабна модель характеризується «трьома максимумами», тобто високими інвестиціями та високим прибутком, але також високою невизначеністю. Оскільки навчання базової великої моделі вимагає високих вимог щодо алгоритмів, даних і талантів. Наприклад, обчислювальна потужність повинна бути не менше 10 000 кат рівня обчислювальної потужності.
Чому невизначеність така висока? Оскільки виробники, які увійшли до короткого списку, є в основному великими інтернет-компаніями чи технологічними гігантами, технічні вимоги до навчених великих моделей є дуже високими, щоб мати загальні можливості та нові можливості.Якщо ви хочете закріпитися на ринку, ви повинні принаймні вміти запустити, лише вигравши модель з відкритим кодом, вона зможе вижити. На майбутньому ринку, я думаю, буде співіснувати багато базових великих моделей, але їх може бути не надто багато.
Макет домену може бути невеликим, але красивим треком. Навчання моделі великої області не потребує дуже високої обчислювальної потужності. Згідно з нашими експериментами, ітерація моделі великої області займає лише один тиждень. Дві картки можуть міркувати в реальному часі. З точки зору даних, нам все ще потрібно встановити деякі власні порогові значення, що є ефектом маховика даних, про який щойно згадав пан Ю.
Найважливішим моментом змагань є талант. Велика доменна модель зрівняла технологічний ланцюжок усієї галузі. Ваші таланти повинні не лише розуміти алгоритми, але й добре розробляти алгоритми, розуміти сценарії, розуміти бізнес і навіть розуміти дизайн продукту. Необхідно стимулювати комплексні здібності талантів, а потім стимулювати ініціативу та креативність талантів, що є перевіркою організаторських здібностей.
**У якій сфері велика модель найбільш корисна? **
**Паперова технологія: які три найперспективніші напрямки вертикального застосування? **
Юй Чжунхай: Ми розглянули багато напрямків, і найперспективнішим напрямком зараз є AI Answer, це слово, яке ми створили самі, яке відноситься до категорії продуктів. Наприклад, ви сьогодні тестували мене з одного питання і запитали, яку марку коляски краще купити. Я вважаю, що у кожного повинна бути подібна ситуація. Запитайте трьох друзів, прочитайте п'ять статей Сяохуншу, а потім знайдіть десять публікацій в Інтернеті. Нарешті, прочитавши це, я підсумував три моделі, а потім подивився на ціну і прийняв рішення.
Насправді те саме стосується багатьох речей, коли ви запитуєте штучний інтелект. Велика модель має певну пам’ять. Вона знає, що ці речі пов’язані, але у неї будуть галюцинації. Як це виглядає. Тому компанії часто роблять певні запити на основі внутрішньої бази знань, а потім роблять підсумки на основі цих речей. Крім того, є запитання та відповідь, резюме або порівняння на основі документа, наприклад положення про страхування на сотнях сторінок. Або дайте відповідь на основі пошуку. Ми спільно називаємо ці продукти AI Answer. Крім того, ми також приділяємо більше уваги таким можливостям, як робота в офісі та навчальні машини зі штучним інтелектом.
Чжан Цзе: Я думаю, ми можемо розглянути це спочатку за галузями, а потім за сценами. Ідеальною галуззю для великомасштабних моделей домену є галузь із високою щільністю знань, сильною логікою процесів і чутливістю до безпеки та конфіденційності. Наприклад, такі галузі, як фінанси, медичне обслуговування, право та державні справи, можуть бути ідеальними галузями для впровадження великомасштабних моделей домену в майбутньому.
Сцена може бути наділена повноваженнями для внутрішніх співробітників на початку. Наприклад, проведіть кілька тестів на знання, а потім тренування та спаринги. Після розширення повноважень внутрішніх співробітників, давайте подивимося, як надати певні послуги C (клієнтам) або надати можливість торговому персоналу та персоналу обслуговування клієнтів стати помічниками маркетингового обслуговування клієнтів. Коротше кажучи, під час подання заявки ви можете спочатку почати з місця події з відносно високою відмовостійкістю.
Ван Даньцзюнь: Ми також віримо, що в кожному прикладному досвіді великі моделі допомагають нам вирішувати більшість проблем у наукомістких галузях. У сфері To B, наприклад Beisen або Zhongguancun Kejin, справді будуть деякі компанії, які з більшою ймовірністю отримають від цього вигоду. Наприклад, в управлінні людськими ресурсами підприємства всі сподіваються, що велика модель може вирішити деякі нудні та нудні речі для людей, наприклад, відповісти на різні загальні проблеми працівників. Бейсен і Чжунгуаньцунь Кеджін також обговорюють співпрацю в цій сфері, сподіваючись у майбутньому створити деяких цифрових співробітників за допомогою основних засобів великої моделі та відповісти на ці запитання, які, здається, не вимагають людського досвіду та знань.
Крім того, ми виявили, що є деякі важливі сфери, такі як коучинг корпоративного лідерства. Підприємство має кілька рівнів менеджерів, і кожен керівник щодня стикається з різними викликами, але він не має так багато можливостей запитати поради в інших. Ми вважаємо, що AIGC може надати дуже хорошу допомогу в цьому сценарії, і він цілком може вирішити деякі особисті вимоги до конфіденційності.
**澎湃科技:Microsoft нещодавно оголосила про співпрацю з OpenAI, щоб відкрити екологію додатків. Чжунгуаньцунь Кеджін є представником великих виробників додатків у Китаї. Який поточний прогрес у розміщенні та застосуванні продукту? Чи кожна компанія матиме свою ексклюзивну модель у майбутньому? **
Чжан Цзе: Я думаю, не кожній компанії потрібна власна ексклюзивна модель, тому що я вважаю, що технологію великих моделей можна розділити на три рівні: від дрібного до глибокого:
На першому рівні, якщо галузь або підприємство не має стільки знань чи документів, або специфіка самого підприємства недостатня, немає необхідності використовувати спеціальну модель, і можна використовувати загальну велику модель безпосередньо. На загальній великій моделі, відповідно до вимог конкретної сцени, достатньо налаштувати (підказати). Протягом цього періоду підприємствам потрібен оперативний інструмент керування словами з хорошим користувальницьким досвідом і низьким порогом. Деяким бізнес-експертам може знадобитися накопичити деякі корисні підказки в конкретних сценаріях; для більш складних підказок необхідно перетворити деякі підказки на невеликий набір підказок, а потім сформувати ланцюжки між різними наборами, і ланцюжки послідовно логічно достатньо мати інструмент швидкого керування ланцюгом.
Другий шар трохи складніше. Деякі підприємства мають багато фрагментованих знань. Наразі слів підказок або ланцюжків підказок може бути недостатньо. Необхідно додати базу знань поверх загальної великої моделі, щоб керувати низькочастотними та довгими знаннями. Якщо загальна велика модель стикається з конкретними проблемами, перейдіть до бази знань, щоб знайти відповіді. Це технічний шлях загальної великої моделі + база знань + оперативне проектування.
Третій рівень, для підприємств з великим обсягом знань про предметну область, необхідно побудувати модель великої предметної області, ексклюзивну для підприємства, і ввести загальні знання в цій області в мозок великої моделі, яка не тільки підтримує загальні розум і міркування, а також має досвід у цій галузі. Знання та навички роблять великих моделей від студентів гуманітарних факультетів до експертів у галузі. Це шлях великої моделі домену + бази знань домену + оперативного проектування.
Zhongguancun Kejin має певну практику застосування для трьох вищезазначених ситуацій. Деякий час тому ми намагалися вирішити три технічні труднощі, і після вирішення ми сформували два набори програм-помічників. Які три технічні труднощі?
Перше — вирішити проблему галюцинацій, які часто виникають у великих моделей, тобто серйозної нісенітниці. Для цього потрібна база знань у цій галузі, щоб дати великій моделі знати, що коли їй задають запитання, їй потрібно знайти відповідні знання в базі знань. Під час побудови бази знань часто необхідно обробляти документи у форматі форматованого тексту.Для великої моделі необхідно спочатку зрозуміти макет документа, а потім зрозуміти його вміст.
Другий — запобігти проблемі забування під час процесу навчання під час навчання великих моделей у домені. Інакше, коли ви подаєте нові знання в його мозок, він забуде старі знання. Тут будуть використані ефективні технічні засоби тонкого налаштування, щоб він міг не лише отримати оригінальні загальні знання, але й навчитися здоровому глузду в цій галузі.
По-третє, як змусити користувачів використовувати його зручніше та дешевше. Незалежно від того, чи йдеться про велику модель предметної області, базу знань про предметну область чи швидкі слова, це неможливо зробити за одну ніч і потребує постійного зворотного зв’язку та ітерацій. Це вимагає від клієнтів наявності можливостей обслуговування, а дизайн продукту та інженерна упаковка повинні бути зроблені добре на рівень інструменту.
**澎湃科技: Я хотів би запитати пана Ю з точки зору інвестицій, порівняно з інвестиційною логікою в епоху мобільного Інтернету та жорстких технологій, у цьому раунді великомасштабного зростання моделі, основний фокус відбору проектів , включаючи пункти прийняття інвестиційних рішень, що це таке **
**Юй Чжунхай:**Це питання також вивчає капітал. За останні півроку ринок великих моделей також зазнав багато витків еволюції. На початку багато людей розглядали це як тематичну інвестицію. У той час компаніями, пов’язаними зі штучним інтелектом, спекулювали, і всі високо цінували компанії з реальними базовими можливостями великомасштабних моделей. Пізніше з'явилася "Війна сотень моделей". Усі вважали, що велика модель здається надто складною. Вони виявили, що обчислювальна потужність, здається, була виграшем від купівлі лопат у Наггетсів, тому оцінка компаній, пов'язаних з обчислювальною потужністю, зросла багато. У травні та червні цього року ми припустили, що «додатки штучного інтелекту започаткували вибуховий кембрійський період». Багато компаній придумали власні продукти, і застосування ШІ знову почало зростати.
Насправді, ритм інвестицій у великі моделі також поступовий.З самого початку, поки це компанія штучного інтелекту, вона може збільшуватися, а потім вона випустить програму, і тоді всі почнуть досліджувати, чи ця програма чи платять клієнти за це, і чи є реальні замовлення. Я думаю, що, можливо, через рік чи близько того всі задумаються про те, чи є перешкоди для цього застосування та чи є бізнес стійким у довгостроковій перспективі. Насправді ми найбільше оптимістичні щодо рівня додатків.Ми надаємо великого значення підприємствам, які справді можуть поєднувати великі моделі та корпоративні програми, і вони справді можуть створювати цінності.
**The Paper: Наступне запитання до Діна Ванга. З точки зору талантів, велика модель зараз будує нові виробничі відносини співпраці людини та машини. Отже, який вплив це матиме на управління талантами підприємств? **
Ван Даньцзюнь: Це особливо гарне запитання. Оскільки ми бачимо, що на соціальному рівні всі можуть бути дуже зацікавлені в обговоренні «Чи моя робота буде замінена великою моделлю в майбутньому?» Щодо цього питання, я пропоную подивитися на нього з двох аспектів:
З одного боку, всі більше обговорювали те, що здатність великомасштабних моделей стає все сильнішою, а застосування вертикальних полів стає все глибшим і глибшим, що може замінити роботу багатьох загальних працівників у майбутньому. В останні роки, навіть без фону масштабної розробки моделі, всі дуже стурбовані зниженням витрат і підвищенням ефективності, що передбачає частку витрат на оплату праці на підприємствах. Якщо деякі нові технології можна використовувати для зниження витрат на оплату праці, це буде дуже цінно для підприємства, що є важливою причиною його сталого розвитку.
З іншого боку, поява великих моделей і поява більш вертикальних польових інструментів у майбутньому стане благословенням для співробітників. Позитивним є те, що якщо працівники зможуть краще використовувати співпрацю людини і машини, це може створити більшу цінність для компанії.
Ми прогнозуємо, що в майбутньому будуть певні зміни в організаційній формі. Зараз більшість компаній мають функціональну структуру. Різні функції обслуговують одних і тих самих клієнтів. Існує багато проблем співпраці та зв’язку між функціями, що є великим споживанням для компанії. Але в майбутньому, коли окремі співробітники або групи матимуть всебічні можливості за допомогою інструментів, організаційна одиниця неминуче стане меншою, і вона стане більш спритною, гнучкою та чуйною.
**Paper Technology: я хотів би запитати вас трьох, які можливості найбільше потрібні компаніям у контексті війни сотень моделей? **
**Чжан Цзе: **Для основних виробників великомасштабних моделей найбільше їм потрібні потужні та унікальні технічні можливості. Щоб перевершити широкомасштабні моделі з відкритим кодом, а потім мати деякі унікальні технології в мультимодальних або складні міркування пол. Для виробників великомасштабних моделей у цій галузі найбільше потрібні складні таланти, а організаторські навички дуже важливі. Тому що необхідно дати повну свободу ініціативі та творчості талантів, підключити його до передових бізнес-можливостей і дати йому знати, що потрібно клієнтам. Крім того, повинні бути певні інженерні можливості та алгоритмічні можливості.
Юй Чжунхай: Я вважаю, що дані дуже важливі, особливо для компаній, які хочуть використовувати великі моделі, дані дійсно важливі. Насправді дані незабаром стануть для нас перешкодою. Такі компанії, як Zhongguancun Kejin, які надають програми великомасштабних моделей, мають найбільшу перевагу в даних.
**Ван Даньцзюнь: **Насправді, для переважної більшості підприємств більш імовірно, що вони будуть споживачами великих моделей у майбутньому, а не творцями великих моделей. Активне впровадження великих моделей може значно прискорити їхній процес цифрового керування . І організаціям, і окремим особам може знадобитися прийняти зміни. Керівники на всіх рівнях повинні підвищити свою обізнаність щодо прийняття цієї нової можливості, а співробітники повинні підтримувати постійну здатність до самостійного навчання.
**Паперова технологія: у цьому процесі підприємства у вертикальній сфері мають перевагу галузевого ноу-хау. Чи легше їм пройти через карткові точки великих даних моделі? **
Чжан Цзе: Я вважаю, що галузеві ноу-хау потрібно розглянути детально, і може бути кілька форм, які потребують особливої уваги.
Найбільш очевидною формою галузевого ноу-хау є деякі дані в документах, які є символічними виразами. Як викопувати (підказувати слова) чи підказувати ланцюжки з документа – це проблема, яка потребує вирішення на даному етапі. Багато компаній мають велику кількість документів, і багато з цих документів у форматі PPT або PDF. Необхідно розуміти як його формат, так і зміст.
Окрім ноу-хау цього типу галузі, існують також знання, приховані в головах галузевих експертів або сценаріїв. Йому потрібно дати інструмент, який можна коротко описати словами. Шаблоном є галузь ноу-хау з більшою щільністю.
Існує також відносно прихований тип галузевого ноу-хау, який є колективною мудрістю, прихованою в системних журналах. Після видобутку цих журналів можна перетворити розрізнені знання на структуровані ланцюгові знання. Потім із тисяч ланцюжків це узагальнюється та перетворюється на найкращу практику за конкретним сценарієм. Наприклад, продавці здійснюють багато телефонних дзвінків щодня, і щодня накопичуються мільйони журналів розмов. Завдяки адаптації відповідно до різних результатів, таких як виконання замовлення, порядок потоку або завершення дзвінка, найкращі навички мовлення для маркетингу нових продукти можуть випадати в осад.практ.
Ці три типи питань насправді є дуже хорошим галузевим ноу-хау. Тут також є деякі технічні проблеми, наприклад, як викопати слова підказки та ланцюжки підказок із документів і журналів. doc2 і log2 є центром дослідження, у яке варто інвестувати.
Юй Чжунхай: Насправді Чжан Цзе завжди мав вислів, який мене глибоко вразив.Він сказав, що запис орбіт восьми планет Сонячної системи за десятки мільйонів років не такий хороший, як абстрактний закон сила тяжіння, яка може краще пояснити речі. Природа.
Я вважаю, що це ноу-хау. Компанії у вертикальних сферах мають великий досвід у суміжних галузях. Дозвольте навести вам приклад. Після того, як штучний інтелект став популярним, усі сказали, що є нова професія під назвою інженер із річною зарплатою в один мільйон.
Це інженер пішов писати. Чому ж вони такі цінні? Я також використовую інструменти малювання штучного інтелекту. Одного разу я хотів намалювати людину в костюмі, але перепробував багато ключових слів, і це не спрацювало. Пізніше я ввів «краватка», і людина відразу одягнула костюм, і ви побачите, що це чарівне слово.
Велика модель трохи схожа на ймовірнісну гру. Насправді вона має багато попередніх ймовірностей. У цій сцені краватка є дуже важливим словом, яке відповідає костюму. І інженер знає, які ключові слова можуть заважати моделі, і він знає, які речі ми хочемо написати.Це його цінність. Тоді, якщо ми поставимо це питання в сценарій застосування, це фактично вартість компаній у вертикальних сферах. Він розуміє як штучний інтелект, так і галузеві ноу-хау.
Ван Даньцзюнь: Наразі здається, що окрім основних великих модельних компаній, вертикальні компанії є другою партією компаній, на які всі звертатимуть пильну увагу на ринку. Я думаю, що це буде дуже складно для них у наступний період часу. Досвід компаній у вертикальних сферах не обов’язково може бути безпосередньо трансформований у нову творчість під благословенням нових технологій. Потрібно витратити більше часу, щоб спочатку навчитися, щоб зрозуміти, яка основна логіка роботи великої моделі, щоб дізнатися, як це може мені допомогти, навіть щоб допомогти мені видобути наші знання або допомогти нам надавати послуги клієнтам. Я думаю, що ще деякий час вони першими зіткнуться з цим викликом. На цій основі знайдіть нові можливості для створення цінності для клієнтів на основі цих моделей.
**Паперова технологія: нещодавно з’явилися нові тенденції, наприклад, уповільнення кількості відвідувачів ChatGPT. Насправді він не існував як супервхід. Існує думка, що ChatGPT не може представляти майбутнє GPT, а лише продукт, представлений на ринку OpenAI і Microsoft. Що ви троє думаєте про цю точку зору? **
Юй Чжунхай: Ця точка зору справді досить цікава. Особисто я налаштований відносно оптимістично, тому що я людина, яка часто використовує масштабні продукти. І я хотів би додати, що поточний ChatGPT не є його остаточною формою. Я думаю, що Google Assistant (Google Assistant) у системі Android наступного покоління від Google буде підтримуватися власною великою моделлю, тому що це також дуже важливий вхід у трафік.
Ван Даньцзюнь: Для багатьох людей у галузі всі дуже оптимістичні. Як новий продукт, на цьому етапі розробки, природно, буде певна диференціація. Кінцеві користувачі зацікавляться такими інструментами, охоче спробують і продовжуватимуть їх використовувати. Навіть якщо частота використання зменшується, а ступінь уваги знижується, поведінку користувачів важко змінити.
Чжан Цзе: Я думаю, що рано чи пізно відбудеться уповільнення темпів зростання ChatGPT. Зрештою, трафік має стелю. Рано чи пізно трафік досягне піку або ентузіазм громадськості щодо прикладних сценаріїв спілкування в чаті впаде.Зрештою, спілкування в чаті не є високочастотним жорстким попитом, але воно приносить вам особливо гарне натхнення.
З одного боку, навколо Chat є багато програм, таких як генерування зображень, відео, звітів, PPT тощо через чат, наприклад ChatDoc, ChatPdf і ChatBI. Іншим сценарієм є щойно згадана велика доменна модель, як-от фінансовий GPT, юридичний GPT і медичний GPT.Все це може стати новим бізнесом у майбутньому.