360 Group Peng Hui: Тенденцією розвитку великих моделей є вертикалізація! ChatGPT на рівні підприємства потребує лише цих 4 кроків...

2023-08-25 03:37:44

Джерело: AI dark horse

Автор: віце-президент Peng Hui 360 Group

01. Тренд розвитку великих моделей - "вертикалізація"

Завдяки інклюзивним, повсюдним і універсальним функціям широкомасштабна модель увійде в тисячі домогосподарств і розширить можливості тисяч галузей у майбутньому.

Отже, ми маємо такий погляд:

Кожна сім'я, кожен уряд і кожне підприємство матиме одну або кілька великих моделей.

Ми також вважаємо, що розвиток Китаю та Сполучених Штатів на ринку To B дуже різний. У Китаї не буде монополії, і точно не буде тільки 3-5 великих моделей.

У майбутньому великі моделі мають бути повсюдними, а майбутні можливості розвитку мають бути на корпоративному ринку.

Усім відомо, що цифровізація стала основною стратегією нашої країни, а промислова цифровізація стане величезним децентралізованим поступовим ринком у майбутньому.

Тому, створюючи великомасштабні моделі в Китаї, ми твердо віримо, що ми повинні скористатися такою стратегічною можливістю, щоб розширити можливості галузі, закріпити ринок промислового рівня та вивести великомасштабні моделі з так званого централізованого ринку. продуктивність і ефективність виробництва уряду та підприємств.

Звичайно, у цьому процесі великі моделі зіткнуться з величезними проблемами в процесі виходу на корпоративний ринок.

Я резюмую це на чотири аспекти:

Відсутність професійних знань.

Усім відомо, що ми будемо використовувати велику кількість Інтернет-корпусу для живлення великої моделі, це як учень середньої школи, щонайбільше випускник бакалаврату. Однак йому вкрай бракує певних професійних знань у галузі, галузевих знань і внутрішніх знань підприємства. Навіть не оновлено вчасно. Отже, це велика проблема, брак фаху.

Випадкові галюцинаторні нісенітниці.

Кожен часто скаже слово, а велика модель буде говорити дурниці на серйозному рівні. Він матиме двозначність знань та ілюзію знань. Оскільки дані та знання схожі на структуровані бази даних, вони закодовані в параметрах і вагах нашої глибокої нейронної мережі в іншій матриці та векторній формі. Однак я хочу викликати його, використовувати його, і насправді потрібно зробити кращу роботу із початкового завантаження. У цьому процесі його механізм алгоритму створить ілюзію вмісту, яка не може гарантувати автентичність і достовірність.

Питання безпеки.

Підприємства не бажають вносити свої унікальні навички в публічну велику модель або навчати їх у публічній великій моделі.

Питання вартості.

Зараз запаси Nvidia H100 закінчилися, і ChatGPT стверджує, що тренує десятки тисяч карт одночасно. Тому для звичайного підприємства таке інвестування дуже складне. Можливо, ми скоротили робочу силу, але ми не зменшили витрати.

Отже, як вирішити ці проблеми?

Ми вважаємо, що тенденція розвитку в майбутньому має бути спрямована на вертикалізацію та створення маленьких, але спеціалізованих вертикальних великих моделей.

Неможливо покладатися на єдину універсальну велику модель загального призначення для вирішення всіх проблем декомпозиції завдань, взаємодії людини з комп’ютером і відповідей на питання знань. Ми повинні покладатися на корпус даних корпоративного рівня та високоякісні дані для навчання невеликих власних вертикальних великих моделей.

Великі моделі в майбутньому стануть стандартною конфігурацією та компонентом усіх цифрових систем.

02 Як швидко запровадити GPT на рівні підприємства?

Ми опитали понад 100 корпоративних клієнтів і партнерів, і в основному всі дійшли єдиної думки:

Великі моделі – це ще не все.

Отже, постає питання: як краще застосувати це до корпоративних сценаріїв?

Нам потрібно професіоналізувати так званих спеціалістів загального профілю і стати справжніми експертами з уряду та підприємств.

У цей час нам потрібно знайти невеликий розріз і повністю розкрити його сильні сторони.

Ми вважаємо, що поточні можливості великої моделі в основному відображаються у двох можливостях генерації тексту або створення вмісту та відповідей на запитання знань. Ми можемо почати з цих двох здібностей.

Все більше практиків у галузі великомасштабного моделювання вважають, що у відносно зосереджених і вузьких сценаріях застосування менші та точно налаштовані великі моделі швидше відповідатимуть вимогам точності до кінця To B.

Тому ми повинні йти крок за кроком, нехай велика модель буде спочатку хорошим помічником, а велика модель нехай буде спочатку хорошою навігацією.

Зосереджуючись на такому сценарії, ми знаходимо відповідні сценарії застосування, які адаптуються до цих чотирьох продуктів, щоб швидко використовувати їх продуктивність і ефективність у чотирьох вимірах: верхньому, нижньому, внутрішньому та зовнішньому.

На внутрішній сцені ми вважаємо, що це більше про написання та підсумовування офісу.
На зовнішній сцені велика кількість цифрових людей почала з’являтися на сцені обслуговування клієнтів.
У наведеному вище сценарії ми наголошуємо на узагальненні та аналізі інформації та розвідданих.
У наступному сценарії ми можемо дозволити великій моделі провести серію тренінгів щодо корпоративних знань і навіть професійних навичок.

Тому протягом усього процесу реалізації ми усвідомили дуже важливий момент. У майбутньому понад 80% наших бізнес-сценаріїв будуть тісно пов’язані з базою знань підприємства.

У минулому, коли ми працювали над великими даними, ми всі зупинялися на застосуванні структурованих даних. Ви повинні знати, що 80% неструктурованих знань і даних залишено або залишено. Ця частина великих даних стане корпусом для навчання великої моделі.

Таким чином, те, як отримати цінні знання та високоякісні точні дані з великої бази даних підприємства, перетворити її на приватну базу знань підприємства та розширити можливості великої моделі шляхом виправлення та вдосконалення пошуку, може справді створювати надійний вміст. і своєчасне оновлення вмісту в бізнес-сценарії To B, а також безпеку вмісту, наприклад децентралізацію та поділ доменів.

Дані розподіляються на три елементи:

Перший шлюз може бути відкритими Інтернет-даними, другий шлюз — це напіввідкриті галузеві дані або дані підприємства, а частина — це конфіденційні дані в межах підприємства.

Для такого роду конфіденційних даних підприємства та авторизованих даних ми повинні помістити їх у базу знань підприємства або помістити їх у векторну базу даних, щоб вони могли генерувати своєрідне управління з повноваженнями та аудитом через своєрідне керування повноваженнями класифіковані та ієрархічні корпоративні знання, розширені шляхом пошуку великих моделей, щоб забезпечити більш точні знання та розширення можливостей.

Іншим аспектом є програма. На рівні програми всі стикалися з ChatGPT. Як ви думаєте, чи легко ним користуватися?

Чому деякий час тому всі мізки згадували, що в майбутньому буде багато посад і ролей, які пропонують інженерів, насправді це дуже складно.

Ми хочемо, щоб він написав гарну статтю, і ми повинні дати йому багато підказок, центральних ідей, тез і планів, перш ніж він зможе написати хорошу статтю. Ми дозволяємо йому робити зображення, використовувати Midjourney, I Ви навіть повинні скажіть, скільки міліметрів об’єктива, фокусну відстань, діафрагму та глибину різкості вам потрібно використовувати, яке середовище може створити справді гарне згенероване зображення, як це, але такий проект підказки насправді придатний лише для використання, але він дуже незручний і складний у використанні.

Тому в майбутньому процесі розробки не будьте забобонними щодо так званого мовного інтерфейсу користувача, і більш традиційні інтерфейси не будуть виключені.

Крім того, він буде створюватися у великій кількості в майбутніх сценаріях, таких як офісне письмо, створення картинок, маркетингова креативність тощо, і навіть у сценаріях запитань і відповідей на державні знання, оскільки це забезпечує більше інтуїції та застосовності.

Наприклад, Лао Чжоу часто говорив, що хоче з'їсти тарілку тертої картоплі, я хотів смажену замість оцтової, клацання може бути на рівні секунди, і я закінчив цю справу.

360 випустить повну структуру системи продукту власного GPT корпоративного рівня. На нижньому рівні ми все ще віримо, що дані та знання стануть основою для великих моделей корпоративного рівня в майбутньому, які неможливо відокремити від накопичення всіх даних у минулому. Просто нам потрібно адаптуватися до потреби великих моделей і деструктурувати дані, накопичені всіма підприємствами в минулому. Вміст і документи, включаючи мультимедійну аудіо- та відеографіку, дані зображень, через численні з’єднувачі даних і роботів відстеження знань, механізм обробки, який сприяє об’єднанню даних з багатьох джерел у нашу корпоративну базу знань за допомогою векторних індексів, абстрактних індексів у традиційному розумінні, текстових індексів і мультимодальних індексів, створити базу знань великої моделі на рівні підприємства, а потім за допомогою нашого пошуку та розширення знань розширити можливості нашого професійного вертикального підприємства велика Модель надає послуги наверх.

03, 3 практики та найкращий процес посадки великих моделей

Канцелярська писемність.

Ми приховаємо складні проекти за різними великими шаблонами з 15 категорій і майже з 80 розділеними шаблонами документів. Використовуйте такий інструмент, щоб ефективно завершити написання офіційних документів, а також ефективно вирішити проблеми, пов’язані з трудомістким та неякісним написанням офіційних документів.

Державні послуги.

Завдяки великій моделі та базі знань про державні справи ми можемо змусити велику модель розуміти семантику, як людина, через кілька раундів діалогу, доповнювати релевантну інформацію за допомогою подальших запитань і, нарешті, сформувати питання та відповідь. Він може об'єктивно і точно відповісти на всі запитання, які виникають у звичайних людей у процесі ведення бізнесу.

Цифрові люди культурного туризму.

Лао Чжоу також неодноразово згадував Wenlv Digital People. Кожен планував подорож. Чи може так званий план подорожі вирішити ваші проблеми подорожі?

Нас дбає про те, щоб після прибуття в пункт призначення у нас був місцевий друг і місцевий гід. Пам’ятки, їжа, анекдоти, жарти, які мене цікавлять, як ці речі стають цифровим компаньйоном, орієнтованим на цільове призначення? Ми хочемо створити такого цифрового компаньйона.У майбутньому під керівництвом уряду ми будемо поступово відкривати можливості Китаю та Тайваню, а після підключення наших OTA, місцевих готелів та ресторанів.

У поєднанні з самою 360 Group і більш ніж 100 корпоративними клієнтами та партнерами ми сформували процес впровадження найкращої практики.

Перший крок – аналіз бізнесу та вибір сценарію.

Другий крок – збір даних і підготовка до очищення.

Третій крок — навчити фірмову велику модель підприємства.

Четвертим кроком є розробка додатків корпоративного сценарію.

Ми вважаємо, що коли всі великомасштабні моделі впроваджуються в сценарії на рівні підприємства, одним із головних пріоритетів залишається бізнес-аналіз. Він нічим не відрізняється від оцифрування.

Нам ще потрібно знайти больові точки бізнесу в процесі бізнес-аналізу, щоб знайти відповідний сценарій, і після вибору цього сценарію визначити наше рішення.

Потім зберіть і очистіть дані та знання навколо цієї сцени, щоб сформувати наші високоякісні дані з мітками. Після входу в базу даних частина її передається в нашу вертикальну велику модель як корпус для навчання, а частина потрапляє в нашу корпоративну базу знань для покращення пошуку знань. Далі — розробка розумних помічників, цифрових співробітників і цифрових людей шляхом упорядкування прикладних моделей і відкриття API для інтеграції з існуючими бізнес-системами.

Під час впровадження великої моделі на рівні підприємства ми наголошуємо, що вона невіддільна від тісної співпраці бізнес- та технічних експертів обох сторін.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.