Останніми місяцями дуже очевидною тенденцією розвитку вітчизняних великих моделей є те, що всі збираються разом для створення великих моделей у галузі. Не лише компанії в різних вертикальних галузях випустили кілька великих промислових моделей, але й провідні гіганти, такі як Baidu, Alibaba, Huawei, Tencent і JD.com, також розглядають великі промислові моделі як ключову увагу.
Зокрема, цих виробників можна розділити на дві категорії залежно від частки великих моделей у їхніх стратегіях:
Baidu, Alibaba, Tencent і iFlytek приділяють однакову увагу загальним великим моделям і промисловим великим моделям.
З одного боку, вони приділяють більше уваги загальним великим моделям і відкривають загальні великі моделі для кінцевих користувачів C. Baidu Wenxinyiyan і iFlytek Spark навіть створили мобільні програми для сприяння застосуванню загальних великих моделей.
З іншого боку, вони також приділяють велику увагу великим промисловим моделям. Як правило, він експортується назовні у вигляді промислових рішень. Навіть 19 вересня Baidu безпосередньо запустив велику модель медичної індустрії – Spiritual Medicine Model, яка безпосередньо обслуговує лікарні, пацієнтів і компанії з виробництва медичного обладнання.
Іншу категорію представляють Huawei та JD.com, які з самого початку зосереджувалися на великомасштабних промислових моделях і безпосередньо орієнтовані на промислові додатки.
Гасло моделі Pangu від Huawei з самого початку було «Не пишіть вірші, просто робіть речі.» Вона не мала ентузіазму щодо додатків C-end, і майже вся її стратегічна увага була зосереджена на галузі.
Велика модель Yanxi від JD.com схожа. Дотримуючись концепції JD Cloud про «хмару, яка краще розуміє галузь», JD.com також зосереджується на галузевих застосуваннях у сфері великих моделей. Крім того, JD Health також випустила велику модель Jingyi Qianxun як піонера в індустрії.
Можна виявити, що незалежно від того, Baidu, Alibaba, Tencent і iFlytek «приділяють рівну увагу обом фронтам», чи Huawei і JD.com, які майже «борються на одному фронті», усі вони вважають велику модель галузі. як поле битви військових стратегів.
Автор вважає, що це проблематично. Ці технологічні гіганти повинні зосередитися на загальних великих моделях, а галузеві програми слід залишити партнерам у різних галузях промисловості.Вони повинні лише створювати «інфраструктуру» великих моделей і не торкатися додатків верхнього рівня.
Чому ми це говоримо? Далі розберемо детально плюси і мінуси.
Гіганти повинні зосередитися на дослідженні та розробці загальних великих моделей
Загальні великі моделі — це як основа всієї індустрії великих моделей. Міцність фундаменту залежить від того, наскільки висока будівля може бути побудована. Отже, чи міцна нинішня основа?
На жаль, хоча великі моделі спочатку досягли «появи» інтелекту та досягли значного прогресу в розумінні природної мови, створенні вмісту та логічних міркуваннях, вони недостатньо хороші. Особливо, якщо ми хочемо комерційно реалізувати великі моделі в різних галузях промисловості, можливостей поточної моделі недостатньо.
Згадана тут здатність недостатньо сильна, і вона не стосується конкретно певної великої моделі.
Навіть GPT-4 все ще має значні недоліки в можливостях, якщо він хоче бути реалізований у комерційній сфері. Давайте розглянемо кілька прикладів.
Пошукові системи є важливим прикладним сценарієм для великих моделей. Bing від Microsoft зробив великий поворот, змінивши вихідний метод пошуку за ключовими словами через доступ до ChatGPT. Отже, яка реальна продуктивність Bing за допомогою ChatGPT?
Ми випробували це, і, чесно кажучи, це дуже розчарувало.
Нижче наведено приклад. Дозвольте Bing шукати новини про великі моделі сьогодні (26 вересня). Наведені чотири новини. Після клацання вміст елементів 1 і 3 фактично походить із статті новин, і це перші новина вийшла 21 лютого, другий і четвертий також з тієї ж новини, яка вийшла 27 липня.
Іншими словами, наведені новини неправильні. Ми шукаємо сьогоднішні новини, а в результаті – контент кількамісячної давності. Крім того, ми шукаємо важливі події у сфері великих моделей, серед чотирьох наданих відповідей два звіти, новинна аналітична стаття та діяльність на форумі. Строго кажучи, звіти та аналітичні статті не є важливими новинними подіями, з цієї точки зору результати, які надає Bing, абсолютно не відповідають вимогам.
Потім автор запитав далі та попросив його використати таблицю, щоб відсортувати поданий вміст новин. У результаті в наведеній ним таблиці час випуску новин змінився на 26 вересня, а щодо конкретного часу, то це, очевидно, нісенітниця.
Колись автор покладав великі надії на нові пошукові системи, такі як Bing, і пробував їх багато разів. Але загальне відчуття - практично непридатний. Це фактична продуктивність ChatGPT у полі пошуку. До певної міри це найвищий рівень, якого можуть досягти великі моделі.
Baidu також запустив подібну функцію. Окрім звичайного веб-пошуку, ви також можете здійснювати запити через розмови. Ми не могли дочекатися, щоб спробувати це.
Порівняно з Bing, Baidu краще розуміє події новин. Bing дає кілька звітів, тоді як Baidu дає результати на основі випусків великих моделей. Цінність новин цих подій, очевидно, вища.
Однак чи надійні ці результати, надані Baidu? Так само ми дозволяємо складати його в табличній формі та надаємо час новин і посилання. Можна виявити, що весь час вказано 11 травня, що, очевидно, проблематично. Ми хочемо, щоб новини були 26 вересня, а не 11 травня.
Крім того, є проблема з посиланням на новини, наведеним у таблиці, коли відкривається відповідна веб-сторінка, вона безпосередньо повертає "404". Звичайно, Bing від Microsoft також має цю проблему: посилання на новини, які він надає, не відкриваються або не існують.
Повернемося до ChatGPT. Одне з його важливих обмежень полягає в тому, що його неможливо підключити до Інтернету, а його дані не можна оновлювати в режимі реального часу.Набір навчальних даних GPT-3 на вересень 2021 року, а набір навчальних даних GPT -4 станом на січень 2022 р. місяць.
Крім того, ChatGPT часто допускає помилки при обчисленні та обробці складних даних. Заявлені можливості завантаження та розуміння тексту також не ідеальні.
Давайте спробуємо GPT-4 розпізнавати документи. Ми завантажили піврічний звіт Loongson Zhongke за 2023 рік і спробували виконати простий SWOT-аналіз. Після завантаження документа ChatGPT починає писати код для аналізу документа, який здається дуже потужним.
Який був результат?
Зрештою, ChatGPT не вдалося проаналізувати PDF-документ. Ми намагалися кілька разів, але не змогли проаналізувати його.
Тільки уявіть, покладаючись на ці великі моделі, якщо ви хочете реалізувати їх у складних галузевих сценаріях, ефект точно не буде ідеальним, і вони вже є найкращими загальними великими моделями на ринку.
Це правда, що у великих моделях відбулося деяке «поява інтелекту», і їхні можливості були якісно покращені, але зараз вони знаходяться на початковій стадії «маленький лотос просто демонструє свої гострі краї». Оскільки відкриття великих моделей є перспективним напрямком, то найголовніше зараз — пришвидшити і виростити цю потенційну «дитину», а не дозволяти їй передчасно утримувати сім’ю.
Судячи з історичного досвіду, за кожним захопленням штучним інтелектом настане тривалий період мовчання.Основна причина полягає в тому, що очікування людей були занадто високі на ранній стадії, і вони будуть розчаровані, коли виявлять, що їхні очікування не виправдалися.
Подібним чином, якщо ми зараз поспішимо впроваджувати великі моделі в різних галузях промисловості, незабаром у нас настане період проблем, і люди швидко перетворяться від величезних очікувань до божевільних скарг.Такі злети та падіння не сприяють здоровому розвитку галузі. .
Тому головне завдання технологічних гігантів, таких як Alibaba, Huawei, Baidu і Tencent, — виростити «дітище» General Model. Поки можливості справді покращуються, масштабне впровадження насправді відбуватиметься дуже швидко, тому не варто поспішати чекати до цього часу.
Існує добре відома крива розвитку інтелекту в області великих моделей, тобто продуктивність моделі не залежить лінійно від масштабу параметрів. Модель з 20 мільярдами параметрів не вдвічі краща за модель з 10 мільярдами параметри.
На цій кривій появи інтелекту є поріг, який зараз становить приблизно 100 мільярдів параметрів. До цього порогу рівень інтелекту, який відображає модель, не змінюється суттєво зі збільшенням масштабу параметрів.Модель із 20 мільярдами параметрів працює приблизно так само, як і модель із 2 мільярдами параметрів. Однак коли масштаб параметрів перетнув поріг у 100 мільярдів, продуктивність моделі експоненціально покращилася.
Хоча розмір моделі не може відобразити все, судячи з досвіду розробки штучного інтелекту за останні десять років, «кількісне насильство» часто є ключовим напрямком. Більші моделі, глибші нейронні мережі та більше даних забезпечать кращу продуктивність.
Судячи з поточної кривої появи інтелекту, після масштабу сотень мільярдів параметрів він увійде в період вузького місця інтелекту. Можливо, не буде істотної різниці в «інтелекті» між моделлю з 500 мільярдами параметрів і моделлю зі 100 мільярдами параметрів. . Однак, якщо ми хочемо досягти наступного «надзвичайного порогу», найкращим способом наразі є продовжувати розширення розміру параметра. Можливо, після того, як масштаб параметрів розшириться до десятків трильйонів, наступить наступний поріг появи, і можливості великих моделей вийдуть на новий рівень.
Велика модель інтелектуального прогнозування появи даних ape mapping
Звичайно, із розширенням модельного ряду вартість також значно зросте, тому це може бути лише гра для гігантів. Крім того, просте збільшення розміру моделі також спричинить проблеми з надмірною підгонкою. Тому розширення масштабу моделі також має поєднуватися з оптимізацією та коригуванням архітектури моделі.Тут справді перевіряються технічні можливості.
Щоб зробити крок назад, усі сьогоднішні великі моделі базуються на архітектурі Transformer, і ця архітектура була запропонована в статті кількома дослідниками Google п’ять років тому. Отже, чи справді архітектура Transformer є найкращою? Чи існує краща архітектура моделі? Відповіді на ці запитання мають знайти такі технологічні гіганти, як Huawei, Baidu, Alibaba та Tencent.
На додаток до масштабу параметрів і архітектури моделі, великі моделі також повинні вирішувати проблеми «ілюзії», проблеми інтерпретації та мультимодальні проблеми. Ці проблеми ще недостатньо вирішені, що є загальною проблемою для всієї галузі. Ключ до вирішення цих проблем полягає в технологічному прориві, що лежить в основі загальних великих моделей, а не у промислових великих моделях.
Звичайно, той, хто справді зможе вирішити ці ключові проблеми, буде відповідним чином винагороджений ринком.
Не будь арбітром і гравцем одночасно
Причина, чому технологічним гігантам рекомендується не торкатися великих галузевих моделей, полягає в тому, що, окрім невирішеної проблеми загальних великих моделей, ще однією дуже важливою причиною є уникнення конфлікту інтересів із партнерами.
Для технологічних гігантів вони грають в екологічну гру та діляться перевагами інфраструктури.
У сфері великих моделей маршрут передачі значення має бути загальним великим моделям – промисловим великим моделям – галузевим клієнтам. На стадії промислових великих моделей загальні великі виробники моделей, такі як Huawei, Baidu та Alibaba, можуть розробляти великі промислові моделі самі або дозволити стороннім партнерам проводити дослідження та розробки на основі власних загальних великих моделей.
Велика модель галузевого застосування значення механізму передачі даних ape mapping
Загальні великі моделі перевіряють технічні можливості, тоді як технічний поріг для промислових великих моделей не дуже високий. Його основними елементами є дані та галузевий досвід, і ці два моменти є недоліками технологічних гігантів. Збирати високоякісні набори даних із різних галузей, таких як фінанси, медичне обслуговування, виробництво та роздрібна торгівля, а також розуміти бізнес-сценарії різних галузей — це точно не те, що може зробити одна компанія. Вона повинна покладатися на потужність екосистеми та використовувати тисячі даних з усієї екосистеми. Це роблять партнери.
Звичайно, загальні виробники великих моделей, такі як Baidu, Huawei та Tencent, також можуть займати обидва шляхи передачі вартості. Наприклад, у сфері медицини Baidu може не лише використовувати власну широкомасштабну модель духовної медицини для безпосереднього обслуговування лікарень, пацієнтів і компаній, що займаються медичним обладнанням, але й сприяти побудові вертикальної медичної широкомасштабної моделі партнерської системи.
Однак ця ситуація зіткнеться з проблемою «конкуренції з народом за прибуток», що є табу в бізнесі.
Уявіть, що певна масштабна медична модель компанії A будується на основі загальної великомасштабної моделі компанії B, відкриває свої основні медичні дані для B і навчає масштабну медичну модель. Через кілька місяців А виявив, що компанія Б також випустила велику медичну модель, і її функції були схожі на її власні. Коли галузевий клієнт зробив замовлення, він виявив, що компанія B також бере участь у торгах, і його партнер раптово став конкурентом. Якщо це так, чи готова компанія A співпрацювати з компанією B?
В екосистемі довіра партнерів до власника екосистеми цінна як золото. Лише тоді, коли партнери верхнього рівня твердо впевнені, що еко-власник не матиме з ним конфлікту інтересів і не вкраде його бізнес, він почуватиметься впевнено, розміщуючи свій бізнес на платформі, створеній еко-власником.
Це дещо схоже на відносини між постачальниками IaaS і постачальниками SaaS у сфері хмарних обчислень. Найважливішою причиною, чому багато компаній SaaS у Китаї стурбовані такими постачальниками хмарних технологій, як Alibaba Cloud, Tencent Cloud, Baidu Cloud і Huawei Cloud, є те, що вони бояться конфлікту інтересів. На даний момент межі бізнесу IaaS хмарних вендорів недостатньо чіткі, вони не тільки пропонують продукти IaaS і PaaS, але також входять у багато сфер SaaS, що є найбільшим табу для їхніх SaaS партнерів.
На ранніх стадіях китайського Інтернету інвестори задавали відоме глибокодумне запитання для компаній-початківців: що б ви зробили, якби Tencent створила такий же продукт?
Так само, якщо звичайні великі виробники моделей хочуть побудувати екосистему додатків, тоді великі галузеві виробники моделей у сферах медичного обслуговування, фінансів, державних справ, виробництва та інших галузях також запитають: якщо ви створите щось подібне до мене в майбутнє, що мені робити?
Тож яка велика модель екосистеми є більш розумною? Ми можемо вчитися в екосистемі хмарних обчислень. Загальна велика модель еквівалентна IaaS, а промислова велика модель еквівалентна SaaS.
Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek та інші провідні виробники загальних моделей зосереджуються на загальних великих моделях (IaaS+PaaS) і намагаються не торкатися великих галузевих моделей (SaaS). Розмежуйте бізнес-межі.
Слід зазначити, що навіть якщо вони не виробляють промислові великі моделі, базові загальні виробники великих моделей все одно можуть ділитися дивідендами промислового застосування великих моделей. Подібно до того, як програми SaaS споживають ресурси IaaS і платять за IaaS, галузева модель верхнього рівня використовуватиме можливості загальної моделі нижнього рівня, і розумну бізнес-модель можна побудувати на основі кількості викликів і використання.
Наприклад, Baidu не створює великомасштабних медичних моделей, але у неї є 10 партнерів із створення великомасштабних медичних моделей, заснованих на Вень Сіньянь, і кожен партнер обслуговує 1000 лікарень. Припустімо, що кожна лікарня платить 1 мільйон юанів на рік, а Baidu ділить 20% цього 1 мільйона юанів. Тоді кожна велика медична модельна компанія може заробляти 1 мільярд юанів на рік, а дохід Baidu становитиме 1 мільярд*20%*10=2 мільярди юанів. Таким чином, Baidu потрібно обслуговувати лише 10 партнерів, замість того, щоб обслуговувати 10 000 лікарень.
За аналогією, якщо можна побудувати процвітаючу промислову екосистему великих моделей, промислове застосування великих моделей також може принести десятки мільярдів доходів основним виробникам великих моделей.
Для звичайних великих виробників моделей, таких як Baidu, Huawei, Tencent і Alibaba, немає необхідності хвилюватися про втрату дивідендів промислових великих моделей додатків. Як і у сфері хмарних обчислень, дохід якого постачальника SaaS може зрівнятися з доходом Alibaba Cloud, Tencent Cloud і Huawei Cloud, які надають IaaS?
Поки ви зосереджуєтеся на закладенні фундаменту загальної великої моделі, ви зможете продати «землю» без необхідності копітко переносити цеглини для будівництва будинку. Давайте повернемося до сфери нерухомості. Чи такі забудовники, як Vanke та Evergrande, є найприбутковішими? Продавати землю, очевидно, вигідніше і простіше.
Для великих виробників моделей у вертикальних галузях найбільш ідеальним станом є вивчення стратегій міжхмарного розгортання SaaS, щоб досягти міжзагального розгортання великих галузевих моделей і плавно перенести бізнес з однієї платформи загальної моделі на іншу. Це дозволяє уникнути прив’язки до однієї платформи. Звичайно, великі моделі галузі наразі знаходяться на дуже ранній стадії, і ще занадто рано говорити про розгортання міжзагальних моделей.
Крос-модельне відображення даних у режимі розгортання мавпи великих галузевих моделей
Підсумовуючи, рекомендується, щоб технологічні гіганти, такі як Baidu, Huawei, Alibaba та Tencent, зосередилися на дослідженні та розробці загальних великих моделей, а не на застосуванні промислових великих моделей.
З одного боку, великі моделі загального призначення ще недостатньо хороші.Такі проблеми, як недостатній рівень інтелекту моделі, проблеми з галюцинаціями, погана інтерпретація, погана здатність мультимодального злиття, а також висока вартість навчання моделі та висновків, все ще помітні. Технологічні гіганти повинні вирішити ці проблеми Нижчий рівень, більш складні головоломки. Лише тоді, коли ці проблеми будуть вирішені, основа для промислового застосування великих моделей буде міцною.
На прикладному рівні великих модельних галузей це можна повністю залишити для виконання вертикальними компаніями верхнього рівня. Можна передбачити, що будуть сотні чи тисячі великих галузевих модельних компаній, які конкуруватимуть у кожній галузі. Зрештою, десятки компаній виживуть, і виживуть найсильніші. Ці компанії, що вижили, є кваліфікованими партнерами. Основні загальні великі виробники моделей повинні побудувати екосистему зі своїми партнерами для спільного обслуговування галузевих клієнтів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Я пропоную Alibaba, Baidu та Huawei не поспішати захоплювати «роботи» великих моделей у галузі!
Оригінал: Yibi Yanyu
Джерело: Data Ape
Інноваційні медіа-сервіси індустрії великих даних
——Фокус на даних·Зміна бізнесу
Останніми місяцями дуже очевидною тенденцією розвитку вітчизняних великих моделей є те, що всі збираються разом для створення великих моделей у галузі. Не лише компанії в різних вертикальних галузях випустили кілька великих промислових моделей, але й провідні гіганти, такі як Baidu, Alibaba, Huawei, Tencent і JD.com, також розглядають великі промислові моделі як ключову увагу.
Зокрема, цих виробників можна розділити на дві категорії залежно від частки великих моделей у їхніх стратегіях:
Baidu, Alibaba, Tencent і iFlytek приділяють однакову увагу загальним великим моделям і промисловим великим моделям.
З одного боку, вони приділяють більше уваги загальним великим моделям і відкривають загальні великі моделі для кінцевих користувачів C. Baidu Wenxinyiyan і iFlytek Spark навіть створили мобільні програми для сприяння застосуванню загальних великих моделей.
З іншого боку, вони також приділяють велику увагу великим промисловим моделям. Як правило, він експортується назовні у вигляді промислових рішень. Навіть 19 вересня Baidu безпосередньо запустив велику модель медичної індустрії – Spiritual Medicine Model, яка безпосередньо обслуговує лікарні, пацієнтів і компанії з виробництва медичного обладнання.
Іншу категорію представляють Huawei та JD.com, які з самого початку зосереджувалися на великомасштабних промислових моделях і безпосередньо орієнтовані на промислові додатки.
Гасло моделі Pangu від Huawei з самого початку було «Не пишіть вірші, просто робіть речі.» Вона не мала ентузіазму щодо додатків C-end, і майже вся її стратегічна увага була зосереджена на галузі.
Велика модель Yanxi від JD.com схожа. Дотримуючись концепції JD Cloud про «хмару, яка краще розуміє галузь», JD.com також зосереджується на галузевих застосуваннях у сфері великих моделей. Крім того, JD Health також випустила велику модель Jingyi Qianxun як піонера в індустрії.
Можна виявити, що незалежно від того, Baidu, Alibaba, Tencent і iFlytek «приділяють рівну увагу обом фронтам», чи Huawei і JD.com, які майже «борються на одному фронті», усі вони вважають велику модель галузі. як поле битви військових стратегів.
Автор вважає, що це проблематично. Ці технологічні гіганти повинні зосередитися на загальних великих моделях, а галузеві програми слід залишити партнерам у різних галузях промисловості.Вони повинні лише створювати «інфраструктуру» великих моделей і не торкатися додатків верхнього рівня.
Чому ми це говоримо? Далі розберемо детально плюси і мінуси.
Гіганти повинні зосередитися на дослідженні та розробці загальних великих моделей
Загальні великі моделі — це як основа всієї індустрії великих моделей. Міцність фундаменту залежить від того, наскільки висока будівля може бути побудована. Отже, чи міцна нинішня основа?
На жаль, хоча великі моделі спочатку досягли «появи» інтелекту та досягли значного прогресу в розумінні природної мови, створенні вмісту та логічних міркуваннях, вони недостатньо хороші. Особливо, якщо ми хочемо комерційно реалізувати великі моделі в різних галузях промисловості, можливостей поточної моделі недостатньо.
Згадана тут здатність недостатньо сильна, і вона не стосується конкретно певної великої моделі.
Пошукові системи є важливим прикладним сценарієм для великих моделей. Bing від Microsoft зробив великий поворот, змінивши вихідний метод пошуку за ключовими словами через доступ до ChatGPT. Отже, яка реальна продуктивність Bing за допомогою ChatGPT?
Ми випробували це, і, чесно кажучи, це дуже розчарувало.
Нижче наведено приклад. Дозвольте Bing шукати новини про великі моделі сьогодні (26 вересня). Наведені чотири новини. Після клацання вміст елементів 1 і 3 фактично походить із статті новин, і це перші новина вийшла 21 лютого, другий і четвертий також з тієї ж новини, яка вийшла 27 липня.
Потім автор запитав далі та попросив його використати таблицю, щоб відсортувати поданий вміст новин. У результаті в наведеній ним таблиці час випуску новин змінився на 26 вересня, а щодо конкретного часу, то це, очевидно, нісенітниця.
Baidu також запустив подібну функцію. Окрім звичайного веб-пошуку, ви також можете здійснювати запити через розмови. Ми не могли дочекатися, щоб спробувати це.
Порівняно з Bing, Baidu краще розуміє події новин. Bing дає кілька звітів, тоді як Baidu дає результати на основі випусків великих моделей. Цінність новин цих подій, очевидно, вища.
Давайте спробуємо GPT-4 розпізнавати документи. Ми завантажили піврічний звіт Loongson Zhongke за 2023 рік і спробували виконати простий SWOT-аналіз. Після завантаження документа ChatGPT починає писати код для аналізу документа, який здається дуже потужним.
Це правда, що у великих моделях відбулося деяке «поява інтелекту», і їхні можливості були якісно покращені, але зараз вони знаходяться на початковій стадії «маленький лотос просто демонструє свої гострі краї». Оскільки відкриття великих моделей є перспективним напрямком, то найголовніше зараз — пришвидшити і виростити цю потенційну «дитину», а не дозволяти їй передчасно утримувати сім’ю.
Судячи з історичного досвіду, за кожним захопленням штучним інтелектом настане тривалий період мовчання.Основна причина полягає в тому, що очікування людей були занадто високі на ранній стадії, і вони будуть розчаровані, коли виявлять, що їхні очікування не виправдалися.
Подібним чином, якщо ми зараз поспішимо впроваджувати великі моделі в різних галузях промисловості, незабаром у нас настане період проблем, і люди швидко перетворяться від величезних очікувань до божевільних скарг.Такі злети та падіння не сприяють здоровому розвитку галузі. .
Тому головне завдання технологічних гігантів, таких як Alibaba, Huawei, Baidu і Tencent, — виростити «дітище» General Model. Поки можливості справді покращуються, масштабне впровадження насправді відбуватиметься дуже швидко, тому не варто поспішати чекати до цього часу.
Існує добре відома крива розвитку інтелекту в області великих моделей, тобто продуктивність моделі не залежить лінійно від масштабу параметрів. Модель з 20 мільярдами параметрів не вдвічі краща за модель з 10 мільярдами параметри.
На цій кривій появи інтелекту є поріг, який зараз становить приблизно 100 мільярдів параметрів. До цього порогу рівень інтелекту, який відображає модель, не змінюється суттєво зі збільшенням масштабу параметрів.Модель із 20 мільярдами параметрів працює приблизно так само, як і модель із 2 мільярдами параметрів. Однак коли масштаб параметрів перетнув поріг у 100 мільярдів, продуктивність моделі експоненціально покращилася.
Судячи з поточної кривої появи інтелекту, після масштабу сотень мільярдів параметрів він увійде в період вузького місця інтелекту. Можливо, не буде істотної різниці в «інтелекті» між моделлю з 500 мільярдами параметрів і моделлю зі 100 мільярдами параметрів. . Однак, якщо ми хочемо досягти наступного «надзвичайного порогу», найкращим способом наразі є продовжувати розширення розміру параметра. Можливо, після того, як масштаб параметрів розшириться до десятків трильйонів, наступить наступний поріг появи, і можливості великих моделей вийдуть на новий рівень.
Звичайно, із розширенням модельного ряду вартість також значно зросте, тому це може бути лише гра для гігантів. Крім того, просте збільшення розміру моделі також спричинить проблеми з надмірною підгонкою. Тому розширення масштабу моделі також має поєднуватися з оптимізацією та коригуванням архітектури моделі.Тут справді перевіряються технічні можливості.
Щоб зробити крок назад, усі сьогоднішні великі моделі базуються на архітектурі Transformer, і ця архітектура була запропонована в статті кількома дослідниками Google п’ять років тому. Отже, чи справді архітектура Transformer є найкращою? Чи існує краща архітектура моделі? Відповіді на ці запитання мають знайти такі технологічні гіганти, як Huawei, Baidu, Alibaba та Tencent.
На додаток до масштабу параметрів і архітектури моделі, великі моделі також повинні вирішувати проблеми «ілюзії», проблеми інтерпретації та мультимодальні проблеми. Ці проблеми ще недостатньо вирішені, що є загальною проблемою для всієї галузі. Ключ до вирішення цих проблем полягає в технологічному прориві, що лежить в основі загальних великих моделей, а не у промислових великих моделях.
Звичайно, той, хто справді зможе вирішити ці ключові проблеми, буде відповідним чином винагороджений ринком.
Не будь арбітром і гравцем одночасно
Причина, чому технологічним гігантам рекомендується не торкатися великих галузевих моделей, полягає в тому, що, окрім невирішеної проблеми загальних великих моделей, ще однією дуже важливою причиною є уникнення конфлікту інтересів із партнерами.
Для технологічних гігантів вони грають в екологічну гру та діляться перевагами інфраструктури.
У сфері великих моделей маршрут передачі значення має бути загальним великим моделям – промисловим великим моделям – галузевим клієнтам. На стадії промислових великих моделей загальні великі виробники моделей, такі як Huawei, Baidu та Alibaba, можуть розробляти великі промислові моделі самі або дозволити стороннім партнерам проводити дослідження та розробки на основі власних загальних великих моделей.
Загальні великі моделі перевіряють технічні можливості, тоді як технічний поріг для промислових великих моделей не дуже високий. Його основними елементами є дані та галузевий досвід, і ці два моменти є недоліками технологічних гігантів. Збирати високоякісні набори даних із різних галузей, таких як фінанси, медичне обслуговування, виробництво та роздрібна торгівля, а також розуміти бізнес-сценарії різних галузей — це точно не те, що може зробити одна компанія. Вона повинна покладатися на потужність екосистеми та використовувати тисячі даних з усієї екосистеми. Це роблять партнери.
Звичайно, загальні виробники великих моделей, такі як Baidu, Huawei та Tencent, також можуть займати обидва шляхи передачі вартості. Наприклад, у сфері медицини Baidu може не лише використовувати власну широкомасштабну модель духовної медицини для безпосереднього обслуговування лікарень, пацієнтів і компаній, що займаються медичним обладнанням, але й сприяти побудові вертикальної медичної широкомасштабної моделі партнерської системи.
Однак ця ситуація зіткнеться з проблемою «конкуренції з народом за прибуток», що є табу в бізнесі.
Уявіть, що певна масштабна медична модель компанії A будується на основі загальної великомасштабної моделі компанії B, відкриває свої основні медичні дані для B і навчає масштабну медичну модель. Через кілька місяців А виявив, що компанія Б також випустила велику медичну модель, і її функції були схожі на її власні. Коли галузевий клієнт зробив замовлення, він виявив, що компанія B також бере участь у торгах, і його партнер раптово став конкурентом. Якщо це так, чи готова компанія A співпрацювати з компанією B?
В екосистемі довіра партнерів до власника екосистеми цінна як золото. Лише тоді, коли партнери верхнього рівня твердо впевнені, що еко-власник не матиме з ним конфлікту інтересів і не вкраде його бізнес, він почуватиметься впевнено, розміщуючи свій бізнес на платформі, створеній еко-власником.
Це дещо схоже на відносини між постачальниками IaaS і постачальниками SaaS у сфері хмарних обчислень. Найважливішою причиною, чому багато компаній SaaS у Китаї стурбовані такими постачальниками хмарних технологій, як Alibaba Cloud, Tencent Cloud, Baidu Cloud і Huawei Cloud, є те, що вони бояться конфлікту інтересів. На даний момент межі бізнесу IaaS хмарних вендорів недостатньо чіткі, вони не тільки пропонують продукти IaaS і PaaS, але також входять у багато сфер SaaS, що є найбільшим табу для їхніх SaaS партнерів.
На ранніх стадіях китайського Інтернету інвестори задавали відоме глибокодумне запитання для компаній-початківців: що б ви зробили, якби Tencent створила такий же продукт?
Так само, якщо звичайні великі виробники моделей хочуть побудувати екосистему додатків, тоді великі галузеві виробники моделей у сферах медичного обслуговування, фінансів, державних справ, виробництва та інших галузях також запитають: якщо ви створите щось подібне до мене в майбутнє, що мені робити?
Тож яка велика модель екосистеми є більш розумною? Ми можемо вчитися в екосистемі хмарних обчислень. Загальна велика модель еквівалентна IaaS, а промислова велика модель еквівалентна SaaS.
Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek та інші провідні виробники загальних моделей зосереджуються на загальних великих моделях (IaaS+PaaS) і намагаються не торкатися великих галузевих моделей (SaaS). Розмежуйте бізнес-межі.
Слід зазначити, що навіть якщо вони не виробляють промислові великі моделі, базові загальні виробники великих моделей все одно можуть ділитися дивідендами промислового застосування великих моделей. Подібно до того, як програми SaaS споживають ресурси IaaS і платять за IaaS, галузева модель верхнього рівня використовуватиме можливості загальної моделі нижнього рівня, і розумну бізнес-модель можна побудувати на основі кількості викликів і використання.
Наприклад, Baidu не створює великомасштабних медичних моделей, але у неї є 10 партнерів із створення великомасштабних медичних моделей, заснованих на Вень Сіньянь, і кожен партнер обслуговує 1000 лікарень. Припустімо, що кожна лікарня платить 1 мільйон юанів на рік, а Baidu ділить 20% цього 1 мільйона юанів. Тоді кожна велика медична модельна компанія може заробляти 1 мільярд юанів на рік, а дохід Baidu становитиме 1 мільярд*20%*10=2 мільярди юанів. Таким чином, Baidu потрібно обслуговувати лише 10 партнерів, замість того, щоб обслуговувати 10 000 лікарень.
За аналогією, якщо можна побудувати процвітаючу промислову екосистему великих моделей, промислове застосування великих моделей також може принести десятки мільярдів доходів основним виробникам великих моделей.
Для звичайних великих виробників моделей, таких як Baidu, Huawei, Tencent і Alibaba, немає необхідності хвилюватися про втрату дивідендів промислових великих моделей додатків. Як і у сфері хмарних обчислень, дохід якого постачальника SaaS може зрівнятися з доходом Alibaba Cloud, Tencent Cloud і Huawei Cloud, які надають IaaS?
Поки ви зосереджуєтеся на закладенні фундаменту загальної великої моделі, ви зможете продати «землю» без необхідності копітко переносити цеглини для будівництва будинку. Давайте повернемося до сфери нерухомості. Чи такі забудовники, як Vanke та Evergrande, є найприбутковішими? Продавати землю, очевидно, вигідніше і простіше.
Для великих виробників моделей у вертикальних галузях найбільш ідеальним станом є вивчення стратегій міжхмарного розгортання SaaS, щоб досягти міжзагального розгортання великих галузевих моделей і плавно перенести бізнес з однієї платформи загальної моделі на іншу. Це дозволяє уникнути прив’язки до однієї платформи. Звичайно, великі моделі галузі наразі знаходяться на дуже ранній стадії, і ще занадто рано говорити про розгортання міжзагальних моделей.
Підсумовуючи, рекомендується, щоб технологічні гіганти, такі як Baidu, Huawei, Alibaba та Tencent, зосередилися на дослідженні та розробці загальних великих моделей, а не на застосуванні промислових великих моделей.
З одного боку, великі моделі загального призначення ще недостатньо хороші.Такі проблеми, як недостатній рівень інтелекту моделі, проблеми з галюцинаціями, погана інтерпретація, погана здатність мультимодального злиття, а також висока вартість навчання моделі та висновків, все ще помітні. Технологічні гіганти повинні вирішити ці проблеми Нижчий рівень, більш складні головоломки. Лише тоді, коли ці проблеми будуть вирішені, основа для промислового застосування великих моделей буде міцною.
На прикладному рівні великих модельних галузей це можна повністю залишити для виконання вертикальними компаніями верхнього рівня. Можна передбачити, що будуть сотні чи тисячі великих галузевих модельних компаній, які конкуруватимуть у кожній галузі. Зрештою, десятки компаній виживуть, і виживуть найсильніші. Ці компанії, що вижили, є кваліфікованими партнерами. Основні загальні великі виробники моделей повинні побудувати екосистему зі своїми партнерами для спільного обслуговування галузевих клієнтів.