«Війна 100 моделей» посилюється, і інновації застосування у вертикальній сфері є ключем до виходу з ситуації

Репортер Лі Юйчен

Дін Жун, репортер-стажер

Джерело зображення: створено інструментом Unbounded AI

З початку цього року індустрія великомасштабних моделей моєї країни стрімко розвивалася, і популярність треку продовжує зростати. На саміті зі штучного інтелекту в рамках Конференції глобальної цифрової економіки 2023 року, який нещодавно відбувся, Цзян Гуанчжі, секретар партійної групи та директор Пекінського муніципального бюро економіки та інформаційних технологій, сказав, що по всій країні було випущено понад 80 великих моделей.

Широкомасштабна модельна індустрія вступила в епоху «Сто модельних воєн», і в ній постійно точаться спекуляції та дискусії. «Чи є надлишкова конструкція в «Конкурсі сотень моделей»?» «Як просувати інновації у застосуванні у вертикальних областях?» стало центром уваги галузі.

Кілька інсайдерів галузі, опитаних репортером Securities Daily, сказали, що індустрія великих моделей є одним із ключових змагань у майбутній технологічній конкуренції. Для більшості підприємств дослідження інновацій у додатках на основі великих моделей для вертикальних сценаріїв, вертикальних галузей і вертикальних сфер буде ключовим напрямком, який потрібно подолати. Частковий успіх сприятиме загальному процвітанню галузі, інноваційному ентузіазму та творчій життєвій енергії.

Підприємства, що змагаються за макет

У сфері великомасштабної модельної індустрії моєї країни такі компанії, як Ali, Huawei і Tencent, розгорнули відносно рано. У 2019 році Алі провів масштабні дослідження та розробки моделей, а в 2022 році випустив серію великомасштабних моделей «Tongyi». Tencent також оприлюднив прогрес у дослідженнях і розробках своєї великої моделі «Hunyuan» у 2022 році.

На початку 2023 року ChatGPT поклав початок хвилі великих моделей. Baidu випустив велику мовну модель «Wen Xin Yi Yan» у березні, ставши першим у моїй країні продуктом, подібним до ChatGPT. Після цього поспішили з'явитися масштабні моделі, випущені багатьма підприємствами нашої країни.

Репортер "Securities Daily" розібрався і виявив, що станом на 3 липня в моїй країні було більше 80 масштабних моделей з параметрами понад 1 мільярд. Крім інтернет-гігантів, зареєстрованих на біржі компаній зі штучного інтелекту, таких як SenseTime, Yuncong Technology і iFLYTEK, стартапів, таких як Light Years і Baichuan Intelligent, Шанхайської лабораторії штучного інтелекту, Харбінського технологічного інституту та інших науково-дослідних інститутів, Large моделі були випущені послідовно.

«Ми поділяємо великі моделі та супутні продукти на три категорії. Перша категорія — це великі моделі загального призначення, такі як ChatGPT від OpenAI, «Wenxin Yiyan» від Baidu, «Xinghuo» від HKUST Xunfei тощо. Усі вони є великими моделями загального призначення; "Другий тип - велика промислова модель; третій тип - служба додатків, заснована на загальній великій моделі або промисловій великій моделі. Більшість продуктів, які були випущені до цього часу, зосереджені в першому та другому типах". , «Подивлячись на параметри, параметри загальних великомасштабних моделей, таких як «Wen Xin Yi Yan», знаходяться на рівні 100 мільярдів, а параметри великих моделей інших підприємств або компаній-початківців зазвичай на рівні рівень 10 мільярдів або 1 мільярд».

Чи є дублювання будівництва у «Війні сотень моделей»? Чень Дуань, директор Центру розвитку інновацій інтеграції цифрової економіки Центрального фінансово-економічного університету, сказав в інтерв’ю журналісту Securities Daily: «В еру ПК і мобільного Інтернету в Китаї виросла кількість Інтернет-компанії, які колись були світовими лідерами. Добре, що конкуренція за наступний раунд конкуренції на виживання активно приєдналася до ранньої конкуренції науково-дослідних розробок великомасштабних моделей. Однак конкуренція у сфері загального призначення велико- масштабні моделі в майбутньому матимуть ефект Метью, і лише кілька сильних можуть перемогти».

Чжан Сяоронг, декан Інституту досліджень технологій Deepin, також сказав в інтерв’ю репортеру Securities Daily: «Навчання великої моделі має високий поріг, залежно від обмежень даних і обчислювальної потужності, кількості компаній, які дійсно можуть пройти через Комерціалізація великих моделей буде Не так багато. Наразі вітчизняні великомасштабні моделі все ще перебувають на стадії лабораторії, і виробникам потрібно більше часу та ресурсів для підготовки моделей та налагодження параметрів тощо. Конкуренція на ринку сприяє промислового розвитку, і врешті її неминуче змиє великими хвилями».

Посадкова програма є ключовим моментом

«Судячи з великих моделей, які були випущені, існує більше великих моделей загального призначення та менше орієнтованих на додатки великих моделей. Зараз існує розрив між вітчизняними продуктами та ChatGPT. Ми повинні подолати цей розрив і зробити ключовим прориви завдяки зчепленню на сцені для створення Порівняльний аналіз сформував демонстрацію, ефективно та швидко скорочуючи розрив», — сказав Ван Пен, дослідник Пекінської академії соціальних наук, в інтерв’ю репортеру Securities Daily.

Чень Дуань сказав журналістам: «Ринковий попит на реалізацію цінності великих моделей у певних сферах і сценаріях дуже великий, і він також матиме гарну ринкову сумісність і вміщуватиме більше конкурентів. Тому для більшого. Для багатьох учасників вивчення інноваційних програм на основі на великих моделях стане проривним напрямком».

Ця точка зору також була високо визнана трековими компаніями. Робін Лі, засновник, голова правління та генеральний директор Baidu, нещодавно сказав: «Найважливішим, ніж кількість великих моделей, є застосування, яке є проривом у застосуванні вертикальних полів. Ключовим моментом нової міжнародної стратегії конкуренції є не те, як є багато великих моделей, але кількість великих моделей. Скільки власних програм є у великій моделі та наскільки ці програми підвищили ефективність виробництва».

На прес-конференції «Моделі руху Jiadu Zhixing» компанії Jiadu Technology, зареєстрованої на біржі, Лю Вей, голова правління компанії, сказав: «Народження великої моделі загального призначення є лише відправною точкою, і вона з часом буде орієнтуватися на конкретний сценарій застосування та вирішувати конкретні проблеми в галузі Вище. З галузевою моделлю як ключовим рушієм розширення можливостей галузі для підвищення ефективності виробництва та якості послуг призведе до глибоких змін в економічному та соціальному розвитку та галузі. Дані та відгуки, отримані завдяки перевагам прикладних сценаріїв, ще більше прискорять масштабний розвиток галузі. Ітерація модельної технології також стане найбільшою конкурентоспроможністю вітчизняних великих моделей».

Зрозуміло, що у сферах урядових справ, громадської безпеки та медичного обслуговування поступово впроваджуються широкомасштабні прикладні моделі у вертикальних сферах. Компанія TRS, зареєстрована на біржі, створила професійну широкомасштабну модель державних справ на основі власних офіційних документів, програмних документів, вказівок щодо державних справ та інших даних як даних про професійну підготовку; широкомасштабна модель MYAI, незалежно розроблена Мейєю Піко, фокусується на вертикальних польових застосувань і використовувався в громадській безпеці. Він застосовувався при створенні проектів великих даних у багатьох галузях, таких як урядові справи, оподаткування та цифрова трансформація підприємств.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити