Після кількох місяців твердження «всі програми варто переробити за допомогою великої моделі», усі термінали також хочуть використовувати велику модель, щоб змінити свою конкурентоспроможність.
Huawei стала першим виробником в індустрії мобільних телефонів, який надав конкретний графік реалізації великих моделей. Нещодавно, коли HarmonyOS 4.0 отримав доступ до можливостей великомасштабної моделі Pangu, Xiaoyi, вбудований голосовий помічник у мобільних телефонах Huawei, став першим розумним помічником із можливостями великомасштабної моделі штучного інтелекту та буде відкритий для тестування наприкінці серпня. .
Відповідно до вищезазначеного прогресу, серія Huawei Mate 60, яка буде випущена в другій половині року, також буде оснащена можливостями великомасштабних моделей і, як очікується, стане основною точкою продажу порівняно з серією iPhone 15 від Apple. **
**До великої моделі чіп 5G колись вважався зовнішнім світом секретною зброєю Huawei проти нового iPhone 15. **Згідно з онлайн-звітами, очікується, що мобільний телефон Huawei 5G повернеться в жовтні цього року. Однак, порівняно з очікуваними можливостями великомасштабної моделі, час запуску мобільних телефонів Huawei 5G все ще стикається з багатьма невизначеностями.
Наразі Qualcomm і MediaTek по черзі заявили, що вони ще не отримали схвалення уряду США на продаж чіпсетів Huawei. Навіть якщо новини про повернення мобільного телефону Huawei 5G справдяться, його конкурентоспроможність не є оптимістичною, оскільки більшою ймовірністю буде співпраця з SMIC для досягнення повної альтернативи локалізації, а ціна полягає в тому, що процес виробництва мікросхем може досягти лише щонайбільше рівень 7 нм. Порівняно з 3 нм на iPhone 15, це дві епохи позаду з точки зору технологічної ітерації.
Порівняно зі статус-кво відсталих чіпів 5G, Huawei фактично випереджає Apple щодо великих моделей.
Хоча генеральний директор Apple Кук також вважає iPhone та інше апаратне забезпечення компанією носієм для відображення технології штучного інтелекту та визнає величезну хвилю змін, спричинену штучним інтелектом, Apple досить обережно підходить до розробки великих моделей. За словами Кука, «Ми збираємося продовжувати вбудовувати це в наші продукти на дуже свідомій основі».
За словами кореспондента з питань технологій Bloomberg Марка Гурмана, Apple тихо розробляє власні продукти штучного інтелекту та створила власну широкомасштабну структуру моделі «Ajax» і спробувала застосувати її до функцій продукту, таких як карти та Siri. Планів щодо цього немає. випустити "Apple GPT" для споживачів.
**За останні десять років вітчизняні виробники мобільних телефонів здійснили дві серйозні зміни в продуктах: хвиля повноекранного режиму, запущена в 2016 році, одного разу витіснила iPhone з п’ятірки лідерів на китайському ринку; хвиля відкидних екранів, запущена в 2019 році, не змінилася. ще потрясли основи iPhone. **
**Як ще одна нова можливість для зміни продукту, чи буде велика модель «повноекранним моментом», який сприяє популяризації вітчизняних виробників мобільних телефонів, чи «дилемою зі складаним екраном», яка обмежена нішею? **
**Порівняно зі сторонніми додатками, такими як ChatGPT і Wenxin Yiyan, які ввійшли в мобільний телефон, найбільшою перевагою великомасштабних моделей продуктів, вбудованих безпосередньо в систему мобільного телефону, є сильніший захист конфіденційності та безпеки. **
Порівняно з такими програмами, як ChatGPT, які обробляють дані в хмарі, локалізоване розгортання смарт-терміналів може найбільшою мірою усунути занепокоєння користувачів щодо витоку конфіденційності.
У березні цього року у ChatGPT виникла проблема з кеш-пам’яттю через помилку в бібліотеці з відкритим кодом, що зрештою призвело до витоку платіжної інформації сотень мільйонів платних користувачів ChatGPT – користувачів ChatGPT Plus, зокрема імен, адрес електронної пошти та номери кредитних карт Чотири цифри та термін дії кредитної картки тощо.
Постраждала від цього Федеральна торгова комісія США також почала розслідувати, чи порушує OpenAI закони про захист прав споживачів у липні, і попросила OpenAI надати інформацію про обробку персональних даних, можливість надання недостовірної інформації користувачам і «заподіяння шкоди споживачам». (включно з ризиком репутаційної шкоди” добре задокументовано.
**Завдяки локалізованому розгортанню терміналу мобільного телефону, щоб розвіяти занепокоєння щодо витоку інформації, користувачі можуть відчувати себе більш спокійно та сміливо передавати більше особистих даних у велику модель. Це також має другу перевагу вбудованої великої моделі мобільного телефону, тобто створення справді персоналізованого персонального помічника. **
**Крім того, великі моделі продуктів, які постачаються з мобільним телефоном, мають більш стабільне робоче середовище, ніж ChatGPT. **
У квітні цього року ChatGPT Plus було призупинено для оплати. Причиною OpenAI назвав те, що «занадто великий попит», що призвело до дефіциту обчислювальних ресурсів. Завдяки локалізованому розгортанню велика модель, яка постачається з мобільним телефоном, значно зменшить залежність від ресурсів хмарних обчислень, уникаючи таким чином виникнення подій «простою», і навіть може працювати в автономному режимі, коли мережа відключена.
Голосовий помічник став пріоритетним входом для багатьох виробників мобільних телефонів для впровадження великомасштабних моделей. Завдяки підтримці широких можливостей моделі голосовий помічник може допомагати користувачам автоматично генерувати копірайтинг, автоматично писати відповіді на електронні листи, автоматично генерувати резюме статей і автоматично перекладати...
Навіть за допомогою плагінів голосовий помічник, який підтримується великою моделлю, також може виконувати виклики функцій між додатками, наприклад мобілізацію додатків для карт, додатків для подорожей і додатків для погоди тощо, щоб допомогти користувачам скласти план подорожі або замовити ресторан.
Порівняно з групою голосових помічників, народжених більше десяти років тому, найбільша модель нагадує каталізатор, який безпосередньо веде Siri до версії 2.0, і, як очікується, вирішить проблему, через яку людські голосові помічники неодноразово критикувалися як «штучна розумова відсталість». ". **
Після появи ChatGPT генеральний директор Microsoft Сатья Наделла одного разу поскаржився: «Незалежно від того, чи це Cortana, Alexa, Google Assistant чи Siri, ці голосові помічники дурні, як камінь».
Згідно з повідомленнями ЗМІ, інженери Apple сподіваються поєднати велику модель із Siri, а також сподіваються випустити розумнішу Siri.
За словами доктора Дін Лея, експерта зі штучного інтелекту, одна з причин нерозумності голосових помічників попереднього покоління полягає в тому, що технічні системи за ними відрізняються.
**Siri версії 1.0 можна розглядати як штучний інтелект для прийняття рішень. Основна робота полягає в «маркуванні» наявних даних. **Щоб розрізнити різні типи даних, основними завданнями є «судити, чи є вони» та «відрізняти ця робота чи ні. Коли зовнішній запит перевищить існуючу бібліотеку тегів, голосовий помічник відповість відповідями знизу вгору, наприклад «Я не можу відповісти» та «Я все ще вчуся», щоб продовжити розмову.
**Версія Siri 2.0 — це генеративний штучний інтелект, який «створює» новий контент після узагальнення та аналізу наявних даних, **реалізує ефект «виводів з одного екземпляра» та враховує інтереси користувача, продовжуючи діалог. досвід.
Huawei та Apple не єдині виробники, які реєструють великі моделі на мобільних телефонах.
З точки зору вітчизняних виробників мобільних телефонів, Xiaomi надає найбільше значення великим моделям, крім Huawei. У квітні цього року Xiaomi офіційно створила масштабну модельну команду з понад 30 осіб і заявила, що очікується, що продукт буде випущено в третій квартал цього року.
Стало відомо, що OPPO створює масштабні моделі продуктів для мобільних телефонів на основі великої моделі Ali. Чжао Мін, генеральний директор Honor, також часто заявляв зовнішньому світу: «У майбутньому ми будемо першими, хто представить великі моделі в мобільних телефонах».
З’ясувалося, що для того, щоб першою розмістити масштабні продукти на мобільних телефонах, Samsung розглядає плани змінити пошукову систему за замовчуванням своїх мобільних телефонів з Google на Microsoft Bing.
Щоб максимально відновити втечу Samsung, з одного боку, Google намагалася оновити існуючу пошукову систему та додала можливості великомасштабних моделей; з іншого боку, вона почала інтегрувати великомасштабні моделі продуктів із самого низу система.
** У травні цього року нове покоління великомасштабної моделі PaLM 2, випущене Google, містило рішення Gecko на рівні мінімальних параметрів. За словами генерального директора Google Пічаї, «Gecko» зможе працювати на мобільних телефонах, а швидкість роботи досить висока. **
У другій половині цього року нові моделі Pixel від Google включатимуть останню великомасштабну версію PaLM2 gecko. Pixel завжди був в авангарді експериментів Google із новими функціями Android. У той час, незалежно від того, чи мають вітчизняні виробники мобільних телефонів можливість самостійно розробляти великі моделі, вони зможуть безпосередньо отримати магічну силу великих моделей від системи Google Android. **
Крім зусиль розробників систем, провідні виробники чіпів також хвилюються про використання великих моделей для мобільних телефонів. **
** MediaTek очікує, що Dimensity 9300, випущений у жовтні цього року, підтримуватиме роботу великомасштабних моделей; Qualcomm заявила, що зможе підтримувати генеративні моделі ШІ з 10 мільярдами параметрів для запуску на мобільних телефонах протягом цього року. **
За словами керівників Qualcomm, «модель із рівнем параметрів від 10 до 15 мільярдів може охопити більшість випадків використання генеративного штучного інтелекту. Якщо термінал уже підтримує цей рівень параметрів, тоді всі обчислення можна виконувати на терміналі без хмари». обробки. .Тоді мобільний телефон стане справжнім персональним помічником».
Крім того, після того, як Meta запустила велику модель Llama 2 з відкритим кодом, Qualcomm також заявила, що співпрацюватиме з Meta, щоб запустити «мобільну версію Llama 2» у 2024 році, щоб допомогти клієнтам створювати інтелектуальних віртуальних помічників, додатки для продуктивності, інструменти для створення контенту та Використовуйте такі випадки, як розваги.
Порівняно з обчислювальною потужністю тисячі хмарних карт і паралельних кластерних серверів перевага локалізованого розгортання смартфонів, у свою чергу, стала недоліком, який обмежує розширення обчислювальної потужності.
Найменша версія моделі Llama з відкритим вихідним кодом Meta також має 7 мільярдів параметрів. З поточною конфігурацією смартфонів вона взагалі не може нормально працювати в наявній пам’яті. Вона може працювати лише частково у флеш-пам’яті мобільного телефону, але це також призводить до низької швидкості відгуку великої моделі.
Раніше в спільноті відкритих кодів деякі розробники портували велику модель Llama на мобільний телефон, але процес очікування відгуку займав до десяти хвилин і більше.
** Щоб підвищити ефективність зворотного зв’язку, окрім посилення апаратних конфігурацій, таких як чіпи та пам’ять, розробник почав виконувати план зменшення розміру великої моделі мобільного телефону, включаючи, але не обмежуючись, скорочення, квантування, дистиляція тощо. З огляду на значне зниження точності, зменшіть споживання ресурсів і енергії, необхідних для великої моделі мобільного телефону: **Вирізання, тобто вирізання параметрів у моделі, які мало впливають на точність ; квантування, використання типів даних з нижчою точністю для міркувань; дистиляція полягає в тому, щоб виділити подібну, але простішу модель із складної моделі.
Однак у випадку GPT-4 із трильйонами параметрів, які все ще не можуть вирішити безглуздість великої моделі, як зменшити генерацію фальшивого вмісту для великої моделі на мобільному телефоні, який активно знижує точність після зменшення розміру, і кількість параметрів лише 1% від GPT-4.Поставити знак питання.
Доктор Дін Лей сказав, що для великомасштабних модельних продуктів, таких як ChatGPT, все ще є багато помилок і незрозуміла логіка в створеному вмісті, а деякі сценарії неможливо застосувати безпосередньо на рівні виконання. **
Якщо велика модель на стороні мобільного телефону допомагає користувачам складати плани подорожей або резервувати інформацію про ресторан, часті помилки неминуче безпосередньо впливатимуть на частоту використання користувача. У цьому плані ChatGPT – це вже урок минулого.
Після шести місяців безперервного зростання дані моніторингу стороннього веб-сайту SimilarWeb показують, що в червні цього року глобальний трафік веб-сайту ChatGPT і мобільних клієнтів знизився на 9,7% у порівнянні з місяцем. Це перший раз, коли ChatGPT зазнав негативного зростання трафіку з моменту випуску 30 листопада 2022 року.
На думку колишнього вченого OpenAI Кеннета Стенлі, поточні великомасштабні моделі продуктів ще не еволюціонували до iPhone. «Генеративний штучний інтелект безперечно захопив світ штурмом, і це правда, що деякі люди використовують його щодня, але я думаю, що ми все ще перебуваємо на дослідницькій фазі, щоб з’ясувати, як ми можемо використовувати його окремо. Якщо ми всі знайдемо дійсно сильний Причина використовувати його будь-коли, і це має бути момент iPhone».
Література:
"Велика модель збирається на термінал, а як щодо чіпа?" 》Спостереження за напівпровідниковою промисловістю
«Великий план Google щодо штучного інтелекту: зменшіть велику модель і вставте кожен продукт» LatePost
«Інтерв’ю з особою, відповідальною за Qualcomm AI: Очікується, що протягом цього року буде підтримуватися великомасштабні моделі з десятками мільярдів параметрів для запуску на мобільних телефонах» The Paper
«Велика модель «зменшується» до мобільного телефону, наступний iPhone приходить? 》Вибух метавсесвіту
«Діалог із вченими OpenAI: час iPhone ще не настав» Економічний оглядач
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
У битві великих моделей Huawei тимчасово випередила Apple
Перше джерело: Box Rice Finance
Автор: Чжао Цзіньцзе
Після кількох місяців твердження «всі програми варто переробити за допомогою великої моделі», усі термінали також хочуть використовувати велику модель, щоб змінити свою конкурентоспроможність.
Huawei стала першим виробником в індустрії мобільних телефонів, який надав конкретний графік реалізації великих моделей. Нещодавно, коли HarmonyOS 4.0 отримав доступ до можливостей великомасштабної моделі Pangu, Xiaoyi, вбудований голосовий помічник у мобільних телефонах Huawei, став першим розумним помічником із можливостями великомасштабної моделі штучного інтелекту та буде відкритий для тестування наприкінці серпня. .
Відповідно до вищезазначеного прогресу, серія Huawei Mate 60, яка буде випущена в другій половині року, також буде оснащена можливостями великомасштабних моделей і, як очікується, стане основною точкою продажу порівняно з серією iPhone 15 від Apple. **
**До великої моделі чіп 5G колись вважався зовнішнім світом секретною зброєю Huawei проти нового iPhone 15. **Згідно з онлайн-звітами, очікується, що мобільний телефон Huawei 5G повернеться в жовтні цього року. Однак, порівняно з очікуваними можливостями великомасштабної моделі, час запуску мобільних телефонів Huawei 5G все ще стикається з багатьма невизначеностями.
Наразі Qualcomm і MediaTek по черзі заявили, що вони ще не отримали схвалення уряду США на продаж чіпсетів Huawei. Навіть якщо новини про повернення мобільного телефону Huawei 5G справдяться, його конкурентоспроможність не є оптимістичною, оскільки більшою ймовірністю буде співпраця з SMIC для досягнення повної альтернативи локалізації, а ціна полягає в тому, що процес виробництва мікросхем може досягти лише щонайбільше рівень 7 нм. Порівняно з 3 нм на iPhone 15, це дві епохи позаду з точки зору технологічної ітерації.
Порівняно зі статус-кво відсталих чіпів 5G, Huawei фактично випереджає Apple щодо великих моделей.
Хоча генеральний директор Apple Кук також вважає iPhone та інше апаратне забезпечення компанією носієм для відображення технології штучного інтелекту та визнає величезну хвилю змін, спричинену штучним інтелектом, Apple досить обережно підходить до розробки великих моделей. За словами Кука, «Ми збираємося продовжувати вбудовувати це в наші продукти на дуже свідомій основі».
За словами кореспондента з питань технологій Bloomberg Марка Гурмана, Apple тихо розробляє власні продукти штучного інтелекту та створила власну широкомасштабну структуру моделі «Ajax» і спробувала застосувати її до функцій продукту, таких як карти та Siri. Планів щодо цього немає. випустити "Apple GPT" для споживачів.
**За останні десять років вітчизняні виробники мобільних телефонів здійснили дві серйозні зміни в продуктах: хвиля повноекранного режиму, запущена в 2016 році, одного разу витіснила iPhone з п’ятірки лідерів на китайському ринку; хвиля відкидних екранів, запущена в 2019 році, не змінилася. ще потрясли основи iPhone. **
**Як ще одна нова можливість для зміни продукту, чи буде велика модель «повноекранним моментом», який сприяє популяризації вітчизняних виробників мобільних телефонів, чи «дилемою зі складаним екраном», яка обмежена нішею? **
**Порівняно зі сторонніми додатками, такими як ChatGPT і Wenxin Yiyan, які ввійшли в мобільний телефон, найбільшою перевагою великомасштабних моделей продуктів, вбудованих безпосередньо в систему мобільного телефону, є сильніший захист конфіденційності та безпеки. **
Порівняно з такими програмами, як ChatGPT, які обробляють дані в хмарі, локалізоване розгортання смарт-терміналів може найбільшою мірою усунути занепокоєння користувачів щодо витоку конфіденційності.
У березні цього року у ChatGPT виникла проблема з кеш-пам’яттю через помилку в бібліотеці з відкритим кодом, що зрештою призвело до витоку платіжної інформації сотень мільйонів платних користувачів ChatGPT – користувачів ChatGPT Plus, зокрема імен, адрес електронної пошти та номери кредитних карт Чотири цифри та термін дії кредитної картки тощо.
Постраждала від цього Федеральна торгова комісія США також почала розслідувати, чи порушує OpenAI закони про захист прав споживачів у липні, і попросила OpenAI надати інформацію про обробку персональних даних, можливість надання недостовірної інформації користувачам і «заподіяння шкоди споживачам». (включно з ризиком репутаційної шкоди” добре задокументовано.
**Завдяки локалізованому розгортанню терміналу мобільного телефону, щоб розвіяти занепокоєння щодо витоку інформації, користувачі можуть відчувати себе більш спокійно та сміливо передавати більше особистих даних у велику модель. Це також має другу перевагу вбудованої великої моделі мобільного телефону, тобто створення справді персоналізованого персонального помічника. **
**Крім того, великі моделі продуктів, які постачаються з мобільним телефоном, мають більш стабільне робоче середовище, ніж ChatGPT. **
У квітні цього року ChatGPT Plus було призупинено для оплати. Причиною OpenAI назвав те, що «занадто великий попит», що призвело до дефіциту обчислювальних ресурсів. Завдяки локалізованому розгортанню велика модель, яка постачається з мобільним телефоном, значно зменшить залежність від ресурсів хмарних обчислень, уникаючи таким чином виникнення подій «простою», і навіть може працювати в автономному режимі, коли мережа відключена.
Голосовий помічник став пріоритетним входом для багатьох виробників мобільних телефонів для впровадження великомасштабних моделей. Завдяки підтримці широких можливостей моделі голосовий помічник може допомагати користувачам автоматично генерувати копірайтинг, автоматично писати відповіді на електронні листи, автоматично генерувати резюме статей і автоматично перекладати...
Навіть за допомогою плагінів голосовий помічник, який підтримується великою моделлю, також може виконувати виклики функцій між додатками, наприклад мобілізацію додатків для карт, додатків для подорожей і додатків для погоди тощо, щоб допомогти користувачам скласти план подорожі або замовити ресторан.
Порівняно з групою голосових помічників, народжених більше десяти років тому, найбільша модель нагадує каталізатор, який безпосередньо веде Siri до версії 2.0, і, як очікується, вирішить проблему, через яку людські голосові помічники неодноразово критикувалися як «штучна розумова відсталість». ". **
Після появи ChatGPT генеральний директор Microsoft Сатья Наделла одного разу поскаржився: «Незалежно від того, чи це Cortana, Alexa, Google Assistant чи Siri, ці голосові помічники дурні, як камінь».
Згідно з повідомленнями ЗМІ, інженери Apple сподіваються поєднати велику модель із Siri, а також сподіваються випустити розумнішу Siri.
За словами доктора Дін Лея, експерта зі штучного інтелекту, одна з причин нерозумності голосових помічників попереднього покоління полягає в тому, що технічні системи за ними відрізняються.
**Siri версії 1.0 можна розглядати як штучний інтелект для прийняття рішень. Основна робота полягає в «маркуванні» наявних даних. **Щоб розрізнити різні типи даних, основними завданнями є «судити, чи є вони» та «відрізняти ця робота чи ні. Коли зовнішній запит перевищить існуючу бібліотеку тегів, голосовий помічник відповість відповідями знизу вгору, наприклад «Я не можу відповісти» та «Я все ще вчуся», щоб продовжити розмову.
**Версія Siri 2.0 — це генеративний штучний інтелект, який «створює» новий контент після узагальнення та аналізу наявних даних, **реалізує ефект «виводів з одного екземпляра» та враховує інтереси користувача, продовжуючи діалог. досвід.
Huawei та Apple не єдині виробники, які реєструють великі моделі на мобільних телефонах.
З точки зору вітчизняних виробників мобільних телефонів, Xiaomi надає найбільше значення великим моделям, крім Huawei. У квітні цього року Xiaomi офіційно створила масштабну модельну команду з понад 30 осіб і заявила, що очікується, що продукт буде випущено в третій квартал цього року.
Стало відомо, що OPPO створює масштабні моделі продуктів для мобільних телефонів на основі великої моделі Ali. Чжао Мін, генеральний директор Honor, також часто заявляв зовнішньому світу: «У майбутньому ми будемо першими, хто представить великі моделі в мобільних телефонах».
З’ясувалося, що для того, щоб першою розмістити масштабні продукти на мобільних телефонах, Samsung розглядає плани змінити пошукову систему за замовчуванням своїх мобільних телефонів з Google на Microsoft Bing.
Щоб максимально відновити втечу Samsung, з одного боку, Google намагалася оновити існуючу пошукову систему та додала можливості великомасштабних моделей; з іншого боку, вона почала інтегрувати великомасштабні моделі продуктів із самого низу система.
** У травні цього року нове покоління великомасштабної моделі PaLM 2, випущене Google, містило рішення Gecko на рівні мінімальних параметрів. За словами генерального директора Google Пічаї, «Gecko» зможе працювати на мобільних телефонах, а швидкість роботи досить висока. **
У другій половині цього року нові моделі Pixel від Google включатимуть останню великомасштабну версію PaLM2 gecko. Pixel завжди був в авангарді експериментів Google із новими функціями Android. У той час, незалежно від того, чи мають вітчизняні виробники мобільних телефонів можливість самостійно розробляти великі моделі, вони зможуть безпосередньо отримати магічну силу великих моделей від системи Google Android. **
Крім зусиль розробників систем, провідні виробники чіпів також хвилюються про використання великих моделей для мобільних телефонів. **
** MediaTek очікує, що Dimensity 9300, випущений у жовтні цього року, підтримуватиме роботу великомасштабних моделей; Qualcomm заявила, що зможе підтримувати генеративні моделі ШІ з 10 мільярдами параметрів для запуску на мобільних телефонах протягом цього року. **
За словами керівників Qualcomm, «модель із рівнем параметрів від 10 до 15 мільярдів може охопити більшість випадків використання генеративного штучного інтелекту. Якщо термінал уже підтримує цей рівень параметрів, тоді всі обчислення можна виконувати на терміналі без хмари». обробки. .Тоді мобільний телефон стане справжнім персональним помічником».
Крім того, після того, як Meta запустила велику модель Llama 2 з відкритим кодом, Qualcomm також заявила, що співпрацюватиме з Meta, щоб запустити «мобільну версію Llama 2» у 2024 році, щоб допомогти клієнтам створювати інтелектуальних віртуальних помічників, додатки для продуктивності, інструменти для створення контенту та Використовуйте такі випадки, як розваги.
Порівняно з обчислювальною потужністю тисячі хмарних карт і паралельних кластерних серверів перевага локалізованого розгортання смартфонів, у свою чергу, стала недоліком, який обмежує розширення обчислювальної потужності.
Найменша версія моделі Llama з відкритим вихідним кодом Meta також має 7 мільярдів параметрів. З поточною конфігурацією смартфонів вона взагалі не може нормально працювати в наявній пам’яті. Вона може працювати лише частково у флеш-пам’яті мобільного телефону, але це також призводить до низької швидкості відгуку великої моделі.
** Щоб підвищити ефективність зворотного зв’язку, окрім посилення апаратних конфігурацій, таких як чіпи та пам’ять, розробник почав виконувати план зменшення розміру великої моделі мобільного телефону, включаючи, але не обмежуючись, скорочення, квантування, дистиляція тощо. З огляду на значне зниження точності, зменшіть споживання ресурсів і енергії, необхідних для великої моделі мобільного телефону: **Вирізання, тобто вирізання параметрів у моделі, які мало впливають на точність ; квантування, використання типів даних з нижчою точністю для міркувань; дистиляція полягає в тому, щоб виділити подібну, але простішу модель із складної моделі.
Однак у випадку GPT-4 із трильйонами параметрів, які все ще не можуть вирішити безглуздість великої моделі, як зменшити генерацію фальшивого вмісту для великої моделі на мобільному телефоні, який активно знижує точність після зменшення розміру, і кількість параметрів лише 1% від GPT-4.Поставити знак питання.
Доктор Дін Лей сказав, що для великомасштабних модельних продуктів, таких як ChatGPT, все ще є багато помилок і незрозуміла логіка в створеному вмісті, а деякі сценарії неможливо застосувати безпосередньо на рівні виконання. **
Якщо велика модель на стороні мобільного телефону допомагає користувачам складати плани подорожей або резервувати інформацію про ресторан, часті помилки неминуче безпосередньо впливатимуть на частоту використання користувача. У цьому плані ChatGPT – це вже урок минулого.
Після шести місяців безперервного зростання дані моніторингу стороннього веб-сайту SimilarWeb показують, що в червні цього року глобальний трафік веб-сайту ChatGPT і мобільних клієнтів знизився на 9,7% у порівнянні з місяцем. Це перший раз, коли ChatGPT зазнав негативного зростання трафіку з моменту випуску 30 листопада 2022 року.
На думку колишнього вченого OpenAI Кеннета Стенлі, поточні великомасштабні моделі продуктів ще не еволюціонували до iPhone. «Генеративний штучний інтелект безперечно захопив світ штурмом, і це правда, що деякі люди використовують його щодня, але я думаю, що ми все ще перебуваємо на дослідницькій фазі, щоб з’ясувати, як ми можемо використовувати його окремо. Якщо ми всі знайдемо дійсно сильний Причина використовувати його будь-коли, і це має бути момент iPhone».
Література:
"Велика модель збирається на термінал, а як щодо чіпа?" 》Спостереження за напівпровідниковою промисловістю
«Великий план Google щодо штучного інтелекту: зменшіть велику модель і вставте кожен продукт» LatePost
«Інтерв’ю з особою, відповідальною за Qualcomm AI: Очікується, що протягом цього року буде підтримуватися великомасштабні моделі з десятками мільярдів параметрів для запуску на мобільних телефонах» The Paper
«Велика модель «зменшується» до мобільного телефону, наступний iPhone приходить? 》Вибух метавсесвіту
«Діалог із вченими OpenAI: час iPhone ще не настав» Економічний оглядач