Плагіни: альтернативні нативні додатки зі штучним інтелектом із найнижчим бар'єром входу

2023-10-23 07:54:46

Джерело: AI New Intelligence

Джерело зображення: Створено Unbounded AI

велика модель + модель, що підключається, швидше за все, є однією з відповідей на комерціалізацію великих моделей ШІ.

17 жовтня на «Всесвітній конференції Baidu 2023» Робін Лі офіційно представив останню версію моделі Wenxin 4.0.

Деякий час надходили різні оцінки, і основні науково-технічні засоби масової інформації проводили всебічні оцінки моделі з аспектів розуміння, генерації, логіки та здатності до запам'ятовування.

Однак, крім неодноразово обговорюваної Wenxin 4.0, ще одна трохи стримана функція на прес-конференції також холодно показала тенденцію розвитку майбутніх великих моделей.

**Це функція плагіна Baidu Wenxin 4.0. **

На даний момент Wenxin 4.0 має лише 8 плагінів, включаючи тінь дзеркального потоку (перетворення тексту у відео), скажімо, малювання зображень (дивись на картинки та говори), E Yan Yi Tu (аналіз візуальних даних) тощо.

Ці плагіни також можна вільно комбінувати для виконання більш складних завдань.

Мало того, платформа для розробки плагінів для великих моделей Baidu Wenxin, Lingjing Matrix Platform, була застосована 27 000 розробниками протягом одного місяця після її запуску, а на окремих розробників припадає понад 30%.

Отже, чому Baidu надає такого великого значення плагінам? І що означає процвітання екосистеми плагінів для великої моделі?

Плагін, нехай велика модель схожа на тигрове крило

В якійсь мірі плагіни еквівалентні ще одному прихованому «додатку-вбивці» для великих моделей. "

Без удосконалення алгоритму та параметрів моделі можна значно розширити та покращити можливості моделі за допомогою лише простої надбудови.

Раніше GPT-4 досягав ефекту посилення тигра за рахунок функції плагіна. Зовнішній світ навіть назвав це збільшенняПоявою GPT-4.5.

9 липня цього року компанія OpenAI оголосила, що офіційний плагін Code Interpreter (Інтерпретатор коду) буде доступний для всіх користувачів ChatGPT Plus через панель «Бета» в «Налаштуваннях».

Отже, що саме вміє інтерпретатор коду?

Простіше кажучи, це еквівалентно значному розширенню меж можливостей GPT-4, що дозволяє GPT-4 робити багато речей, які раніше були неможливими.

Наприклад, після запуску плагіна користувач Twitter @歸藏 продемонстрував процес аналізу даних про підписників на розсилку за допомогою парсера коду.

Парсеру коду не потрібно використовувати якесь складне програмне забезпечення від аналізу даних до відображення, просто скажіть щось настільки ж прямолінійне: «Я хочу проаналізувати тенденцію зростання підписників за останній місяць».

Крім того, люди також можуть безпосередньо використовувати «людську мову», щоб дозволити GPT створювати візуальні GIF-зображення з даних.

Наприклад, якщо люди хочуть зробити географічну іконку американського маяка, їм потрібно лише завантажити дані про географічне розташування, і GPT може автоматично зробити наступний GIF-файл за допомогою функції плагіна.

І навіть якщо ви хочете згенерувати відео із зображень, CodeInterpreter може зробити це у вас під рукою. Увімкнувши плагін, просто скажіть GPT: «Я хочу використати це зображення, щоб зробити панорамне відео справа наліво». "

GPT автоматично зробить відео із зображень, створених Midjourney, відповідно до ваших вимог.

Користувач мережі ChaseLean використовує ChatGPT для створення відео про бургер

Навіть люди з невеликим досвідом у кодуванні та програмуванні можуть використовувати плагін CodeInterpreter, щоб зробити просту гру за 5 хвилин.

Лише за допомогою кількох підказок проста міні-гра готова

Загалом, CodeInterpreter включає функції, які охоплюють багато різних завдань, таких як подолання модальних бар'єрів, перетворення форм матеріалів та аналіз даних.

Причина, чому плагін має таку функцію «виклику небу», полягає в тому, що він руйнує бар'єр між природною мовою та мовою коду. **

З його допомогою користувачі можуть вирізати складні процеси коду та безпосередньо виконувати різні міждоменні та кросмодальні завдання за допомогою взаємодії природною мовою (так звана «людська мова»).

Через це деякі люди вигукували, що цей плагін, який подвоює можливості моделі, є появою GPT-4.5.

Тому неважко зрозуміти, чому Baidu надає такого великого значення розробці плагінів.

Для великих команд розробників моделей неможливо і нереально зробити так, щоб модель включала всі потреби користувачів. Тому що в процесі еволюції ШІ користувачі неминуче генеруватимуть більше нових і непередбачуваних ідей і потреб.

В цей час різноманітні гнучкі плагіни стали «протезом», що розширює можливості великих моделей.

Плагіни розквітають

На додаток до рідних плагінів, які постачаються з OpenAI, на поточному треку штучного інтелекту з'явилися й інші плагіни.

Тут ми зробимо простий перебір, щоб побачити, які різноманітні розширення плагіни з різними функціями привнесуть у більші моделі.

ЧатPDF

ChatPDF — це потужний онлайн-інструмент для роботи з PDF, користувачам потрібно лише завантажувати PDF-файли в ChatPDF, ChatPDF може швидко використовувати штучний інтелект для аналізу вмісту PDF-файлу та генерації точних відповідей, щоб відповісти на запитання користувачів.

На додаток до розумної функції запитань і відповідей, ChatPDF також пропонує онлайн-редагування, конвертацію та стиснення файлів. Якщо користувачі хочуть додати або видалити елементи з PDF-файлу, або змінити текст чи зображення, функція онлайн-редагування ChatPDF буде дуже корисною.

### Моніка

Плагін бічної панелі веб-сторінки, який підключається до інтерфейсу API ChatGPT, і після запуску Monica може використовувати здатність ChatGPT інтерпретувати будь-яку інформацію чи текст, або обговорювати вміст сторінки та надавати переклади під час перегляду будь-якого веб-сайту.

Варто зазначити, що окрім ChatGPT, Monica також інтегрує інтерфейси інших ШІ, таких як Claued і Bard, і якщо цього недостатньо, користувачі також можуть самостійно шукати та додавати інші інструменти штучного інтелекту в бібліотеці штучного інтелекту, до якої вони мають доступ, щоб вони могли задовольнити свої різноманітні потреби за допомогою різних ШІ.

### ChatHub

Це плагін, який дозволяє використовувати різних чат-ботів в одному додатку, наразі підтримує ChatGPT і новий BingChat, а в майбутньому інтегруватиме більше чат-ботів, таких як Google Bard. Користувачі можуть спілкуватися з кількома чат-ботами одночасно та легко порівнювати їхні відповіді.

### ПриміткаGPT

Це плагін, який використовує ChatGPT для узагальнення відео. Підтримка створення скріншотів і нотаток на відео-сайтах одним клацанням миші.

Після запуску плагіна користувачі можуть швидко використовувати ChatGPT для отримання ключової інформації про відеоконтент і створення підсумків і підсумків, коли стикаєтеся з певними довгими відео, а також робити скріншоти або записувати нотатки з позначками часу під час перегляду відео одним клацанням миші.

### Помічник зі штучним інтелектом Smart Star

Це перший продукт когнітивної моделі штучного інтелекту в Китаї, який підтримує плагіни, і в даний час Zhixing AI має доступ до 7 плагінів, включаючи запит погоди, пошук Bing, Wolfram тощо, які можуть швидко надавати інформацію про погоду в реальному часі, відповідати на складні математичні задачі та проводити глибокий фінансовий аналіз.

Для порівняння, ChatGPT може використовувати лише 3 плагіни одночасно, тоді як Smartstar AI не має обмежень на кількість плагінів.

### WPSAI

Він еквівалентний вітчизняній версії Microsoft365 Copilot, з абревіатурою, розширенням, продовженням, зміною стилю написання, узагальненням та узагальненням основних моментів статті, швидкою генерацією контурів PPT, створенням шаблонів PPT в один клік, інтелектуальною обробкою таблиць Excel та іншими функціями, а також має нові функції голосової взаємодії, які можна використовувати для мобільного офісу на терміналах з невеликим екраном, таких як мобільні телефони.

Амбіції в плагіні

На додаток до вищезгаданих різних типів сторонніх функцій плагінів, великі технологічні гіганти також продемонстрували імпульс у бік плагінів.

Наприклад, платформа плагінів Microsoft AI надає низку інструментів і послуг, які дозволяють розробникам використовувати ChatGPT від Microsoft і новий Bing для створення та розгортання різних плагінів штучного інтелекту, включаючи класи моделей можливостей, класи даних, класи додатків тощо. Його плагіни охоплюють кілька сценаріїв і продуктів, таких як Dynamics 365, Microsoft 365 тощо. **

У Китаї Baidu також запустила платформу «Spirit Matrix», яка відома тим, що дозволяє всім розробляти плагіни штучного інтелекту, намагаючись побудувати величезну екосистему плагінів на основі слів Вень Сіня.

За таким великим плануванням розкриваються принаймні наміри велетнів у двох аспектах:

**1. Сприймати плагіни як точку прориву, щоб відкрити шлях масштабної комерціалізації; **

**2. За допомогою величезної екосистеми плагінів створюйте програмні бар'єри, такі як NVIDIA CUDA. **

Щодо першого пункту, чому велика модель + модель моделі, що підключається, швидше за все, є відповіддю на масштабну комерціалізацію ШІ?

Причина насправді дуже проста, попередня велика модель, будь то AI текст, малювання, її поле включення може бути обмежене лише однією, вузькою сферою застосування.

Велика модель може мати хороший рівень написання, але як насправді вирішити багатокатегорійні та специфічні завдання порівняння товарів та фінансового аналізу?

Життєві потреби людей різноманітні і багаторівневі, з цієї точки зору, коли велика модель порушує обмеження єдиного режиму і задовольняє цей диверсифікований попит, це є початком її справжньої масштабної комерціалізації. **

А вставні функції кожної зовнішньої рівноцінні великим моделям? «Око» і «рука» змушують його більше не обмежуватися одним полем і областю дії.

У майбутньому користувачам може знадобитися лише великий модельний вхід для виконання таких завдань, як бронювання квитків, замовлення їжі, замовлення їжі та замовлення їжі на винос.

Звідси випливає і другий пункт, тобто екологічний бар'єр, в якому переважають ** плагіни. **

У нинішньому треку великих моделей, хоча існує незліченна кількість додатків штучного інтелекту, отриманих у країні та за кордоном, коли значна частина з них все ще є «оболонковими» продуктами на основі ChatGPT.

Ця реальність відбивається і з одного боку: у виборі великих моделей більшість розробників і користувачів до сих пір визнають тільки найсильніші головні вироби.

Відомий інвестиційний інститут A16Z оголосив минулого місяця, що значна частина з 50 найкращих веб-сайтів зі штучним інтелектом за трафіком є «підставними» додатками

Іншими словами, для великих моделей, поки користувач стикається з одним, який найкраще використовувати, він з меншою ймовірністю буде використовувати інший.

За цією логікою, якщо багато компаній не хочуть потрапити в ситуацію повторення колеса, найкращим вибором має бути зміщення фокусу на сторону застосування.

Історичний досвід показує, що в умовах конкуренції програмного забезпечення і додатків, хто може забезпечити розробникам низькопорогове і дружнє середовище розробки, хто може взяти на себе лідерство у встановленні власних екологічних бар'єрів.

У цьому плані можна сказати, що CUDA від NVIDIA стала чудовим прикладом.

Після тривалої еволюції CUDA сформувала багату і зрілу екосистему. NVIDIA також досягла глибокої програмної та апаратної прив'язки: з його програмним забезпеченням ви повинні купувати його обладнання, а купівля його апаратного забезпечення за допомогою CUDA може бути вдвічі ефективнішою.

В даний час компонування великих гігантів плагінів також досить схоже на CUDA від NVIDIA: якщо розробники або користувачі хочуть досягти низькопорогової та швидкої розробки додатків штучного інтелекту, вони повинні ґрунтуватися на можливостях своїх великих моделей.

У свою чергу, процвітання прикладної екології зміцнить залежність людей від її великої моделі.

Той, хто візьме на себе ініціативу в реалізації такої екосистеми, яка сприяє і доповнює один одного додатками, буде першим, хто зведе власні екологічні бар'єри в епоху штучного інтелекту.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

1 лайків

Нагородити
1
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
1/3
1Alpha Points System Opens
23978 Популярність
2Crypto Market Rebound
151964 Популярність
3SEC Crypto Project
7351 Популярність
4CandyDrop Airdrop Event 6.0
94599 Популярність
5White House Crypto Report
82452 Популярність

Закріпити

карта сайту