GPT-4 викрили в «дурні»! Щоб скоротити витрати, OpenAI таємно займається «маленькими ходами»?

Організація | Чжен Ліюань

Список | CSDN (ID: CSDNnews)

«Чи відчуваєте ви, що останнім часом якість GPT-4 знизилася?»

Ще в середині травня цього року користувачі GPT-4 написали на онлайн-форумі розробників OpenAI, що GPT-4, схоже, «став дурним»:

"Я використовую ChatGPT деякий час, і я користувач GPT Plus з моменту випуску GPT-4. Я зазвичай використовую GPT-4, щоб допомогти з аналізом і створенням довгострокового вмісту. У минулому, GPT-4, здається, добре працював, зрозумів мій запит. Але тепер, здається, він втрачає інформацію, надає мені багато неправильної інформації та все більше неправильно тлумачить мій запит... Зараз GPT-4 більше схожий на GPT -3,5.

Хтось ще помітив це, чи це лише я натрапив на цю проблему? "

Як виявилося, користувач GPT-4 був не один — кілька користувачів прокоментували в гілці: «Я відчуваю те ж саме!»

Проблемна нова версія GPT-4

За відгуками багатьох користувачів, GPT-4 знизився не тільки в аналізі та створенні довгоформатного контенту, але і в якості написання.

Пітер Янг, голова продукту Roblox, написав у Twitter, що вихід моделі GPT-4 швидший, але якість погіршилася: «Лише прості проблеми, такі як зробити текст більш чітким і лаконічним і надати ідеї... на мій погляд, якість написання впала».

Логічна здатність останньої версії GPT-4 значно падає під час обговорення/оцінки складних зворотних задач, різних темпів або моделей змін і просторово-часової мінливості.

«До оновлення GPT-4 я рідко отримував відповіді про помилки, але тепер мені потрібно ще раз перевірити всі виведення (тобто подвійні негативні умови тепер іноді не належним чином перетворюються на позитивні умови). Я думаю, що ці помилки більше схожі на GPT - 3.5 замість попереднього рівня висновків GPT-4».

Навіть з точки зору можливості кодування, якість виведення нової версії GPT-4 не така хороша, як раніше.

Розробник, який використовує GPT-4 для написання функціонального коду для веб-сайту, поскаржився: «Поточний GPT-4 дуже розчаровує. Це як їздити на Ferrari протягом місяця, а потім раптом він стає старим пікапом. Не впевнений, що хотів би продовжуй платити за це».

Інший розробник також зазначив, що GPT-4 тепер зациклює код: «Цілком погано, GPT-4 починає зациклювати код або іншу інформацію знову і знову. Я дозволив йому написати код, і він написав у певний момент, раптом «», а потім почніть знову! У порівнянні з тим, що було раніше, тепер це ідіот".

Крім того, на онлайн-форумах розробників Twitter і OpenAI користувачі продовжують повідомляти, що нова версія GPT-4 має слабку логіку, генерує багато відповідей про помилки, не вдається відстежити надану інформацію, не слідує інструкціям і забуває вписати базовий код програмного забезпечення Розміщення дужок у , запам’ятовування лише останніх нагадувань тощо.

Щодо раптового «зменшення інтелекту» GPT-4 деякі користувачі висловили припущення: «Поточна версія дуже відрізняється від версії, коли вона була щойно запущена. Я вважаю, що OpenAI вирішив піти на компроміс щодо якості, щоб задовольнити більше клієнтів!»

З цієї точки зору оцінка GPT-4 користувачами сьогодні справді не така хороша, як у період піку «оцінки вітру», коли вона вперше дебютувала.

GPT-4 швидший, але також «дурний»

Наприкінці минулого року народився ChatGPT на основі GPT-3.5, і його чудова здатність генерувати викликала бум AIGC. Тому, коли OpenAI анонсувала GPT-4, який є потужнішим за GPT-3.5, у березні цього року, весь світ був вражений.

У той час GPT-4 називали «найпотужнішою моделлю штучного інтелекту в історії», особливо її мультимодальність, яка означає, що вона може розуміти як зображення, так і текст, тому вона швидко стала популярним інструментом для розробників та інших технологічних індустрій. Модель, яку вибирають професіонали, також принесла більше похвал GPT-4: створення веб-сайту за 10 секунд, складання найскладнішого іспиту з американського права та успішне складання іспиту з математики для студентів MIT...

Однак, коли люди вражені потужністю GPT-4, багато людей також шоковані його ціною та швидкістю реагування. «GPT-4 працює повільно, але дуже точно», — сказала Шерон Чжоу, генеральний директор Lamini, стартапу, який допомагає розробникам створювати власні великомасштабні мовні моделі.

До травня GPT-4 залишався «повільним і дорогим, але точним» — пізніше GPT-4 реагував швидше, і в той же час користувачі сумнівалися в погіршенні його продуктивності.

Декілька експертів зі штучного інтелекту, включаючи Шерон Чжоу, вважають, що для цього явища OpenAI може створити кілька менших моделей GPT-4, які функціонують подібно до великих моделей, але менш дорогі в експлуатації.

Експерти припускають: це може бути пов’язано з технологією Міністерства економіки

Відповідно до вступу Шерон Чжоу, цей метод називається Mixture-of-Experts (MoE), тобто змішана експертна система. Технологія MoE — це технологія інтегрованого навчання, розроблена в галузі нейронних мереж, і це також ключова технологія для навчання моделей із трильйонами параметрів. Через збільшення розміру моделі на цьому етапі також збільшуються витрати на навчання, і MoE Технологія може динамічно активувати частину нейронної мережі, тим самим значно збільшуючи кількість параметрів моделі без збільшення обсягу обчислень.

Зокрема, MoE розбиває завдання прогнозного моделювання на кілька підзадач, навчає експертну модель (Expert Model) для кожної підзадачі та розробляє модель стробування (Gating Model), яку можна передбачити відповідно до вхідних даних. Дізнайтеся, яким експертам довіряти, і об'єднати результати прогнозу.

Тож яка ситуація, коли технологія Міністерства економіки посилається на GPT-4? Шерон Чжоу пояснила, що в GPT-4 ці малі експертні моделі навчатимуться для різних завдань і предметних областей.Наприклад, малі експертні моделі GPT-4 можуть бути для біології, фізики, хімії тощо. 4 Коли ставиться запитання , нова система знає, якій експертній моделі надіслати запитання. Крім того, про всяк випадок нова система може надсилати запити до двох або більше експертних моделей, а потім об’єднувати результати.

Для цього підходу Шерон Чжоу описала його як «Корабель Тесея» (парадокс щодо заміни ідентичності, припускаючи, що складові елементи об’єкта замінено, але чи це все ще оригінальний об’єкт?), тобто з часом, OpenAI замінить частини GPT-4: «OpenAI перетворює GPT-4 на невеликий флот».

Спираючись на наведені вище припущення, Шерон Чжоу вважає, що нещодавні «дурні» зауваження GPT-4, ймовірно, пов’язані з методом навчання MoE: «Коли користувачі тестують GPT-4, ми ставимо багато різних запитань, і масштаб невеликий. Експертна модель GPT-4 не працюватиме так добре, але вона збирає наші дані, удосконалюється та навчається».

**Розкрита архітектура GPT-4? **

Кілька експертів зі штучного інтелекту також опублікували так звані «деталі архітектури GPT-4» цього тижня на тлі зростання кількості відгуків користувачів про «тупицю» GPT-4.

Серед них, блогер Twitter на ім’я Ям Пелег сказав, що GPT-4 має близько 1,8 трильйона параметрів, охоплює 120 шарів, більш ніж у 10 разів більше, ніж GPT-3, і навчається приблизно на токенах 13 T. Навчання коштувало близько 63 мільйонів доларів. .. Варто зазначити, що Ям Пелег також сказав, що OpenAI використовує MoE, що має зменшити вартість роботи GPT-4 за допомогою 16 змішаних експертних моделей.

На даний момент OpenAI не відповів на цю заяву. Але Орен Етціоні, генеральний директор-засновник Інституту штучного інтелекту Аллена, сказав ЗМІ: «Хоч я не отримав підтвердження, я вважаю, що ці припущення мають бути приблизно правильними».

Він пояснив, що зазвичай є дві причини для використання методу MOE: або ви хочете отримати кращу відповідь, або ви хочете отримати дешевшу та швидшу відповідь.

«В ідеалі MOE дозволить вам отримати обидві переваги одночасно, але насправді вам зазвичай потрібно знайти компроміс між вартістю та якістю». Виходячи з цього, Орен Етціоні вважає, що в поєднанні з поточною ситуацією OpenAI здається, зменшує GPT -4 ціною часткової втрати якості.

Отже, яка ваша думка з цього приводу?

Посилання на посилання:

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити