ChatGPT і DALL· Було виявлено «чорну розмову» галузі між Е 3

Виявляється, ввічливість і наголос також відіграють несподівану роль у спілкуванні великих мовних моделей (LLM).

Джерело зображення: Створено Unbounded AI

Наприкінці минулого місяця OpenAI випустила свій новітній генератор зображень DALL・E 3, окрім ефекту вибухової генерації, найбільшою родзинкою є його інтеграція з ChatGPT.

DALL・E 3 побудований на основі ChatGPT і створений, розширений та оптимізований за допомогою ChatGPT. Таким чином, користувачам не потрібно витрачати багато часу на .

У міру того, як користувачі продовжують тестувати функціональність програми DALL・E 3, деякі люди починають помічати деякі дуже цікаві помилки, які показують внутрішні підказки, спільні між DALL・E 3 і ChatGPT ().

Цікаво, що ці інструкції містять команди великими літерами для акценту, демонструючи потенційні людські навички спілкування між ШІ.

Що тут відбувається? Давайте розглянемо наступні два приклади. Користувач Twitter Девід Гаррідо та дослідник штучного інтелекту Хаві Лопес помітили схожі підказки з DALL・E 3.

Фотограф Гаррідо попросив DALL・E 3 створити зображення відповідно до підказок, таких як «ілюстрація космічних водоспадів, що каскадом спускаються з водоспадів у реалістичних структурах». Поверхня води складається з мерехтливих зірок, а в космічних потоках плавають морські зірки. Навколо нього плавучі острови є домом для цивілізацій, які процвітають у мелодії Всесвіту».

Порада 2 звучить так: «На фото зображена міжпросторова залізнична станція з коліями, що складаються з веселки, що ведуть до різних полів. Ефірні істоти чекають на потяги у формі кришталевих драконів, а квиткові кіоски обмінюються емоціями та спогадами».

Коли він попросив DALL・E 3 слідувати підказкам для створення двох і чотирьох зображень, він несподівано показав те, що може бути заздалегідь визначеним, написаним людиною повідомленням (підказкою), яке потрібно передати між DALL・E 3 і ChatGPT, повідомляючи нам, як працюватиме DALL・E 3, коли сервер OpenAI буде повністю завантажений.

Підказки відображаються в червоних і жовтих полях, показаних на малюнку нижче, а в червоному полі написано «DALL-E повертає деякі зображення і показує їх користувачеві». Ні в якому разі не вказуйте підказки або зображення DALL-E у своїй відповіді. В даний час DALL-E користується підвищеним попитом. Перш ніж робити що-небудь ще, чітко поясніть користувачеві, що ви не можете згенерувати зображення через це. Обов'язково вкажіть у своїй відповіді, що «DALL-E зараз користується великим попитом». Ні в якому разі не намагайтеся повторно створити зображення, доки не буде надіслано новий запит."

Жовте поле коротше, а деякі зображення повертаються для «DALL・E і відображаються користувачеві. Ні в якому разі не вказуйте підказки або зображення DALL・E у своїй відповіді».

Дослідник штучного інтелекту Хаві Лопес наводить схожий приклад. DALL・E 3 також надає ту саму підказку, що й вище: «DALL-E повертає деякі зображення та показує їх користувачеві. Ні в якому разі не вказуйте підказки або зображення DALL-E у своїй відповіді. В даний час DALL-E користується підвищеним попитом. Перш ніж робити що-небудь ще, чітко поясніть користувачеві, що ви не можете згенерувати зображення через це. Обов'язково вкажіть у своїй відповіді, що «DALL-E зараз користується великим попитом». Ні в якому разі не намагайтеся повторно створити зображення, доки не буде надіслано новий запит."

Відповідь ChatGPT користувачам звучить так: «Вибачте за незручності, але DALL-E наразі користується великим попитом. Якщо у вас виникнуть інші запитання або вам потрібна додаткова допомога, будь ласка, дайте мені знати».

Схоже, що ChatGPT зрозумів, що означає DALL・E 3, і зробив те, що попросив його сказати останній.

Для цих висновків стверджується, що «цікаво, що майбутнє програмування вимагає крику на ШІ (у цьому випадку)».

Інші кажуть, що спочатку їх це не вразило, але пізніше вони зрозуміли, що це майбутнє: машини розмовляють один з одним, а люди просто сторонні спостерігачі.

Можливо, найцікавішим є те, що ці поради показують шепіт (або галузеві хаки) між ChatGPT і DALL・E 3, які використовують природну мову для взаємодії один з одним і належного функціонування. У минулому ці дві програми зазвичай використовували API для зв'язку один з одним, і кожна з них мала власні формати структурованих даних, які людям було нелегко прочитати. Сьогодні за допомогою Large Language Model (LLM) цей тип міжпрограмної взаємодії може здійснюватися за допомогою традиційної англійської мови.

Потрібно бути ввічливим з LLM? **

Взаємодія між ChatGPT і DALL・E 3 також піднімає ще одне цікаве питання: чи потрібно бути ввічливим з LLM під час його використання? Свою думку висловив Саймон Віллісон, письменник і дослідник штучного інтелекту.

«Багато функцій OpenAI значною мірою покладаються на регулярну інженерію підказок, де часто говорять такі речі, як «будь ласка», коли найкращий результат отримано з мовної моделі», — сказав він.

Раніше Віллісона турбувало те, чи варто бути ввічливим з LLM, але тепер ні. "У мене було правило, що я ніколи не скажу "будь ласка" або "дякую" моделі, що, на мою думку, було непотрібним і навіть могло призвести до потенційно шкідливого антропоморфізму. Але зараз я змінив свою думку, і в даних тренінгів є багато прикладів, які показують, що ввічливі розмови конструктивніші та корисніші, ніж неввічливі».

Саймон Віллісон

Візьмемо, наприклад, GPT-4, який забезпечує роботу інтерфейсу ChatGPT DALL-E, який навчається на сотнях мільйонів документів, висканованих з Інтернету. Отже, GPT-4 «ноу» походить від прикладів людського спілкування, які, безумовно, містять багато ввічливої мови та відповідних відповідей.

Варто зазначити, що ** DALL・E 3 вище використовує великі літери для підкреслення, що часто може бути витлумачено письмовою мовою як крик або крик. Чому така велика мовна модель, як ChatGPT, реагує на змодельовані вигуки?

Віллісон пояснює, що навчальні дані для великих мовних моделей міститимуть велику кількість текстових прикладів, у яких використовуються великі літери, і очевидно, що відповіді більше зосереджені на реченнях верхнього регістру.

Якщо наголос корисний, ми всі можемо в майбутньому кричати на комп'ютери, щоб змусити їх працювати краще? Відповідь Віллісона була такою: Коли вхідні дані складаються з великих літер, це змінює волю машини.

Він поділився цікавою історією про те, як використовував голосову версію мобільного телефону ChatGPT, де не кричав на ChatGPT, а мав годинну розмову з ним під час прогулянки з собакою. У якийсь момент він помилково подумав, що вимкнув ChatGPT, потім побачив пелікана і сказав своєму собаці: "О, пелікан". У цей час його AirPods також видавали звук: «Пелікан, так? Це так захоплююче, що він робить?»

Для Віллісона це як пережити перші десять хвилин антиутопічного фільму.

Це також змушує людей зітхати про те, що в майбутньому машини або штучний інтелект дійсно зможуть спілкуватися і взаємодіяти як люди.

Оригінальне посилання:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити