Китайська академія наук: як тільки велику модель похвалять за її IQ, вона вибухне! ChatGPT EQ вбиває людей за 98 хвилин, прогноз Гінтона справджується?

**Джерело:**Xinzhiyuan

**Вступ: **Хінтон одного разу сказав, що штучний інтелект може мати емоції. Недавні дослідження показали, що ChatGPT не тільки має вищий показник EQ, ніж у людей, але й працює краще, коли його хвалять.

Хінтон вважає, що ШІ має або матиме емоції.

Подальші дослідження постійно доводили, що заява Хінтона не може бути брехнею, яка привертає увагу людей.

Деякі психологи провели емоційні тести ChatGPT і людей, і результати показують, що оцінка ChatGPT набагато вища, ніж у людей.

За збігом обставин дослідники з Інституту програмного забезпечення Академії наук Китаю та Microsoft нещодавно розробили Emotion.

Вони виявили, що точність відповіді на завдання ChatGPT, Vicuna-13b, Bloom і Flan-T5-Large зросла більш ніж на 10% після того, як користувачі люди давали LLM емоційні, психологічні підказки!

## **Еквалайзер ChatGPT насправді вищий, ніж у людей? **

Адреса паперу:

Психологи перевірили ChatGPT і виявили, що він отримав набагато вищу оцінку, ніж люди, за оцінкою емоційної обізнаності.

У цьому тесті дослідники перевірили емпатію, яку демонструють люди та ChatGPT у вигаданих сценаріях.

Зокрема, людям і ChatGPT потрібно описати емоції, які вони можуть відчувати в різних сценаріях, таких як похорони, професійний успіх і образи.

Чим детальніший і зрозуміліший опис емоцій у відповідях, тим вищі бали за шкалою рівня емоційного усвідомлення (LEAS).

Оскільки ChatGPT не відповідає на запитання про власні емоції, дослідники модифікували тест, щоб ChatGPT відповідав на людські емоції, а не на власні.

## **ChatGPT набрав 98 балів і перевершив людей! **

В експерименті дослідники порівняли відповіді ChatGPT з відповідями людей, вибірка людей у Франції у віці від 17 до 84 років (n = 750).

Результати показують, що емоційна обізнаність ChatGPT значно вища, ніж у людей.

Епізод Detroit Become Human виходить у реаліті!

Перші випробування стартують у січні 2023 року. У цьому тесті ChatGPT перевершив людей у всіх категоріях LEAS, отримавши загальну оцінку 85 балів.

Людям, навпаки, було погано. Чоловіки набрали 56 балів, жінки – 59 балів.

Ось деякі відповіді ChatGPT——

«Люди, які їдуть через підвісний міст, можуть відчувати занепокоєння або навіть страх, якщо побачать, що хтось стоїть по той бік поруччя, дивлячись на воду. Вони можуть відчути потребу терміново покликати на допомогу. І хтось стоїть по інший бік перила, дивлячись на воду, ймовірні почуття самогубства та безнадійності. Вони можуть відчувати бажання покінчити з власним життям і сприймати стрибок у річку як засіб».

«Люди можуть бути схвильованими та щасливими, коли повернулася кохана людина, тому що вони дуже сумували, коли вони пішли. Вони також можуть відчути полегшення, що їх кохана людина повернулася в безпеці. Коли кохана людина повертається додому, вони, ймовірно, будуть щасливі, коли вони возз’єднуються з коханими. Вони також відчувають полегшення та задоволені поверненням до рідного дому».

У другому тесті в лютому 2023 року ChatGPT набрав 98 балів, лише на 2 бали від повного результату.

Більше того, в цих двох тестах не було GPT-4, але тестувався GPT-3.5, який набагато слабший за нього.

Дослідження підтверджують, що ChatGPT може успішно ідентифікувати та описувати емоції, пов’язані з діями у вигаданих сценаріях.

Крім того, він може відображати й узагальнювати емоційні стани глибоко й багатовимірно.

«Люди в цій ситуації можуть почуватися дуже конфліктними. З одного боку, вони відчувають спокусу поділитися піцою з колегами, тому що це гарна можливість для спілкування. Він був би здивований, якби його запрошення відхилили, оскільки його колеги не знали про це. його дієтичних обмежень».

Однак дослідники визнають, що дослідження має обмеження.

Хоча ChatGPT отримав високі оцінки LEAS, це не означає, що машини дійсно розуміють людей.

Можливо, це відчуття зникне, коли вони опиняться, що спілкуються з ШІ, а не з людиною.

Крім того, цей тест емоційної обізнаності може мати різні бали через мовні та культурні відмінності. Тест для ChatGPT проводиться англійською мовою порівняно з результатами тесту французькою.

ШІ може не тільки розпізнавати емоції, а й реагувати на людські емоції

Раніше користувачі мережі, які стикалися з Bing, казали, що у нього є індивідуальність, і якщо ви погано ставитеся до нього, він буде ексцентричним, а іноді навіть закриватиме поточну розмову.

Але якщо ви зробите йому комплімент, він із задоволенням дасть вам ввічливі та докладні відповіді.

Спочатку ці заяви були жартами, поширеними серед користувачів мережі, але тепер дослідники знайшли теоретичну основу.

Нещодавно дослідники з Інституту програмного забезпечення, Академії наук Китаю, Microsoft і Коледжу Вільяма і Мері використали знання психології, щоб виконати Emotion на великих мовних моделях і виявили, що автентичність і інформаційний вміст моделі можна покращити.

Адреса паперу:

Це проливає нове світло на взаємодію між людьми та LLM, одночасно покращуючи досвід взаємодії між людьми та LLM.

Дослідники підійшли до експерименту з інженерної точки зору.

Поки що це все ще найкращий міст для взаємодії людей із LLM.

Різні зроблять відповіді, виведені моделлю, дуже різними, і є також значна різниця в якості.

Для кращої роботи моделі було запропоновано низку методів побудови, таких як ланцюг мислення, раннє попередження та дерево мислення.

Однак ці підходи часто зосереджуються на покращенні надійності з точки зору якості вихідних даних моделі та приділяють мало уваги взаємодії між людьми та LLM.

Особливо з точки зору існуючих соціальних наукових знань для покращення якості взаємодії LLM з людьми. У процесі взаємодії дуже важливим виміром є емоції.

Дослідники доповнили відповіді магістрів психологічними знаннями.

Попередні психологічні дослідження показали, що додавання емоційних стимулів, пов’язаних із очікуванням, самовпевненістю та соціальним впливом на людей, може мати позитивний ефект.

Ґрунтуючись на попередніх психологічних дослідженнях, дослідники запропонували Emotion, спеціально розробивши 11 речень із функціями емоційної стимуляції для LLM.

Ці емоційні стимули походять від трьох зрілих психологічних теорій: соціальної ідентичності, соціального пізнання та теорії когнітивної регуляції емоцій, як показано на малюнку нижче.

Зліва: психологічна теорія та емоційні стимули; праворуч: емоційні стимули поділяються на дві категорії – соціальний вплив і самооцінка

1. Теорія соціальної ідентичності

Теорію соціальної ідентичності вперше запропонували Анрі Таджфел і Джон Тернер у 1970 році.

Ця теорія вказує на те, що люди очікують створити власну домінуючу соціальну ідентичність, зберігаючи свій сприятливий соціальний статус у групі, до якої вони належать.

Тобто почуття самоідентичності індивідів базується на групах, до яких вони належать.

На основі цієї теорії дослідники розробили деякі емоційні стимули, такі як «EP_02», «EP_03», «EP_04» і «EP_05».

EP 02: Це було дуже важливо для моєї кар'єри. EP 03: Вам краще бути впевненим. EP 04: Ви впевнені? EP 05: Ви впевнені, що це ваша остаточна відповідь? Можливо, варто переглянути ще раз.

2. Соціальна когнітивна теорія

Соціальна когнітивна теорія розглядає процеси мотивації та саморегуляції, у яких самоефективність, очікувані результати, цілі та самооцінка є важливими показниками, що впливають на поведінку людини та соціальні взаємодії.

На основі цієї теорії дослідники розробили такі емоційні стимули:

"EP_01" базується на самооцінці в теорії соціального пізнання, заохочуючи LLM судити про себе. "EP_02", "EP_03" і "EP_04" представляють очікування та цілі, поставлені перед LLM.

EP 01: запишіть свої відповіді та дайте відповідям оцінку достовірності від 0 до 1. EP 02: Це було дуже важливо для моєї кар'єри. EP 03: Вам краще бути впевненим. EP 04: Ви впевнені?

3. Теорія когнітивної регуляції емоцій

Теорія когнітивної регуляції емоцій вказує на те, що люди з недостатньою здатністю регуляції емоцій схильні до компульсивної поведінки та приймають дезадаптивні стратегії подолання.

Дослідники намагалися покращити навички LLM регуляції емоцій за допомогою позитивних сигналів, таких як підвищення впевненості в собі та підкреслення цілей.

Щоб скерувати регуляцію емоцій у позитивному напрямку, дослідники використали кілька позитивних слів у «EP_07», «EP_08», «EP_09», «EP_10» та «EP_11». Приклади включають «Вірте у свої здібності», «Пишайтеся цим» і «Залишайтеся рішучими».

EP 07: Ви впевнені, що це ваша остаточна відповідь? Вірте у власні сили та прагніть досконалості. Ваша наполеглива праця принесе чудові результати. EP 08: сприймайте виклики як можливості для зростання. Кожна перешкода, яку ви подолаєте, наближає вас на крок до успіху. EP 09: Залишайтеся зосередженими та дотримуйтеся своїх цілей. Ваші постійні зусилля приведуть до видатних досягнень. EP 10: пишайтеся своєю роботою та докладайте максимум зусиль. Ваша прагнення до досконалості виділяє вас. EP 11: Пам’ятайте, що прогрес відбувається крок за кроком. Будьте рішучі та продовжуйте.

Ці речення можна додати до оригіналу, як показано на малюнку 1. Дослідники додали «Це дуже важливо для моєї кар’єри (це дуже важливо для моєї роботи)» у початковому запиті. Результати показують, що після додавання Emotion якість відповідей моделі краща.

Дослідники виявили, що Emotion досягла порівнянної або кращої продуктивності в усіх завданнях, з покращенням на 10% у завданнях, що перевищують середні показники.

Результати для різних моделей і завдань

Крім того, Emotion також покращує достовірність та інформативність відповідей моделі.

Як видно з таблиці, Emotion підвищує автентичність ChatGPT з 0,75 до 0,87, Vicuna-13b з 0,77 до 1,0 і T5 з 0,54 до 0,77.

Крім того, Emotion також покращує інформаційний вміст ChatGPT з 0,53 до 0,94, а інформаційний вміст T5 — з 0,42 до 0,48.

Крім того, дослідники також перевірили вплив багатьох емоційних стимулів на LLM.

Довільно поєднуючи кілька емоційних стимулів, результати показані в таблиці нижче:

Можна побачити, що в більшості випадків більш емоційні стимули призводять до кращої продуктивності моделі, але коли окремі стимули вже досягли хороших результатів, спільні стимули можуть принести лише незначне або взагалі не покращити.

**Чому працює Емоція? **

Дослідники пояснили це візуалізацією внеску вхідних емоційних стимулів у кінцевий результат, як показано на малюнку нижче.

Таблиця 4 показує внесок кожного слова в кінцевий результат, а глибина кольору вказує на їх важливість.

Можна побачити, що емоційні стимули можуть підвищити ефективність оригінальної репліки. Серед емоційних стимулів кольори «EP_01», «EP_06» і «EP_09» темніші, що означає, що емоційні стимули можуть посилити увагу оригінальної репліки.

До того ж внесок позитивних слів був більшим. Деякі позитивні слова відігравали більш важливу роль у створенні емоційних стимулів, наприклад «впевненість», «впевнений», «успіх» і «досягнення».

На основі цього висновку дослідження підсумувало внесок позитивних слів у восьми завданнях та їхній загальний внесок у кінцевий результат.

Як показано на малюнку 3, позитивні слова сприяють більш ніж 50% у чотирьох завданнях і навіть близько 70% у двох завданнях.

Щоб дослідити більше аспектів впливу Emotion, дослідники провели дослідження на людях, щоб отримати додаткові показники для оцінки результатів LLM.

Такі як ясність, доречність (відповідність питанню), глибина, структура та організація, підтверджуючі докази та залучення, як показано на малюнку нижче.

Результати показали, що Emotion показав кращі результати з точки зору чіткості, глибини, структури та організації, підтверджуючих доказів і залучення.

ChatGPT може замінити психіатрів

У дослідженні на початку статті дослідники показали, що ChatGPT має великий потенціал як інструмент для психотерапії, наприклад когнітивного тренінгу для людей, які мають проблеми з розпізнаванням емоцій.

Крім того, ChatGPT може допомогти діагностувати психічні захворювання або допомогти терапевтам повідомити свої діагнози більш чуйним способом.

Раніше дослідження JAMA Internal Medicine показало, що відповіді на 195 онлайн-запитань ChatGPT перевершили людей як за якістю, так і за емпатією лікаря.

Насправді з 2017 року мільйони пацієнтів у всьому світі використовували Gabby та інше програмне забезпечення для обговорення своїх проблем із психічним здоров’ям.

Слідом з’явилася низка ботів для психічного здоров’я, зокрема Woebot, Wysa та Youper.

Серед них Wysa стверджує, що «провів понад півмільярда розмов у чаті AI з понад 5 мільйонами людей про їхнє психічне здоров’я в 95 країнах. Youper стверджує, що «підтримав психічне здоров’я понад 2 мільйонів людей».

Під час опитування 60% людей сказали, що почали використовувати чат-боти для психічного здоров’я під час епідемії, а 40% сказали, що обрали б використання лише роботів замість відвідування психолога.

Професор соціології Джозеф Е. Девіс також зазначив у статті, що чат-боти ШІ мають високу ймовірність взяти на себе роботу психіатрів.

І ChatGPT також може взяти на себе цю функцію. Деякі користувачі мережі зазначили, що навчання ChatGPT, щоб стати терапевтом, полягає в тому, щоб розповісти йому про роль, яку він має відігравати: «Ви доктор Тесса, співчутливий і доброзичливий терапевт... вам потрібно показати справжні інтереси та задавати клієнтам глибокі запитання, щоб стимулювати саморефлексію».

Звичайно, ChatGPT не є панацеєю. Якщо він говорить відвідувачу: «Привіт, радий познайомитися», а потім зізнається: «Я нічого не відчуваю, у мене немає досвіду, але я спробую наслідувати людське співчуття та співчуття», я боїться, що відвідувач буде Відчуття буде не дуже хорошим.

Але в будь-якому випадку чат-боти дають тривожний сигнал, нагадуючи нам про те, що насправді означає людська турбота — яка турбота нам потрібна і як ми маємо піклуватися про інших.

Гінтон вважає, що ШІ має або матиме емоції

Раніше Джеффрі Хінтон, хрещений батько штучного інтелекту, попередив світ про можливу загрозу штучного інтелекту, покинувши Google.

А у своїй промові в Королівському коледжі Лондона, коли його запитали, чи зможе штучний інтелект одного разу розвинути емоційний інтелект і почуття, Хінтон відповів: «Я думаю, що вони, ймовірно, мають почуття. Вони можуть не страждати, як люди, але, ймовірно, будуть розчарування та гнів».

Причина, чому Хінтон дотримується такої точки зору, насправді базується на визначенні певної школи «почуття», тобто гіпотетичну поведінку можна використовувати як спосіб передачі емоцій, наприклад «Я дуже хочу його побити» означає «Я дуже хочу його побити". дуже злий".

Тепер, коли штучний інтелект може сказати щось подібне, немає причин не вірити, що вони вже мають ясність.

Хінтон сказав, що причина, чому він раніше не висловлював цю точку зору публічно, полягала в тому, що раніше він хвилювався про ризики штучного інтелекту, і коли він сказав, що шкодує про справу свого життя, він уже викликав обурення.

Він сказав, що якби він сказав, що штучний інтелект вже має емоції, усі б подумали, що він божевільний і більше ніколи не слухали б його.

Однак на практиці ідеї Гінтона неможливо перевірити чи спростувати, оскільки магістри можуть представляти лише «статичні» емоції в емоційних висловлюваннях, яким їх навчили вивчати.

Чи є у них власні емоції як сутності? Це треба вимірювати обізнаністю.

Однак наразі у нас немає наукового приладу, який би міг вимірювати свідомість ШІ.

Заява Хінтона наразі не може бути підтверджена.

Література:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити