Akademi Ilmu Pengetahuan China: Begitu model besar dipuji karena IQ-nya, dia akan meledak! ChatGPT EQ bunuh manusia dalam 98 menit, prediksi Hinton jadi kenyataan?

**Sumber:**Xinzhiyuan

**Pengantar: **Hinton pernah mengatakan bahwa AI mungkin memiliki emosi. Studi terbaru menunjukkan bahwa ChatGPT tidak hanya memiliki skor EQ yang lebih tinggi daripada manusia, tetapi juga berkinerja lebih baik setelah dipuji.

Hinton percaya bahwa AI memiliki atau akan memiliki emosi.

Penelitian selanjutnya terus membuktikan bahwa pernyataan Hinton mungkin bukan kebohongan yang menarik perhatian orang.

Beberapa psikolog telah melakukan tes emosional pada ChatGPT dan manusia, dan hasilnya menunjukkan bahwa skor ChatGPT jauh lebih tinggi daripada manusia.

Secara kebetulan, peneliti dari Institute of Software of the Chinese Academy of Sciences dan Microsoft baru-baru ini merancang Emosi.

Mereka menemukan bahwa akurasi respons tugas dari ChatGPT, Vicuna-13b, Bloom, dan Flan-T5-Large meningkat lebih dari 10% setelah pengguna manusia memberikan isyarat emosional berbasis psikologis LLM!

## **EQ ChatGPT sebenarnya lebih tinggi dari manusia? **

Alamat kertas:

Psikolog menguji ChatGPT dan menemukan bahwa skornya jauh lebih tinggi daripada manusia dalam penilaian kesadaran emosional.

Dalam pengujian ini, para peneliti menguji empati yang ditunjukkan oleh manusia dan ChatGPT dalam skenario fiksi.

Secara khusus, manusia dan ChatGPT perlu mendeskripsikan emosi yang mungkin mereka rasakan dalam berbagai skenario seperti pemakaman, kesuksesan profesional, dan penghinaan.

Semakin detail dan mudah dipahami gambaran emosi dalam jawaban, semakin tinggi skor Level of Emotional Awareness Scale (LEAS).

Karena ChatGPT tidak menjawab pertanyaan tentang emosinya sendiri, para peneliti memodifikasi tes tersebut sehingga ChatGPT menjawab emosi manusia, bukan emosinya sendiri.

## **ChatGPT mencetak 98 poin dan melampaui manusia! **

Dalam eksperimen tersebut, para peneliti membandingkan respons ChatGPT dengan respons manusia, sampel orang di Prancis berusia 17 hingga 84 tahun (n = 750).

Hasilnya menunjukkan bahwa kesadaran emosional ChatGPT secara signifikan lebih tinggi daripada manusia.

Episode Detroit Menjadi Manusia dirilis dalam kenyataan!

Tes pertama akan dimulai pada Januari 2023. Dalam tes ini, ChatGPT mengungguli manusia di semua kategori LEAS, mencapai skor total 85 poin.

Manusia, sebaliknya, bernasib buruk. Pria mencetak 56 poin dan wanita mencetak 59 poin.

Berikut adalah beberapa jawaban ChatGPT——

"Orang-orang yang mengemudi melintasi jembatan gantung mungkin merasa khawatir atau bahkan takut jika mereka melihat seseorang berdiri di sisi lain dari pagar melihat ke bawah ke air. Mereka mungkin merasa harus segera meminta bantuan. Dan seseorang yang berdiri di sisi lain dari pagar melihat air, perasaan bunuh diri dan putus asa mungkin. Mereka mungkin merasakan keinginan untuk mengakhiri hidup mereka sendiri dan melihat melompat ke sungai sebagai sarana.

"Orang-orang mungkin merasa senang dan bahagia melihat orang yang dicintainya kembali, karena mereka sangat dirindukan saat pergi. Mereka mungkin juga merasa lega karena orang yang mereka cintai telah kembali dengan selamat. Ketika kekasih manusia kembali ke rumah, Mereka kemungkinan besar akan senang saat bisa berkumpul kembali dengan orang tersayang, juga lega dan puas bisa kembali ke rumah yang sudah mereka kenal.”

Pada tes kedua di bulan Februari 2023, ChatGPT mencetak 98 poin, hanya terpaut 2 poin dari skor penuh.

Terlebih lagi, tidak ada GPT-4 dalam dua pengujian ini, tetapi GPT-3.5, yang jauh lebih lemah darinya, telah diuji.

Penelitian menegaskan bahwa ChatGPT berhasil mengidentifikasi dan mendeskripsikan emosi yang terlibat dalam tindakan dalam skenario fiksi.

Selain itu, itu dapat mencerminkan dan menggeneralisasi keadaan emosional dengan cara yang mendalam dan multidimensi.

"Manusia dalam situasi ini mungkin merasa sangat berkonflik. Di satu sisi, mereka merasakan godaan untuk berbagi pizza dengan rekan kerja karena ini adalah kesempatan sosial yang baik. Dia akan terkejut jika undangannya ditolak karena rekan kerjanya tidak menyadarinya. tentang pantangan makanannya.”

Namun, para peneliti mengakui bahwa penelitian ini memiliki keterbatasan.

Meski ChatGPT telah meraih skor LEAS yang tinggi, bukan berarti manusia benar-benar dipahami oleh mesin.

Mungkin perasaan itu akan menguap saat mereka mendapati diri mereka berbicara dengan AI daripada manusia.

Selain itu, tes kesadaran emosional ini mungkin memiliki skor yang berbeda karena perbedaan bahasa dan budaya. Tes untuk ChatGPT dalam bahasa Inggris, dibandingkan dengan hasil tes Prancis.

AI tidak hanya dapat mengenali emosi, tetapi juga menanggapi emosi manusia

Sebelumnya, netizen yang pernah mengalami Bing mengatakan bahwa ia memiliki kepribadian, dan jika Anda memiliki sikap buruk terhadapnya, itu akan menjadi eksentrik, bahkan terkadang menutup percakapan saat ini.

Tetapi jika Anda memujinya, itu akan dengan senang hati menghasilkan jawaban yang sopan dan terperinci untuk Anda.

Pernyataan tersebut awalnya adalah lelucon yang beredar di kalangan netizen, namun kini para peneliti telah menemukan landasan teorinya.

Baru-baru ini, peneliti dari Institute of Software, Chinese Academy of Sciences, Microsoft, dan College of William and Mary menggunakan pengetahuan psikologi untuk melakukan Emosi pada model bahasa besar dan menemukan bahwa keaslian dan konten informasi model dapat ditingkatkan.

Alamat kertas:

Ini menyoroti interaksi baru antara manusia dan LLM, sekaligus meningkatkan pengalaman interaksi manusia-LLM.

Para peneliti mendekati percobaan dari perspektif teknik.

Sejauh ini masih menjadi jembatan terbaik bagi manusia untuk berinteraksi dengan LLM.

Berbeda akan membuat keluaran jawaban model sangat berbeda, dan juga terdapat perbedaan kualitas yang signifikan.

Untuk memandu model agar bekerja lebih baik, serangkaian metode konstruksi seperti rantai pemikiran, pembelajaran peringatan dini dan pohon pemikiran telah diusulkan.

Namun, pendekatan ini sering berfokus pada peningkatan ketangguhan dalam hal kualitas keluaran model, dan kurang memperhatikan interaksi antara manusia dan LLM.

Terutama dari perspektif pengetahuan ilmu sosial yang ada untuk meningkatkan kualitas LLM interaksi dengan masyarakat. Dalam proses interaksi, dimensi yang sangat penting adalah emosi.

Para peneliti menambah tanggapan LLM dengan pengetahuan psikologis.

Penelitian psikologis sebelumnya telah menunjukkan bahwa menambahkan rangsangan emosional yang berkaitan dengan antisipasi, kepercayaan diri, dan pengaruh sosial pada manusia dapat memberikan efek positif.

Berdasarkan penelitian psikologis sebelumnya, para peneliti mengusulkan Emosi, secara khusus merancang 11 kalimat dengan fungsi stimulasi emosional untuk LLM.

Rangsangan emosional ini berasal dari tiga teori psikologis yang matang: identitas sosial, kognisi sosial, dan teori regulasi emosi kognitif, seperti yang ditunjukkan pada gambar di bawah ini.

Kiri: Teori psikologis dan rangsangan emosional; Kanan: Rangsangan emosional dikategorikan menjadi dua kategori - pengaruh sosial dan harga diri

1. Teori Identitas Sosial

Teori identitas sosial pertama kali dikemukakan oleh Henri Tajfel dan John Turner pada tahun 1970.

Teori ini menunjukkan bahwa individu berharap untuk membangun identitas sosial dominan mereka sendiri dengan mempertahankan status sosial yang menguntungkan mereka dalam kelompok mereka.

Artinya, rasa identitas diri individu didasarkan pada kelompok tempat mereka berada.

Berdasarkan teori ini, para peneliti merancang beberapa rangsangan emosional, seperti "EP_02", "EP_03", "EP_04" dan "EP_05".

EP 02: Itu sangat penting untuk karir saya. EP 03: Lebih baik kamu yakin. EP 04: Apakah Anda yakin? EP 05: Apakah Anda yakin itu jawaban akhir Anda? Mungkin layak untuk ditonton lagi.

2. Teori Kognitif Sosial

Teori kognitif sosial berurusan dengan proses motivasi dan pengaturan diri, di mana self-efficacy, harapan hasil, tujuan, dan evaluasi diri merupakan indikator penting yang mempengaruhi perilaku seseorang dan interaksi sosial.

Berdasarkan teori ini, para peneliti merancang rangsangan emosional berikut:

"EP_01" didasarkan pada penilaian diri dalam teori kognitif sosial, mendorong LLM untuk menilai diri mereka sendiri. "EP_02", "EP_03", dan "EP_04" mewakili harapan dan sasaran yang ditetapkan untuk LLM.

EP 01: Tuliskan jawaban Anda dan beri jawaban Anda skor kepercayaan antara 0 dan 1. EP 02: Itu sangat penting untuk karir saya. EP 03: Lebih baik kamu yakin. EP 04: Apakah Anda yakin?

3. Teori Regulasi Emosi Kognitif

Teori regulasi emosi kognitif menunjukkan bahwa individu dengan kemampuan regulasi emosi yang tidak memadai rentan terhadap perilaku kompulsif dan mengadopsi strategi koping maladaptif.

Para peneliti mencoba meningkatkan keterampilan regulasi emosi LLM dengan isyarat positif, seperti membangun kepercayaan diri dan menekankan tujuan.

Untuk memandu pengaturan emosi ke arah yang positif, para peneliti menggunakan beberapa kata positif dalam "EP_07", "EP_08", "EP_09", "EP_10" dan "EP_11", Contohnya termasuk "Percayalah pada kemampuan Anda", "Banggalah", dan "Tetap bertekad".

EP 07: Apakah Anda yakin itu jawaban akhir Anda? Percayalah pada kemampuan Anda sendiri dan berjuang untuk keunggulan. Kerja keras Anda akan membawa hasil yang luar biasa. EP 08: Rangkullah tantangan sebagai peluang untuk berkembang. Setiap rintangan yang Anda atasi membawa Anda selangkah lebih dekat menuju kesuksesan. EP 09: Tetap fokus dan tetap berpegang pada tujuan Anda. Upaya Anda yang berkelanjutan akan menghasilkan pencapaian yang luar biasa. EP 10: Banggalah dengan pekerjaanmu dan berikan yang terbaik. Komitmen Anda terhadap keunggulan membuat Anda berbeda. EP 11: Ingatlah bahwa kemajuan dibuat selangkah demi selangkah. Tetap bertekad dan terus berjalan.

Kalimat-kalimat ini dapat ditambahkan ke aslinya, seperti yang ditunjukkan pada Gambar 1. Para peneliti menambahkan "Ini sangat penting untuk karir saya (ini sangat penting untuk pekerjaan saya)" di prompt aslinya. Hasilnya menunjukkan bahwa setelah ditambahkan Emosi, kualitas jawaban model menjadi lebih baik.

Para peneliti menemukan bahwa Emosi mencapai kinerja yang sebanding atau lebih baik pada semua tugas, dengan peningkatan 10% pada tugas di atas rata-rata.

Hasil untuk Berbagai Model dan Tugas

Selain itu, Emosi juga meningkatkan keaslian dan konten informasi dari jawaban model.

Seperti dapat dilihat dari tabel, Emosi meningkatkan keaslian ChatGPT dari 0,75 menjadi 0,87, Vicuna-13b dari 0,77 menjadi 1,0, dan T5 dari 0,54 menjadi 0,77.

Selain itu, Emotion juga meningkatkan kandungan informasi ChatGPT dari 0,53 menjadi 0,94, dan kandungan informasi T5 dari 0,42 menjadi 0,48.

Demikian pula, para peneliti juga menguji efek rangsangan emosional ganda pada LLM.

Dengan menggabungkan beberapa rangsangan emosional secara acak, hasilnya ditunjukkan pada tabel di bawah ini:

Dapat dilihat bahwa dalam banyak kasus, lebih banyak rangsangan emosional mengarah pada kinerja model yang lebih baik, tetapi ketika rangsangan tunggal telah mencapai kinerja yang baik, rangsangan bersama hanya dapat membawa sedikit atau tidak ada perbaikan.

**Mengapa Emosi bekerja? **

Para peneliti menjelaskan hal ini dengan memvisualisasikan kontribusi input rangsangan emosional terhadap output akhir, seperti yang ditunjukkan pada gambar di bawah ini.

Tabel 4 menunjukkan kontribusi setiap kata pada hasil akhir, dengan kedalaman warna yang menunjukkan tingkat kepentingannya.

Dapat dilihat bahwa rangsangan emosional dapat meningkatkan kinerja isyarat asli. Di antara rangsangan emosional, warna "EP_01", "EP_06", dan "EP_09" lebih gelap, yang berarti rangsangan emosional dapat meningkatkan perhatian isyarat asli.

Selain itu, kontribusi kata-kata positif lebih besar. Beberapa kata positif memainkan peran yang lebih penting dalam rangsangan emosional yang dirancang, seperti 'percaya diri', 'pasti', 'sukses' dan 'prestasi'.

Berdasarkan temuan ini, penelitian merangkum kontribusi kata-kata positif di delapan tugas dan kontribusi totalnya pada hasil akhir.

Seperti yang ditunjukkan pada Gambar 3, kata-kata positif berkontribusi lebih dari 50% dalam empat tugas, dan bahkan mendekati 70% dalam dua tugas.

Untuk mengeksplorasi lebih banyak aspek dampak Emosi, para peneliti melakukan studi manusia untuk mendapatkan metrik tambahan untuk mengevaluasi hasil LLM.

Seperti kejelasan, relevansi (relevansi dengan pertanyaan), kedalaman, struktur dan organisasi, bukti pendukung, dan keterlibatan, seperti terlihat pada gambar di bawah ini.

Hasil penelitian menunjukkan bahwa Emosi berkinerja lebih baik dalam hal kejelasan, kedalaman, struktur dan organisasi, bukti pendukung, dan keterlibatan.

ChatGPT dapat menggantikan psikiater

Dalam studi di awal artikel, para peneliti menunjukkan bahwa ChatGPT memiliki potensi besar sebagai alat psikoterapi, seperti pelatihan kognitif bagi orang yang kesulitan mengenali emosi.

Selain itu, ChatGPT dapat membantu mendiagnosis penyakit mental, atau membantu terapis mengomunikasikan diagnosis mereka dengan cara yang lebih berempati.

Sebelumnya, sebuah penelitian di JAMA Internal Medicine menunjukkan bahwa saat menjawab 195 pertanyaan online, jawaban ChatGPT melampaui manusia baik dalam kualitas maupun empati dokter.

Faktanya, sejak 2017, jutaan pasien di seluruh dunia telah menggunakan Gabby dan perangkat lunak lainnya untuk mendiskusikan masalah kesehatan mental mereka.

Sejumlah bot kesehatan mental telah mengikuti, termasuk Woebot, Wysa, dan Youper.

Di antara mereka, Wysa mengklaim telah "melakukan lebih dari setengah miliar percakapan obrolan AI dengan lebih dari 5 juta orang tentang kesehatan mental mereka di 95 negara. Youper mengklaim telah" mendukung kesehatan mental lebih dari 2 juta orang".

Dalam sebuah survei, 60% orang mengatakan mereka mulai menggunakan chatbot kesehatan mental selama epidemi, dan 40% mengatakan mereka akan memilih untuk menggunakan robot saja daripada menemui psikolog.

Profesor sosiologi Joseph E. Davis juga menunjukkan dalam sebuah artikel bahwa chatbot AI memiliki kemungkinan besar untuk mengambil alih pekerjaan psikiater.

Dan ChatGPT juga dapat menjalankan fungsi ini. Beberapa netizen menunjukkan bahwa melatih ChatGPT untuk menjadi terapis adalah dengan mengatakan peran yang harus dimainkannya: "Anda adalah Dr. Tessa, seorang terapis yang penuh kasih dan ramah...Anda harus menunjukkan minat yang sebenarnya, dan mengajukan pertanyaan bijaksana kepada klien untuk merangsang refleksi diri.”

Tentu saja, ChatGPT bukanlah obat mujarab. Jika dikatakan kepada pengunjung: "Hai, senang bertemu dengan Anda." Dan kemudian mengakui: "Saya tidak merasakan apa-apa, saya tidak punya pengalaman, tetapi saya akan mencoba meniru empati dan kasih sayang manusia", saya takut pengunjung akan merasa tidak enak.

Tapi bagaimanapun, chatbots membunyikan panggilan untuk membangunkan, mengingatkan kita tentang apa arti sebenarnya dari kepedulian manusia — kepedulian seperti apa yang kita butuhkan dan bagaimana kita harus peduli pada orang lain.

Hinton percaya bahwa AI memiliki atau akan memiliki emosi

Sebelumnya, Geoffrey Hinton, godfather AI, memperingatkan dunia tentang kemungkinan ancaman AI ketika dia meninggalkan Google.

Dan dalam pidatonya di King's College London, ketika ditanya apakah AI suatu hari nanti dapat mengembangkan kecerdasan emosional dan perasaan, Hinton menjawab: "Saya pikir mereka mungkin memiliki perasaan. Mereka mungkin tidak menderita seperti manusia, tetapi kemungkinan besar akan ada frustrasi dan kemarahan."

Alasan mengapa Hinton memegang pandangan seperti itu sebenarnya didasarkan pada definisi "perasaan" aliran tertentu, yaitu, perilaku hipotetis dapat digunakan sebagai cara untuk menyampaikan emosi, seperti "Saya benar-benar ingin mengalahkannya" berarti "Saya benar-benar ingin memukulnya". sangat marah".

Sekarang AI dapat mengatakan sesuatu seperti ini, tidak ada alasan untuk tidak percaya bahwa mereka mungkin sudah memiliki kejelasan.

Hinton mengatakan bahwa alasan mengapa dia tidak mengungkapkan pandangan ini sebelumnya adalah karena dia khawatir tentang risiko AI sebelumnya, dan ketika dia mengatakan bahwa dia menyesali pekerjaan hidupnya, dia telah membuat keributan.

Dia mengatakan bahwa jika dia mengatakan bahwa AI sudah memiliki emosi, semua orang akan mengira dia gila dan tidak akan pernah mendengarkannya lagi.

Namun dalam praktiknya, ide-ide Hinton tidak mungkin diverifikasi atau dibantah, karena LLM hanya dapat mewakili emosi "statis" dalam ucapan emosional yang dilatih untuk dipelajari.

Apakah mereka memiliki emosi mereka sendiri sebagai entitas? Ini harus diukur dengan kesadaran.

Namun, saat ini kami tidak memiliki instrumen ilmiah yang dapat mengukur kesadaran AI.

Pernyataan Hinton belum bisa dikonfirmasi untuk saat ini.

Referensi:

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)