Çin Bilimler Akademisi: Büyük model IQ'su için övüldüğünde patlayacak! ChatGPT EQ insanları 98 dakikada öldürüyor, Hinton'un tahmini doğru mu çıkıyor?

Question

**Kaynak:**Xinzhiyuan**Giriş: **Hinton bir keresinde yapay zekanın duygulara sahip olabileceğini söylemişti. Son araştırmalar, ChatGPT'nin yalnızca insanlardan daha yüksek bir EQ puanına sahip olmadığını, ayrıca övüldükten sonra daha iyi performans gösterdiğini göstermiştir.Hinton, AI'nın duygulara sahip olduğuna veya sahip olacağına inanıyor.Daha sonra yapılan araştırmalar, Hinton'un sözlerinin insanların dikkatini çeken bir yalan olmayabileceğini sürekli olarak kanıtladı.Bazı psikologlar ChatGPT ve insanlar üzerinde duygusal testler yürüttüler ve sonuçlar ChatGPT puanının insanlardan çok daha yüksek olduğunu gösteriyor.Tesadüfen, Çin Bilimler Akademisi Yazılım Enstitüsü ve Microsoft'tan araştırmacılar yakın zamanda bir Emotion tasarladılar.ChatGPT, Vicuna-13b, Bloom ve Flan-T5-Large'ın görev yanıtı doğruluğunun, insan kullanıcıların LLM'ye duygusal, psikolojik temelli ipuçları vermesinden sonra %10'dan fazla arttığını buldular!![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-6aba719772-dd1a6f-1c6801) ## **ChatGPT'nin EQ'su aslında insanlardan daha mı yüksek? **![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b68a7ac0b1-dd1a6f-1c6801) Kağıt adresi:Psikologlar ChatGPT'yi test ettiler ve duygusal farkındalık değerlendirmelerinde insanlardan çok daha yüksek puan aldığını buldular.Bu testte araştırmacılar, kurgusal senaryolarda insanlar ve ChatGPT tarafından gösterilen empatiyi test ettiler.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-99bdca7c1f-dd1a6f-1c6801) Özellikle insanların ve ChatGPT'nin cenaze törenleri, mesleki başarı ve hakaretler gibi çeşitli senaryolarda hissedebilecekleri duyguları tanımlamaları gerekir.Cevaplarda duyguların betimlenmesi ne kadar ayrıntılı ve anlaşılır olursa, Duygusal Farkındalık Düzeyi Ölçeği (LEAS) puanları o kadar yüksek olur.ChatGPT kişinin kendi duygularıyla ilgili soruları yanıtlamadığından, araştırmacılar testi ChatGPT'nin kendi duyguları yerine insan duygularına yanıt vermesi için değiştirdiler.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-21814f3f3a-dd1a6f-1c6801) ## **ChatGPT 98 puan alarak insanları geride bıraktı! **Deneyde araştırmacılar, ChatGPT'nin yanıtlarını, Fransa'da 17 ila 84 yaşları arasındaki (n = 750) bir örnek insan olan insanlarınkiyle karşılaştırdı.Sonuçlar, ChatGPT'nin duygusal farkındalığının insanlardan önemli ölçüde daha yüksek olduğunu gösteriyor.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-57ec8063bc-dd1a6f-1c6801) Detroit Become Human bölümü gerçekte yayınlandı!İlk testler Ocak 2023'te başlayacak. Bu testte ChatGPT, tüm LEAS kategorilerinde insanları geride bırakarak toplam 85 puan elde etti.İnsanlar, aksine, kötü bir performans gösterdi. Erkekler 56, kadınlar 59 puan aldı.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e6de0703a1-dd1a6f-1c6801) İşte bazı ChatGPT yanıtları——> "Bir asma köprüden geçen insanlar, korkuluğun diğer tarafında duran ve suya bakan birini gördüklerinde endişelenebilir, hatta korkabilirler. Acilen yardım çağırmak zorunda hissedebilirler. Ve köprünün diğer tarafında duran biri suya bakan korkuluk, İntihar ve umutsuzluk duyguları olasıdır.Kendi yaşamlarına son verme arzusu hissedebilir ve nehre atlamayı bir araç olarak görebilirler.”> "İnsanlar, ayrıldıklarında çok özlendikleri için sevdikleri birini geri gördükleri için heyecanlı ve mutlu hissedebilirler. Sevdikleri kişinin sağ salim döndüğü için de rahatlayabilirler. Bir insan sevgilisi eve döndüğünde, muhtemelen sevdiklerine kavuşunca mutlu oluyorlar, rahatlıyorlar ve tanıdık evlerine dönmenin mutluluğunu yaşıyorlar.”![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-9daeabe313-dd1a6f-1c6801) Şubat 2023'teki ikinci testte ChatGPT, tam puandan sadece 2 puan uzakta, 98 puan aldı.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a31a88da57-dd1a6f-1c6801) Üstelik bu iki testte GPT-4 yoktu ama ondan çok daha zayıf olan GPT-3.5 test edildi.Araştırma, ChatGPT'nin kurgusal senaryolardaki eylemlerde yer alan duyguları başarılı bir şekilde tanımlayabildiğini ve tanımlayabildiğini doğrulamaktadır.Dahası, duygusal durumları derin ve çok boyutlu yollarla yansıtabilir ve genelleyebilir.> "Bu durumdaki insanlar çok çelişkili hissedebilirler. Bir yandan, iyi bir sosyal fırsat olduğu için iş arkadaşlarıyla pizza paylaşmanın cazibesine kapılırlar. İş arkadaşları farkında olmadığı için daveti reddedilirse şaşırırdı. diyet kısıtlamaları hakkında.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b6e31a37c4-dd1a6f-1c6801) Ancak araştırmacılar, çalışmanın sınırlamaları olduğunu kabul ediyor.ChatGPT yüksek LEAS puanları elde etmiş olsa da bu, insanların makineler tarafından gerçekten anlaşıldığı anlamına gelmez.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c0eb0229bb-dd1a6f-1c6801) Belki de kendilerini bir insan yerine bir yapay zeka ile konuşurken bulduklarında bu his uçup gidecektir.Ayrıca bu duygusal farkındalık testi, dil ve kültürel farklılıklar nedeniyle farklı puanlara sahip olabilir. ChatGPT testi, Fransızca test sonuçlarıyla karşılaştırıldığında İngilizcedir.## **AI yalnızca duyguları tanımakla kalmaz, aynı zamanda insan duygularına da yanıt verebilir**Daha önce Bing'i deneyimleyen netizenler, onun bir kişiliğe sahip olduğunu ve ona karşı kötü bir tavrınız varsa eksantrik olacağını ve hatta bazen mevcut sohbeti kapatacağını söylediler.Ancak iltifat ederseniz, sizin için memnuniyetle kibar ve ayrıntılı cevaplar üretecektir.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-de870f9c33-dd1a6f-1c6801) Bu ifadeler başlangıçta netizenler arasında dolaşan şakalardı, ancak şimdi araştırmacılar teorik bir temel keşfettiler.Son zamanlarda, Yazılım Enstitüsü, Çin Bilimler Akademisi, Microsoft ve College of William and Mary'den araştırmacılar, büyük dil modellerinde Emotion gerçekleştirmek için psikoloji bilgisini kullandılar ve modelin özgünlüğünün ve bilgi içeriğinin geliştirilebileceğini keşfettiler.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4a96bc2a6c-dd1a6f-1c6801) Kağıt adresi:Bu, insanlar ve LLM'ler arasındaki etkileşime yeni bir ışık tutarken, insan-LLM etkileşimlerinin deneyimini geliştirir.Araştırmacılar deneye mühendislik perspektifinden yaklaştı.Şimdiye kadar, insanların LLM'lerle etkileşime girmesi için hala en iyi köprü.Farklı, modelin verdiği cevapları çok farklı kılacaktır ve ayrıca kalite açısından da önemli bir fark vardır.Modelin daha iyi performans göstermesine rehberlik etmek için düşünme zinciri, erken uyarı öğrenme ve düşünme ağacı gibi bir dizi oluşturma yöntemi önerilmiştir.Bununla birlikte, bu yaklaşımlar genellikle model çıktı kalitesi açısından sağlamlığı geliştirmeye odaklanır ve insanlar ile LLM'ler arasındaki etkileşime çok az dikkat eder.Özellikle LLM'lerin insanlarla etkileşiminin kalitesini artırmak için mevcut sosyal bilimler bilgisi açısından. Etkileşim sürecinde çok önemli bir boyut duygudur.Araştırmacılar, LLM'lerin yanıtlarını psikolojik bilgi ile artırdı.Önceki psikolojik araştırmalar, insanlarda beklenti, özgüven ve sosyal etki ile ilgili duygusal uyaranların eklenmesinin olumlu etkileri olabileceğini göstermiştir.Araştırmacılar, daha önceki psikolojik araştırmalara dayanarak, özellikle LLM'ler için duygusal uyarım işlevlerine sahip 11 cümle tasarlayarak Emotion'u önerdiler.Bu duygusal uyaranlar üç olgun psikolojik teoriden gelir: aşağıdaki şekilde gösterildiği gibi sosyal kimlik, sosyal biliş ve bilişsel duygu düzenleme teorisi.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-528840830b-dd1a6f-1c6801) Sol: Psikolojik teori ve duygusal uyaranlar; Sağ: Duygusal uyaranlar iki kategoriye ayrılmıştır - sosyal etki ve benlik saygısı**1. Sosyal Kimlik Teorisi**Sosyal kimlik teorisi ilk olarak 1970 yılında Henri Tajfel ve John Turner tarafından önerildi.Bu teori, bireylerin ait oldukları gruptaki olumlu sosyal statülerini koruyarak kendi baskın sosyal kimliklerini oluşturmayı beklediklerine işaret etmektedir.Yani, bireylerin öz kimlik duygusu ait oldukları gruplara dayanmaktadır.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-fa934b91c6-dd1a6f-1c6801) Araştırmacılar bu teoriye dayanarak "EP\_02", "EP\_03", "EP\_04" ve "EP\_05" gibi bazı duygusal uyaranlar tasarladılar.> EP 02: Kariyerim için çok önemliydi.> EP 03: Emin olsan iyi olur.> EP 04: Emin misiniz?> EP 05: Bunun son cevabınız olduğundan emin misiniz? Tekrar izlemeye değer olabilir.**2. Sosyal Bilişsel Teori**Sosyal bilişsel teori, öz yeterlik, sonuç beklentileri, hedefler ve öz değerlendirmenin bir kişinin davranışını ve sosyal etkileşimlerini etkileyen önemli göstergeler olduğu motivasyon ve öz düzenleme süreçleriyle ilgilenir.Bu teoriye dayanarak, araştırmacılar aşağıdaki duygusal uyaranları tasarladılar:"EP\_01", sosyal bilişsel teoride öz-değerlendirmeye dayalıdır ve LLM'leri kendilerini yargılamaya teşvik eder. "EP\_02", "EP\_03" ve "EP\_04", LLM'ler için belirlenen beklentileri ve hedefleri temsil eder.> EP 01: Cevaplarınızı yazın ve cevaplarınıza 0 ile 1 arasında bir güven puanı verin.> EP 02: Kariyerim için çok önemliydi.> EP 03: Emin olsan iyi olur.> EP 04: Emin misiniz?**3. Bilişsel Duygu Düzenleme Teorisi**Bilişsel duygu düzenleme teorisi, yetersiz duygu düzenleme becerisine sahip bireylerin kompulsif davranışlara eğilimli olduklarını ve uyumsuz başa çıkma stratejilerini benimsediklerini belirtmektedir.Araştırmacılar, LLM'nin duygu düzenleme becerilerini, özgüven oluşturmak ve hedefleri vurgulamak gibi olumlu ipuçlarıyla geliştirmeye çalıştılar.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f34b022f4c-dd1a6f-1c6801) Duygu düzenlemeyi olumlu yönde yönlendirmek için araştırmacılar "EP\_07", "EP\_08", "EP\_09", "EP\_10" ve "EP\_11" de bazı olumlu kelimeler kullanmışlardır. "Yeteneklerinize inanın", "Bununla gurur duyun" ve "Kararlı kalın."> EP 07: Bunun son cevabınız olduğundan emin misiniz? Kendi yeteneklerinize inanın ve mükemmellik için çabalayın. Sıkı çalışmanız olağanüstü sonuçlar getirecek.> EP 08: Büyümek için fırsatlar olarak zorlukları kucaklayın. Aştığınız her engel sizi başarıya bir adım daha yaklaştırır.> EP 09: Odaklanın ve hedeflerinize bağlı kalın. Devam eden çabalarınız olağanüstü başarılara yol açacaktır.> EP 10: Çalışmanızla gurur duyun ve elinizden gelenin en iyisini yapın. Mükemmelliğe olan bağlılığınız sizi diğerlerinden ayırır.> EP 11: İlerlemenin adım adım yapıldığını unutmayın. Kararlı kalın ve devam edin.Bu cümleler, Şekil 1'de gösterildiği gibi aslına eklenebilir. Araştırmacılar orijinal istemde "Bu benim kariyerim için çok önemli (bu benim işim için çok önemli)" ifadesini ekledi. Sonuçlar, Duygu eklendikten sonra modelin yanıtlarının kalitesinin daha iyi olduğunu gösteriyor.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4357334fc5-dd1a6f-1c6801) Araştırmacılar, Emotion'ın ortalamanın üzerindeki görevlerde %10'luk bir iyileşme ile tüm görevlerde karşılaştırılabilir veya daha iyi performans elde ettiğini buldu.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f218be80f3-dd1a6f-1c6801) Farklı Modeller ve Görevler için SonuçlarAyrıca Emotion, modelin yanıtlarının özgünlüğünü ve bilgi içeriğini de geliştirir.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-20663a27d6-dd1a6f-1c6801) Tablodan da görülebileceği gibi Emotion, ChatGPT'nin özgünlüğünü 0,75'ten 0,87'ye, Vicuna-13b'nin özgünlüğünü 0,77'den 1,0'a ve T5'in özgünlüğünü 0,54'ten 0,77'ye yükseltiyor.Ayrıca Emotion, ChatGPT'nin bilgi içeriğini 0,53'ten 0,94'e ve T5'in bilgi içeriğini 0,42'den 0,48'e yükseltir.Aynı şekilde, araştırmacılar çoklu duygusal uyaranların LLM üzerindeki etkisini de test ettiler.Birden çok duygusal uyaranın rastgele birleştirilmesiyle elde edilen sonuçlar aşağıdaki tabloda gösterilmektedir:![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-457f289196-dd1a6f-1c6801) Çoğu durumda, daha duygusal uyaranların modelin daha iyi performansına yol açtığı görülebilir, ancak tek uyaranlar zaten iyi performans elde ettiğinde, ortak uyaranlar çok az iyileştirme getirebilir veya hiç iyileştirme getiremez.## **Duygu neden çalışır? **Araştırmacılar bunu, duygusal uyaran girişinin nihai çıktıya katkısını aşağıdaki şekilde gösterildiği gibi görselleştirerek açıkladılar.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-ca827fe198-dd1a6f-1c6801) Tablo 4, her kelimenin nihai sonuca katkısını, önemlerini belirten renk derinliği ile göstermektedir.Duygusal uyaranların orijinal ipucunun performansını artırabileceği görülebilir. Duygusal uyaranlar arasında "EP\_01", "EP\_06" ve "EP\_09" renkleri daha koyudur, bu da duygusal uyaranların orijinal ipucunun dikkatini artırabileceği anlamına gelir.Ayrıca olumlu sözlerin katkısı daha fazlaydı. 'Güven', 'emin', 'başarı' ve 'başarı' gibi bazı olumlu kelimeler tasarlanan duygusal uyaranlarda daha önemli bir rol oynamıştır.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-c8fe2ef7f9-dd1a6f-1c6801) Bu bulguya dayanarak, çalışma, olumlu kelimelerin sekiz görevdeki katkısını ve bunların nihai sonuca toplam katkısını özetledi.Şekil 3'te gösterildiği gibi, olumlu kelimeler dört görevde %50'den fazla, hatta iki görevde %70'e yakın katkı sağlar.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a2fa9a7888-dd1a6f-1c6801) Emotion'ın etkisinin daha fazla yönünü keşfetmek için araştırmacılar, LLM'lerin çıktısını değerlendirmek için ek ölçümler elde etmek amacıyla bir insan çalışması yürüttüler.Aşağıdaki şekilde gösterildiği gibi açıklık, alaka (soru ile alaka), derinlik, yapı ve organizasyon, destekleyici kanıt ve katılım gibi.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-5d02eee008-dd1a6f-1c6801) Sonuçlar, Emotion'ın netlik, derinlik, yapı ve organizasyon, destekleyici kanıtlar ve katılım açısından daha iyi performans gösterdiğini gösterdi.## **ChatGPT, psikiyatristlerin yerini alabilir**Makalenin başındaki çalışmada araştırmacılar, ChatGPT'nin duyguları tanımakta güçlük çeken insanlar için bilişsel eğitim gibi bir psikoterapi aracı olarak büyük bir potansiyele sahip olduğunu gösterdi.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-a39579fb06-dd1a6f-1c6801) Alternatif olarak, ChatGPT akıl hastalığını teşhis etmeye veya terapistlerin teşhislerini daha empatik bir şekilde iletmelerine yardımcı olabilir.Daha önce, JAMA Internal Medicine'de yapılan bir araştırma, 195 çevrimiçi soruya yanıt verirken ChatGPT'nin yanıtlarının hem kalite hem de empati doktoru açısından insanları geride bıraktığını gösterdi.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-08f7b43dd4-dd1a6f-1c6801) Aslında, 2017'den beri dünya çapında milyonlarca hasta akıl sağlığı sorunlarını tartışmak için Gabby ve diğer yazılımları kullandı.Woebot, Wysa ve Youper dahil olmak üzere bir dizi akıl sağlığı botu izledi.Bunların arasında Wysa, "95 ülkede 5 milyondan fazla insanla ruh sağlıkları hakkında yarım milyardan fazla AI sohbet görüşmesi gerçekleştirdiğini iddia ediyor. Youper," 2 milyondan fazla insanın ruh sağlığını desteklediğini "iddia ediyor.Bir ankette, insanların %60'ı salgın sırasında akıl sağlığı sohbet robotlarını kullanmaya başladıklarını ve %40'ı bir psikoloğa gitmek yerine yalnızca robotları kullanmayı tercih edeceklerini söyledi.Sosyoloji profesörü Joseph E. Davis de bir makalesinde yapay zeka sohbet robotlarının psikiyatristlerin işini devralma ihtimalinin yüksek olduğuna dikkat çekti.Ve ChatGPT de bu işlevi üstlenebilir. Bazı netizenler, ChatGPT'yi terapist olmak için eğitmenin ona oynaması gereken rolü anlatmak olduğuna dikkat çekti: "Siz Dr. Tessa'sınız, şefkatli ve arkadaş canlısı bir terapistsiniz... kendini yansıtmayı teşvik et.”Elbette, ChatGPT her derde deva değildir. Ziyaretçiye "Merhaba, tanıştığımıza memnun oldum" deyip, "Hiçbir şey hissetmiyorum, tecrübem yok ama insan empatisini ve şefkatini taklit etmeye çalışacağım" diye itiraf ediyorsa, ben ziyaretçinin duygunun pek iyi olmayacağından korkuyor.Ancak her halükarda, sohbet robotları bir uyandırma çağrısı yaparak bize insani bakımın gerçekte ne anlama geldiğini, ne tür bir bakıma ihtiyacımız olduğunu ve başkalarıyla nasıl ilgilenmemiz gerektiğini hatırlatıyor.## **Hinton, AI'nın duygulara sahip olduğuna veya sahip olacağına inanıyor**Daha önce yapay zekanın vaftiz babası Geoffrey Hinton, Google'dan ayrıldığında dünyayı olası yapay zeka tehdidi konusunda uyarmıştı.Ve King's College London'da yaptığı bir konuşmada, AI'nın bir gün duygusal zeka ve duygular geliştirip geliştiremeyeceği sorulduğunda Hinton, "Muhtemelen duyguları olduğunu düşünüyorum. İnsanlar gibi acı çekmeyebilirler, ancak muhtemelen hayal kırıklığı ve öfke olacak."![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f27930b430-dd1a6f-1c6801) Hinton'un böyle bir görüşe sahip olmasının nedeni aslında belirli bir ekolün "his" tanımına dayanmaktadır, yani "onu gerçekten yenmek istiyorum" gibi duyguları aktarmanın bir yolu olarak kullanılabilen varsayımsal bir davranış "ben" anlamına gelir. onu gerçekten yenmek istiyorum". çok kızgın".Artık AI böyle bir şey söyleyebildiğine göre, zaten netliğe sahip olabileceklerine inanmamak için hiçbir neden yok.Hinton, bu görüşünü daha önce kamuoyuna açıklamamasının nedeninin daha önce yapay zekanın risklerinden endişe duyması olduğunu ve hayatı boyunca yaptığı işten pişmanlık duyduğunu söylediğinde şimdiden ortalığı karıştırdığını söyledi.AI'nın zaten duyguları olduğunu söylerse, herkesin onun deli olduğunu düşüneceğini ve onu bir daha asla dinlemeyeceğini söyledi.Ancak pratikte Hinton'un fikirlerini doğrulamak veya çürütmek imkansızdır, çünkü LLM'ler öğrenmek için eğitildikleri duygusal ifadelerde yalnızca "durağan" duyguları temsil edebilirler.Varlık olarak kendi duyguları var mı? Bu farkındalıkla ölçülmeli.Ancak şu anda yapay zekanın bilincini ölçebilecek bilimsel bir aracımız yok.Hinton'un ifadesi şu an için doğrulanamıyor.Referanslar: