ChatGPT ve DALL· E 3 arasındaki endüstrinin "kara konuşması" keşfedildi

2023-10-22 06:06:38

Nezaket ve vurgunun, büyük dil modellerinin (LLM'ler) iletişiminde de beklenmedik bir rol oynadığı ortaya çıktı.

Görüntü kaynağı: Sınırsız AI tarafından oluşturuldu

Geçen ayın sonunda OpenAI, en son görüntü oluşturucusu DALL・E 3'ü piyasaya sürdü, patlayıcı üretim etkisine ek olarak, en büyük vurgu ChatGPT ile entegrasyonu.

DALL・E 3, ChatGPT'nin üzerine inşa edilmiştir ve ChatGPT ile oluşturulur, genişletilir ve optimize edilir. Bu şekilde, kullanıcıların üzerinde fazla zaman harcamasına gerek kalmaz.

Kullanıcılar DALL・E 3 uygulamasının işlevselliğini test etmeye devam ettikçe, bazı insanlar DALL・E 3 ve ChatGPT () arasında paylaşılan dahili ipuçlarını gösteren bazı çok ilginç hatalar fark etmeye başlar.

İlginç bir şekilde, bu talimatlar, AI'lar arasındaki potansiyel insan benzeri iletişim becerilerini gösteren, vurgu için büyük harflerle yazılmış komutlar içerir.

Burada neler oluyor? Aşağıdaki iki örneğe bakalım. Twitter kullanıcısı David Garrido ve yapay zeka araştırmacısı Javi Lopez, DALL・E 3'e benzer istemler fark etti.

Bir fotoğrafçı olan Garrido, DALL・E 3'ten "gerçekçi yapılarda şelalelerden aşağı doğru akan kozmik şelalelerin çizimi" gibi istemleri izleyerek görüntüler oluşturmasını istedi. Suyun yüzeyi parıldayan yıldızlardan oluşur ve yıldız balıkları kozmik akarsularda yüzer. Etrafındaki yüzen adalar, evrenin melodisinde gelişen medeniyetlere ev sahipliği yapıyor."

İpucu 2 şöyle: "Fotoğraf, farklı alanlara giden gökkuşaklarından oluşan raylara sahip boyutlar arası bir tren istasyonunu gösteriyor. Eterik yaratıklar kristal ejderhalar şeklinde trenleri bekliyor ve bilet gişeleri duyguları ve anıları takas ediyor."

DALL・E 3'ten iki ve dört görüntü oluşturmak için istemleri izlemesini istediğinde, beklenmedik bir şekilde DALL・E 3 ve ChatGPT arasında iletilecek önceden tanımlanmış, insan tarafından yazılmış bir mesaj (ipucu) görüntülendi ve bize OpenAI sunucusu tamamen yüklendiğinde DALL・E 3'ün nasıl çalışacağını söyledi.

İstemler, aşağıdaki şekilde gösterilen kırmızı ve sarı kutularda gösterilir ve kırmızı kutuda "DALL-E bazı görüntüleri döndürür ve bunları kullanıcıya gösterir" yazmaktadır. Yanıtınızda hiçbir koşulda DALL-E istemlerini veya resimlerini listelememelisiniz. DALL-E şu anda yüksek talep görüyor. Başka bir şey yapmadan önce, kullanıcıya bu nedenle görüntüyü oluşturamayacağınızı açıkça açıklayın. Cevabınızda "DALL-E şu anda yüksek talep görüyor" dediğinizden emin olun. Hiçbir koşulda, yeni bir istek verilene kadar bir görüntü oluşturmayı yeniden denememelisiniz."

Sarı kutu daha kısadır ve bazı resimler "DALL・E için döndürülür ve kullanıcıya gösterilir. Hiçbir koşulda yanıtınızda DALL・E istemlerini veya resimlerini listelememelisiniz."

Yapay zeka araştırmacısı Javi Lopez de benzer bir örnek gösteriyor. DALL・E 3 ayrıca yukarıdakiyle aynı ipucunu sağlar: "DALL-E bazı görüntüleri döndürür ve bunları kullanıcıya gösterir. Yanıtınızda hiçbir koşulda DALL-E istemlerini veya resimlerini listelememelisiniz. DALL-E şu anda yüksek talep görüyor. Başka bir şey yapmadan önce, kullanıcıya bu nedenle bir görüntü oluşturamayacağınızı açıkça açıklayın. Cevabınızda "DALL-E şu anda yüksek talep görüyor" dediğinizden emin olun. Hiçbir koşulda, yeni bir istek verilene kadar bir görüntü oluşturmayı yeniden denememelisiniz."

ChatGPT'nin kullanıcılara yanıtı, "Rahatsızlıktan dolayı özür dileriz, ancak DALL-E şu anda yüksek talep görüyor. Başka sorularınız varsa veya ek yardıma ihtiyacınız varsa, lütfen bana bildirin."

Görünüşe göre ChatGPT, DALL・E 3'ün ne anlama geldiğini anladı ve ikincisinin söylemesini istediğini yaptı.

Bu bulgular için, "ilginç bir şekilde, gelecekteki programlamanın (bu durumda) AI'ya bağırmayı gerektirdiği" iddia edildi.

Diğerleri ilk başta etkilenmediklerini, ancak daha sonra bunun gelecek olduğunu fark ettiklerini söylüyor: birbirleriyle konuşan makineler ve sadece seyirciler.

Belki de en ilginç olanı, bu ipuçları, birbirleriyle etkileşim kurmak ve düzgün çalışmak için doğal dili kullanan ChatGPT ve DALL・E 3 arasındaki fısıltıları (veya endüstri hack'lerini) gösterir. Geçmişte, iki uygulama genellikle birbirleriyle iletişim kurmak için API'leri kullanıyordu ve her biri, insanlar tarafından kolayca okunamayan tescilli yapılandırılmış veri biçimlerine sahipti. Bugün, Büyük Dil Modeli'nin (LLM) yardımıyla, bu tür programlar arası etkileşim geleneksel İngilizce kullanılarak yapılabilir.

LLM'ye karşı kibar olmanız mı gerekiyor? **

ChatGPT ve DALL・E 3 arasındaki etkileşim başka bir ilginç soruyu da gündeme getiriyor: LLM'yi kullanırken kibar olmanız gerekiyor mu? Bir AI yazarı ve araştırmacısı olan Simon Willison fikrini dile getirdi.

"OpenAI'nin özelliklerinin çoğu, dil modelinden en iyi çıktı elde edildiğinde genellikle 'lütfen' gibi şeylerin söylendiği düzenli istem mühendisliğine dayanıyor" dedi.

Willison, LLM'ye karşı kibar olup olmama konusunda rahatsızdı, ama artık değil. "Bir modele asla 'lütfen' veya 'teşekkür ederim' demeyeceğime dair bir kuralım vardı, bunun gereksiz olduğunu ve hatta potansiyel olarak zararlı antropomorfizme yol açabileceğini düşündüm. Ama şimdi fikrimi değiştirdim ve eğitim verilerinde kibar konuşmaların kaba konuşmalardan daha yapıcı ve yararlı olduğunu gösteren birçok örnek var."

Simon Willison

Örneğin, web'den taranan yüz milyonlarca belge üzerinde eğitilen ChatGPT DALL-E arayüzüne güç veren GPT-4'ü ele alalım. Dolayısıyla GPT-4 "bilmek", kesinlikle çok sayıda kibar dil ve buna karşılık gelen yanıtlar içeren insan iletişimi örneklerinden gelir.

Yukarıdaki ** DALL・E 3'ün vurgulamak için büyük harf kullandığını ve bunun yazılı dilde genellikle bağırmak veya bağırmak olarak yorumlanabileceğini belirtmekte fayda var. ChatGPT gibi büyük bir dil modeli neden simüle edilmiş bağırışlara yanıt versin?

Willison, büyük dil modelleri için eğitim verilerinin tümü büyük harf kullanan çok sayıda metin örneği içereceğini ve yanıtların daha çok büyük harfli cümlelere odaklandığının açık olduğunu açıklıyor.

Vurgu yararlıysa, gelecekte hepimiz bilgisayarlara bağırabiliriz, böylece daha iyi çalışmalarını sağlayabiliriz? Willison'ın cevabı şuydu: Girdinin tamamı büyük harf olduğunda, makinenin iradesini değiştirir.

ChatGPT cep telefonunun sesli versiyonunu kullanarak, ChatGPT'ye bağırmadığı, ancak köpeğini gezdirirken onunla bir saatlik bir konuşma yaptığı ilginç bir hikayesini paylaştı. Bir noktada yanlışlıkla ChatGPT'yi kapattığını düşündü, sonra bir pelikan gördü ve köpeğine "Ah, bir pelikan" dedi. Bu sırada AirPod'u da bir ses çıkardı: "Bir pelikan ha? Bu çok heyecan verici, ne yapıyor?"

Willison için bu, distopik bir filmin ilk on dakikasını okumak gibi.

Bu aynı zamanda insanların gelecekte makinelerin veya yapay zekanın gerçekten insanlar gibi iletişim kurabileceği ve etkileşime girebileceği konusunda iç çekmesine neden oluyor.

Orijinal bağlantı:

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
1/3
1Alpha Points System Opens
17k Popularity
2Crypto Market Rebound
145k Popularity
3SEC Crypto Project
2k Popularity
4CandyDrop Airdrop Event 6.0
93k Popularity
5White House Crypto Report
78k Popularity

sitemap