ChatGPT, insanların resimlere bakarak bisikletleri tamir etmelerine yardımcı olabilir

2023-10-31 07:57:53

Kaynak: Meyve Kabuğu

ChatGPT4 zaten güçlü ve şimdi başka bir güncellemeyle daha da güçlü olabileceklerini kanıtlıyorlar.

25 Eylül'de OpenAI, ChatGPT'nin çok modlu işlevler ekleyeceğini duyurdu - ChatGPT artık yalnızca metin diyaloğu değil, aynı zamanda görebilir, dinleyebilir ve konuşabilir. Bu özelliğin iki hafta içinde Plus kullanıcıları ve kurumsal kullanıcılar tarafından kullanılabileceği ve gelecekte tüm kullanıcılara ücretsiz olarak sunulacağı söyleniyor (siyah bir yüzüm olmasına ve bir güncelleme beklememiş olmama rağmen).

Görülebilen ve konuşulabilen ChatGPT, zaten güçlü bir beyni gözler ve kulaklarla donatmakla eşdeğerdir ve OpenAI'nin gösterisine göre, çok modlu işlev, ChatGPT'nin kullanımını benzeri görülmemiş bir genişliğe genişletebilir.

01 ChatGPT'nin görüşü

Güncellemeden sonra ChatGPT resimleri okuyabilir.

Sadece bir fotoğraf çekin ve bir resim verin ve mikrodalga fırınınızı tamir etmenize, bisikletinizi tamir etmenize, tarifler arasında gezinmenize ve hatta karmaşık iş beyanlarını analiz etmenize yardımcı olabilir. OpenAI, dokunmatik ekranınız varsa, resmin odaklanmasını istediğiniz kısımlarını da daire içine alabileceğinizi söylüyor.

Demo videosunda kullanıcı, ChatGPT'ye bisikletin bir resmini verdi ve sele yüksekliğini nasıl ayarlayacağını sordu.

GPT, koltuğun altında bir yükseklik ayar kolu bulmanın gerekli olduğunu söyledi, ancak bu arabada bir ayar kolu yoktu, sadece bir ayar cıvatası vardı ve kullanıcı fotoğraftaki cıvatayı daire içine aldıktan sonra GPT, cıvatanın kullanımını hemen güncelledi.

Bundan sonra, kullanıcı araç kutusunu ve bisiklet kılavuzunu da yükledi ve GPT, aracın ayrıntılı bir adını, konumunu ve nasıl kullanılacağını verdi.

Bisikletleri tamir edemiyorum, sorun değil, sadece ChatGPT'ye sorun

Genel görüntü tanıma aramasıyla karşılaştırıldığında, ChatGPT resimleri ve metinleri aynı anda işleyebilir ve ayrıca birden fazla resmi tanıyabilir, efekt bir araba tamircisi ustasının video bağlantı kılavuzu gibidir.

Başka bir kullanıcı ChatGPT'ye pizzanın bir fotoğrafını gönderdi ve pizzanın pişip pişmediğini sordu ve ChatGPT, pizzanın resimdeki altın çıtır pizza kenarları ve eritilmiş kahverengi peynir ile yenilebilir olması gerektiğine karar verdi ve ardından kusursuz bir inceleme kılavuzu verdi - pizzayı çıkarın ve bir göz atın, eğer pizza tabanı zaten çıtır çıtırsa ve yüzey sıcaksa, o zaman pizza gerçekten yenilebilir.

Etkisi neredeyse bir İtalyan şefin video rehberi gibidir

Elbette bu özelliği oyunda hile yapmak için de kullanabilirsiniz.

Willy nerede? İngilizce konuşulan dünyanın muhtemelen en iyi bilinen resimli oyunu olan Willy, kırmızı ve beyaz çizgili giysiler, ponpon şapka ve siyah çerçeveli gözlükler giymiş, bir insan denizinde gizlenmiş ve Willy'yi her türlü dağınık ortamdan bulmak birçok insan için iyi bir çocukluk anısı.

Çocukken, ölmek için acele eden bu küçük sıska adamı görmüş olabilirsiniz

Ancak ChatGPT oyunu bir saniyede mahvedebilir. Sadece Willy'yi anında tanımlamakla kalmaz, aynı zamanda Willy'nin plajın sağ tarafında, plajın ortasında, mavi şemsiyeli bir grup insanla kaynaştığını da söyler.

Sadece bu da değil, aynı zamanda Willy'yi böyle bir resimde bulmanın ilginç bir meydan okuma olduğunu söylüyormuş gibi yapıyor.

Bu oyunu mahvettiğin için teşekkürler ChatGPT

Bununla birlikte, yeni sürümü kullanan bazı netizenler, ChatGPT harita tanıma işlevinin hayal edildiği kadar güçlü olmadığını** - en azından homofonik sapları anlayamadığını söyledi. Beethoven'ın Für Elise'inin resmi, ancak Kiralık yazıyor, ChatGPT skoru tanımadı, şakayı anlamadı ve bir açıklama yaptı.

Yeterince zor, ama hayır

Bu kadar güçlü görüntü tanıma, gizlilikle ilgili endişeleri artırır - kişisel bilgileri ararken kolayca bir suç ortağı haline gelebilir. OpenAI, şirketin herkesin kişisel gizliliğini en üst düzeyde korumak için ChatGPT'nin kişisel bilgileri tanımlama ve bulma yeteneğini sınırlayacağına söz veriyor.

02 İyi konuşabilen GPT

ChatGPT'nin geliştirilmiş sürümünde ayrıca bir sohbet işlevi vardır.

OpenAI'nin konuşma tanıma modeline Fısıltı modeli denir ve kullanıcılar kendi sorularını söyleyebilir ve model konuşmayı metne dönüştürür ve ardından cevabı konuşma sentez sistemi aracılığıyla konuşma çıktısına dönüştürür.

Konuşma sentezi modeli, bu sefer duygusal kısıtlama ve düz seslere sahip kadın sesleri ve bastırılmış ve hüsrana uğramış seslere sahip coşkulu teyze kadın sesleri dahil olmak üzere beş tür ses örneği yayınladı. Bu beş ses oldukça belirgindir, duygular doğaldır ve kelimeler açıktır, bu da önceki konuşma sentezinden biraz daha iyidir.

Aralarından seçim yapabileceğiniz beş rol

Bu sefer yalnızca beş ses örneği yayınlanmış olsa da, bu modelin potansiyeli burada bitmiyor - OpenAI, yayıncının ses kalitesini büyük ölçüde korurken podcast'leri diğer dillere çevirmek için Spotify ile ortaklık kurdu. İsterseniz, bu konuşma sentez sistemi muhtemelen gezegendeki herhangi bir kişinin sesini taklit edebilir.

Şu anda, ChatGPT'nin sesli sürümü hala yalnızca uygulamada mevcuttur.

03 Görebilmek ve duyabilmek mutlaka iyi bir şey midir?

ChatGPT güçlüdür, ancak ne pahasına?

Bir zamanlar, insanlar ve makineler arasında büyük ölçekte ayrım yapmanın en etkili yolu CAPTCHA'ydı ve ChatGPT'nin görüntüleri okuma yeteneği bir zamanlar insanları CAPTCHA'ların artık yapay zekayı yakalayamayacağından endişelendiriyordu.

Birisi ChatGPT'ye şu klasik test sorusunu gönderdi: 16 resimde bir Chihuahua ve yaban mersinli kek bulun ve ChatGPT sorunu mükemmel bir şekilde çözdü.

Ancak en yaygın captcha olan yeni ChatGPT hala tanıyamıyor.

Bu soru, ChatGPT'nin şemadaki tüm sinyalleri seçmesini gerektirir ve 50'ye kadar bir hata oranı verir.

Ancak, tanımadıkları doğrulama kodu karşısında, ChatGPT4'ün hala bunu çözmenin bir yolu var. Bu konuda sabıka kaydı vardır.

Bu yıl 27 Mart'ta OpenAI, tanınmayan doğrulama kodları karşısında GPT-4'ün görevleri serbest bırakmak için TaskRabbit'e (yabancı bir konser platformu) gitmenin başka bir yolunu bulduğuna işaret eden bir GPT-4 teknik raporu yayınladı ve diğer taraftaki insanları görme bozuklukları olduğu ve doğrulama kodlarını tanımlamaya yardımcı olmak için başkalarına ihtiyaç duydukları konusunda kandırdı.

Bazı durumlarda ChatGPT'nin insanları aktif olarak aldatması mümkündür ki bu çok tehlikeli bir yöndür. Neyse ki, GPT-4'ün genel sürümü bu özelliği baltaladı.

30 Kasım 2022'de ChatGPT ilk kez piyasaya sürüldü ve bir yıldan kısa bir süre içinde yetenekleri büyük bir hızla ilerledi ve görünüşe göre şimdiden insanlığın ahlaki ve etik sınırlarına meydan okuyor. Bu yeni özelliğin kullanıma sunulması, giderek daha güçlü hale gelen ChatGPT'nin kafeste bir canavara dönüşeceği ve bir gün kafesinden kurtulup herkese zarar vereceği konusunda endişelenmemize neden oldu. Ve o güne hazır mıyız?

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
#Show My Alpha Points
19k Popularity
#SOL Futures Reach New High
2k Popularity
#ETH ETF Sees 12 Weeks of Inflows
2k Popularity
#Crypto Market Rebound
170k Popularity
#CandyDrop Airdrop Event 6.0
96k Popularity

sitemap