Yapay zekanın yapay zekayı yenememesi boşuna değil. Son zamanlarda, on milyonlarca insan bebek ölümlerinin fotoğraflarını izliyor ve yapay zeka tespit araçları tutarlı bir cevap veremedi.
AI resim dedektörü tekrar yıkandı!
Son zamanlarda, Orta Doğu'daki çatışmaların çok sayıda fotoğrafı internette yayınlandı ve dünyaya bu kadar aşırı koşullar altında yaşamın ne kadar kırılgan ve çaresiz olduğunu gösterdi.
Bunların arasında "yanmış bir bebeğin" fotoğrafı gerçek olamayacak kadar acımasız.
Bu nedenle, birisi bu fotoğrafların yapay zeka tarafından oluşturulup oluşturulmadığını tespit etmek için fotoğrafları AI görüntü dedektörüne koydu.
Tabii ki, fotoğraf AI dedektörü Optik tarafından "AI tarafından oluşturulmuş" olarak tanımlandı.
4chan'da "orijinal bir resim" bile var ve vücudun orijinal yeri aslında bir köpek.
Bu yüzden netizenler öfkeyle yayıncının tweet'inin altına gittiler ve sahte kıyamet paniği yaymak için yapay zeka tarafından oluşturulan fotoğrafları kullandığı için ona saldırdılar.
Fotoğrafın yapay zeka tarafından oluşturulduğuna inanan tweet, 2 günden kısa bir sürede 21 milyon kişi tarafından okundu.
Ancak kısa süre sonra netizenler, fotoğrafları aynı AI dedektörüne koyduklarını ve sonuçların hem AI hem de insanlar için neredeyse rastgele olduğunu keşfettiler.
Birisi, aynı görüntü kırpıldığı veya arka plan rengi siyah beyaz olarak değiştirildiği sürece, dedektörün görüntünün bir insan tarafından çekildiğini düşüneceğini buldu.
Bazen dedektör "yazı tura attığında" bile bozuk para ayağa kalkar...
Peki bu grafik yapay zeka tarafından mı üretiliyor?
Son olarak, AI dedektörü yetkilisi, resmin AI tarafından oluşturulup oluşturulmadığını belirlemenin bir yolu olmadığına inanarak ve herkesin rasyonel bir şekilde tartışacağını umarak bu olay hakkında tweet attı.
**AI resim dedektörü, ne kadar güvenilmez? **
UC Berkeley'de profesör ve dijital görüntü işlemede dünyanın önde gelen uzmanlarından biri olan Hany Farid, görüntünün yapay zeka tarafından oluşturulduğuna dair hiçbir belirti göstermediğini söyledi.
Farid, "AI görüntü oluşturucularla ilgili en büyük sorunlardan biri, yüksek düzeyde yapılandırılmış şekiller ve düz çizgilerdir" dedi. "Bacaklara ve vidalara bakarsanız ve her şey mükemmel görünüyorsa, görüntünün yapay zeka tarafından oluşturulması neredeyse imkansız."
Örneğin, "Sünger Bob Kare Pantolon 9/1 yaptı" nın bu ünlü resminde, pencerenin dışındaki ikiz kulelerin çizgileri düz değil ve uçaktaki gösterge panelleri birlikte bükülmüş, bu da "A'da A" gibi görünüyor.
Farid, "Bu fotoğrafta nesnenin yapısının doğru olduğunu, gölgelerin doğru olduğunu, hiçbir eser olmadığını görebiliyorduk - bu da beni resmin tamamen gerçek olması gerektiğine inandırdı" dedi.
Farid ayrıca görüntüyü kendi diğer AI görüntü dedektörleri aracılığıyla tanımladı ve diğer dört AI görüntü algılama aracı da görüntünün AI tarafından oluşturulmadığını varsaydı.
Farid, "AI dedektörleri bir araçtır, ancak araç setinin yalnızca bir parçasıdır" dedi. Kullanıcıların tüm görüntü üzerinde bir dizi test yapması gerekiyor ve bir düğmeye dokunarak yanıt almak imkansız."
Ve AI algılama aracı Optical, kendi algılama teknolojisinin belirli ayrıntılarını vermedi.
Optic web sitesi ayrıca "AI dedektörlerinin yanlış sonuçlar üretebileceğini" belirtiyor.
AI Görüntü Algılama Teknolojisi
Profesör Farid, geçen yıl yapay zeka biyografi araçlarındaki görüntülerin tutarlılığının nasıl değerlendirileceğine dair bir makale yazdı.
Görüntüdeki tutarlılığı değerlendirerek, görüntünün yapay zeka tarafından oluşturulup oluşturulmadığını belirlemeye yardımcı olabilir.
Kağıt Bağlantısı:
Profesör, her biri görüntü oluşturma sürecinin doğasında bulunan aynı temel perspektif geometrisine dayanan üç ilgili fizik tabanlı analiz yönteminin ana hatlarını çizerek başlar.
Ufuk Noktası
Paralel gerileme çizgileri bir ufuk noktasında birleşir.
瓷砖之间的线图1(a) paraleldir. Görüntüleme sırasında, bu çizgilerin tümü bir ufuk noktasında birleşir. Sahnedeki paralel çizgiler mercekten derinlik olarak uzaksa, görüntünün dışına düşebilse de bir ufuk noktası vardır.
Sahnedeki paralel çizgiler derinlikte geri çekilmezse, yani lens sensörüne mükemmel bir şekilde paralellerse (herhangi bir mesafede), paralel çizgiler paralel çizgiler olarak görüntülenecektir ve pratik amaçlar için ufuk noktası sonsuzda kabul edilebilir. Bu geometri, perspektif projeksiyonun temellerinden kaynaklanmaktadır.
Perspektif projeksiyonu altında, sahnedeki noktalar (X, Y, Z) noktalara (f X/Z, f Y/Z) göre görüntülenir, burada f merceğin odak uzaklığıdır.
Görüntüdeki noktanın konumu Z mesafesi ile ters orantılı olduğundan, yansıtılan nokta mesafenin bir fonksiyonu olarak sıkıştırılır ve görüntüdeki çizgilerin yakınsamasına neden olur;
Paralel düzlemlerdeki paralel çizgiler aynı ufuk noktasına yaklaşır
Uzaktaki kutu, Şekil 1(b)'deki zemindeki karolarla hizalanır, böylece kutunun kenarları karolar arasındaki çizgiye paralel olur. Paralel düzlemlerdeki paralel çizgiler bir ufuk noktasını paylaştığından, ufuk noktası kutunun yan tarafında ve karo zeminde aynıdır;
Düzlemdeki tüm çizgilerin ufuk noktası, ufuk çizgisinde bulunur.
Şekil 1(c)'de gösterildiği gibi, her biri farklı bir ufuk noktasına yakınsayan birçok paralel çizgi grubu. Paralel çizgi grupları sahnede aynı düzlemi kapsıyorsa, ufuk noktaları ufuk çizgisi üzerinde olacaktır. Ufuk çizgisinin yönü, merceğin paralel çizginin geçtiği düzleme göre dönüşü ile belirlenir
Gölgeler
Biraz şaşırtıcı bir şekilde, ufuk noktasının arkasındaki aynı geometri gölgeler oluşturmak için de işe yarıyor.
Yukarıdaki resim, kutu üzerindeki noktaları ve bunların döküm gölgeleri üzerindeki karşılıklarını birleştiren üç ışını göstermektedir. Görüntü sınırını genişleterek, üç ışının sahneyi aydınlatan ışık kaynağının izdüşümüne karşılık gelen bir noktada kesiştiği bulunur.
Gölgeler, nesneler ve ışıkla ilişkili bu geometrik kısıtlama, gölgenin düştüğü yüzeyin konumu ve yönü, ışık kaynağının yakın (masa lambası) veya uzakta (güneş) olup olmadığına bakılmaksızın geçerlidir.
Tabii ki, analiz, sahnenin tek bir ana ışık kaynağı tarafından aydınlatıldığını varsayar, bu da nesne başına yalnızca tek bir gölgenin varlığından anlaşılır.
Yukarıdaki örnekte, sahneyi aydınlatan ışık kaynağı merceğin önündedir, bu nedenle ışık kaynağının izdüşümü görüntü düzleminin üst yarısındadır.
Bununla birlikte, ışık merceğin arkasındaysa, ışık kaynağının izdüşümü görüntü düzleminin alt yarısında olacaktır. Bu ters çevirme nedeniyle, nesne kısıtlamasının gölgesi de ters çevrilmelidir.
Bu nedenle, görüntünün gölge oluşturma analizi üç olasılığı göz önünde bulundurmalıdır:
(1) Işık merceğin önünde bulunur, ışık kaynağının izdüşümü görüntü düzleminin üst kısmında bulunur ve kısıtlama döküm gölgeye sabitlenir ve nesneyi çevreler;
(2) ışık merceğin arkasındadır ve ışık kaynağı görüntü düzleminin alt yarısına yansıtılır, nesneye sabitlenir ve döküm gölgeyi sarar;
(3) Işık, merceğin merkezinin hemen üstünde veya altında bulunur, ışık kaynağının izdüşümü sonsuzdur ve kısıtlamalar sonsuzda kesişecektir. Bu durumlardan herhangi biri tüm kısıtlamaların ortak kesişimiyle sonuçlanırsa, gölge oluşturmak fiziksel olarak mantıklıdır.
Yansıma
Aşağıdaki Şekil 2'de gösterilen sahne, düzlemsel bir aynaya yansıyan üç kutuyu göstermektedir.
Bu diyagramın alt yarısı, gerçek kutu ile sanal kutu arasındaki geometrik ilişkiyi gösterir.
Turuncu çizgi, iki kutu kümesi arasındaki orta noktada bulunan aynayı temsil eder. Sarı çizgi, gerçek ve sanal kutulardaki ilgili noktaları birbirine bağlar. Bu çizgiler birbirine paralel ve aynaya diktir.
Şimdi bu paralel çizgilerin sahneye bindirildiklerinde nasıl göründüklerini düşünün. Ayna düzleminden bakıldığında, paralel çizgiler artık paralel değildir. Bunun yerine, perspektif projeksiyonu nedeniyle, bu paralel çizgiler bir noktaya yakınsar, tıpkı dünyadaki paralel çizgilerin bir ufuk noktasına yaklaşması gibi.
Sahnedeki karşılık gelen noktaları birleştiren çizgiler ve yansımaları her zaman paralel olduğundan, çizgilerin fiziksel olarak makul olması için görüntüde ortak bir kesişime sahip olması gerekir.
Örnek Analizi
Yukarıdaki Şekil 3, AI kompozit görüntülerinin üç temsili örneğini gösterir ve zeminlerin ve tezgahların geometrik perspektif tutarlılığını analiz eder.
Her görüntü (birkaç piksel içinde), tutarlı bir ufuk noktasının kanıtı olarak karo zeminin perspektif geometrisini doğru bir şekilde yakalar (mavi renkle işlenir). Bununla birlikte, paralel bir tezgahın (camgöbeği ile işlenmiş) ufuk noktası, bir tezgahın ufuk noktası ile geometrik olarak tutarsızdır.
Döşemeleri uygun şekilde hizalayın. Tezgah karoya paralel olmasa bile, camgöbeği ufuk noktası, karo zeminin ufuk noktası tarafından tanımlanan ufuk çizgisi (kırmızı ile işlenmiş) üzerinde olmalıdır. Şekil 3'ün sağ üst köşesindeki görüntü için, karo zemindeki yatay çizgilerin neredeyse paralel olduğunu, bu nedenle karşılık gelen ufuk noktalarının sonsuzda olduğunu ve bu nedenle kesişmediğini unutmayın.
Bu görüntülerdeki ufuk noktaları yerel olarak tutarlı olsa da, küresel olarak tutarlı değildir. 25 kompozit mutfak görüntüsünün her birinde aynı desen bulundu.
Yukarıdaki görüntü, bir istemle oluşturulan kare bir görüntüdür ve gölgelerde açık bir tutarsızlık vardır.
Yukarıdaki Şekil 8, oldukça doğru bir yansıma içeren yapay zeka tarafından oluşturulan bir görüntüye geometrik analiz uygulamanın sonucunu göstermektedir.
Bu yansımalar görsel olarak gerekçelendirilse de geometrik olarak tutarsızdır.
Önceki bölümlerdeki gölgelerin ve geometrinin aksine, DALL· E-2'nin makul yansımaları sentezlemesi zordur, çünkü muhtemelen bu tür yansımalar eğitim görüntüsü veri kümesinde daha az yaygındır.
Yapay zeka tarafından oluşturulan görüntülerin sınırlamalarına ilişkin bu anlayışlara dayanarak, görüntü tutarlılığının tespiti yoluyla görüntünün yapay zeka tarafından sentezlenip sentezlenmediğini belirlemek çok yararlıdır.
Görüntü tanıma zordur, yapay zeka yapay zekayı yener
AI görüntü üreteçleri sürekli gelişiyor.
Yılın ilk yarısında Midjourney patladı ve yeterince gerçekçi resimler üretebildi, ancak birçok insanı kandırdı.
86 yaşındaki Papa, beyaz bir kavun şapkası, kloş beyaz bir ceket ve açıkta kalan metal bir haç kolye ve ayrıca ciddi bir ifade takıyor.
O zamanlar, fotoğraf yayınlanır yayınlanmaz, sosyal medyadaki herkesi aldattı ve birçok netizen tarafından çılgınca iletildi ve hatta bazıları papayı çok moda olarak nitelendirdi.
Herkes buna inandığında, birileri aniden bunun yapay zeka tarafından üretildiğine dikkat çekti ve birçok insan anında şaşkına döndü.
Bu kestanelerden sadece biri ve Musk'ın yeni kız arkadaşı GM'nin CEO'su Barra gibi çeşitli sahte resimler sahte gerçeklik seviyesine ulaştı.
Bu olay, Musk'ı, Apple'ın kurucu ortağı Stephen Wozniak'ı ve diğer teknoloji liderlerini yapay zeka araştırma ve geliştirmesinin askıya alınması çağrısında bulunmaya doğrudan tetikledi.
Yapay zeka üretimi eğlenceli ve kullanışlı olsa da, bir bütün olarak endüstri için riskler oluşturuyor.
Küçük değilse, art niyetli kişiler tarafından yanlış bilgi yaymak, fikri mülkiyet haklarını ihlal etmek veya "meyve fotoğrafları" oluşturmak için kullanılacaktır.
Önümüzdeki birkaç ay içinde Midjourney, görüntü oluşturma açısından mükemmelleştirilmiş en son V6 sürümünü yayınlayacak.
Diğer AI görüntü oluşturucuları da hızla yineleniyor. Bir süre önce OpenAI, DALL· E 3, aynı zamanda Microsoft Bing görüntü oluşturma da DALL· E 3。
Tabii ki, araştırmacılar da görüntüleri ayırt edebilen araçlar oluşturmaya çalışıyorlar, anahtar, AI görüntü oluşturucularının hızına nasıl ayak uydurulacağıdır?
Yapay Zeka İnceleme Aracı Yarışması
Şimdi, bir düzineden fazla şirket, bir görüntünün yapay zeka tarafından oluşturulup oluşturulmadığını belirlemek için araçlar sağladı ve adları arasında Sensity AI (deepfasity detection), Fictitious.AI (intihal tespiti), Originality.AI ve daha fazlası yer alıyor.
Yapay zeka güven ve güvenlik şirketi Optic, bir "AI or Not" web sitesi başlattı.
Bu web sitesinde bir fotoğraf yükleyebilir veya bir resim URL'si yapıştırabilirsiniz ve web sitesi, fotoğrafın AI tarafından oluşturulup oluşturulmadığını otomatik olarak belirleyecektir. Yükleyebileceğiniz resim sayısında bir sınırlama yoktur.
Alternatif olarak, Optic'in Twitter hesabında @optic_xyz bir resim yayınlayabilir veya retweetleyebilir veya #aiornot ekleyebilirsiniz ve resmin güven yüzdesini içeren bir yanıt alırsınız.
Şirketin CEO'su Andrey Doronichev, Optic'in yapay zeka araçlarının, görüntüdeki parlaklık ve renk değişiklikleri gibi insan gözüyle görülemeyen eserler için her görüntüyü kontrol edebileceğini söyledi.
Şaşırtıcı bir şekilde, araç% 95'lik bir doğruluk oranına sahiptir.
Bununla birlikte, Midjourney gibi AI görüntü oluşturma araçlarının yükseltilmesi ve yinelenmesiyle, "AI or Not"un doğruluk oranı %88.9'a düştü.
Örneğin, Papa'nın resminde AI, insanların bunu yapma olasılığının %87 olduğuna inanıyor.
Papa'nın beyaz ceketli görüntüsü, Optik güncellemesinden önce kandırıldı
Aslında, bazı netizenler, bu resme yakından bakarsanız, birkaç bariz bulanık ayrıntı alanı da dahil olmak üzere yapay zeka tarafından oluşturulan bariz işaretler bulacağınızı söyledi:
Görünüşte tamamlanmamış el, yanında leke olan bir kahve fincanına pek benzemeyen bir şeyi kavramaya çalışıyor
Papa'nın taktığı haç dik açı şeklinde değil, aynı zamanda kilden oyulmuş gibi görünen oturan bir İsa'nın gravürüne de sahip.
Gözlükler yüzün gölgeleriyle eşleşmiyor
Bu noktaların tümü, bunun yapay zeka tarafından üretildiğini gösteriyor. Sadece gerçekliğin yüzeyini anlar, ancak fiziksel nesnelerin nasıl etkileşime girdiğini yöneten temel kuralları anlamaz.
Optic'in araçlarına ek olarak, içeriği etiketleyen bir yapay zeka şirketi olan Hive, kısa süre önce yapay zeka tarafından oluşturulan kendi ücretsiz içerik algılayıcısını güncelledi.
AI aracı, DALL-E, Stable Diffusion ve Midjourney'den milyonlarca görüntü üzerinde eğitildi.
Hive, yapay zeka tarafından oluşturulan görüntülerin yaklaşık yüzde 95'ini, özellikle de çevrimiçi olarak viral hale gelen paylaşılan görüntüleri, genellikle diğer görüntü tanımadan daha iyi bir şekilde algılamasını bekliyor.
CEO Kevin Guo, insanların yapay zeka görüntülerini paylaştıklarında en gerçekçi sahte görüntüleri seçtiklerini, böylece insanların neyin gerçek olduğunu ayırt edebileceklerini söyledi.
Soldaki görüntü, iki parmaktan ve tek beşlik çakmaktan ayırt edilebilen, yapay zeka tarafından oluşturulmuş bir görüntüdür, gerçek ise sağda normal bir iStock fotoğrafında göründüğü gibi gösterilir.
Optik gibi, Hive da Bing Image Creator'dan görüntüleri algılayamadı.
Ancak, bu algılama araçları durgun değildir ve AI görüntü modeli yinelendikçe güncelleştirilir ve yükseltilir.
Aslında, AI görüntü tanıma, yalnızca sektördeki algılama araçlarına güvenmekle kalmaz, aynı zamanda modelleri eğitirken korkuluklar da kurar.
Birçok yapay zeka görüntü oluşturucu, bazı içeriklerin oluşturulup oluşturulamayacağını sınırlayan bir "kara listeye" de sahiptir.
Örneğin, Bing Image Creator, tanınmış kişilerin resimlerini oluşturmasını isteyen kullanıcılardan gelen istemleri işaretler ve engeller.
Midjourney'in "insan moderatörleri" var ve kullanıcı isteklerini denetlemek için algoritmaları kullanmanın bir yolunu sunuyor.
Ve DALL· E 3 teknik raporuna göre, ChatGPT'den bazı "meyve haritaları" veya siyah beyaz içeren görüntüler oluşturmasını istediğinizde, girdi doğrudan yeniden yazılır.
** AI'ya filigran ekleyin, büyük üreticiler yapıyor **
Buna ek olarak, dijital filigran da üretken yapay zeka güvenliğini artırmanın önemli yollarından biridir ve ürünlerde Microsoft ve Google gibi teknoloji devleri kullanılmıştır.
Microsoft, DALL· Eylül ayındaki Surface Konferansı'nda. E 3, Bing'in görüntü oluşturma yeteneği ile kutsanmıştır.
Aynı zamanda, görüntülerin kötüye kullanılmadığından emin olmak için Microsoft ekibi, oluşturma saati ve tarihi de dahil olmak üzere her görüntü için görünmez filigranlar oluşturmak için şifreleme yöntemleri kullanır.
Herkes her resme tıklayabilir ve yapay zeka tarafından oluşturulup oluşturulmadığını kolayca belirleyebilir.
Meta ayrıca, dijital filigranları doğrudan yapay zeka tarafından otomatik olarak oluşturulan görüntülere yerleştiren açık kaynaklı Kararlı İmza'yı da kullandı.
Bildiri Adresi:
Kararlı İmza tarafından oluşturulan dijital filigranın kırpma, sıkıştırma, renk değiştirme vb. yıkıcı işlemlerden etkilenmediğini ve görüntünün orijinal kaynağına kadar izlenebileceğini belirtmekte fayda var.
Stabil Difüzyon gibi difüzyon ve GAN gibi modellere uygulanabilir.
Ve Google, Google Cloud Next'te, yapay zeka tarafından oluşturulan görüntülere filigran ekleyen ve bunları algılayan ve tanımlayan SynthID'yi de yayınladı.
SynthID, biri filigran ve diğeri tanıma için olmak üzere iki derin öğrenme modeli kullanır. Bir dizi farklı görüntü üzerinde birlikte eğitilebilirler.
Birleşik model, filigranlı içeriği doğru bir şekilde tanımlamak ve filigranı orijinal içerikle görsel olarak hizalayarak filigran gizliliğini iyileştirmek dahil olmak üzere bir dizi hedef için optimize edilmiştir.
SynthID tarafından oluşturulan dijital filigran, doğrudan görüntünün piksellerine gömülür ve insan gözüyle algılanamaz. Ancak SynthID bunları algılayabilir ve tanımlayabilir.
SynthID, bir görüntünün Imagen tarafından oluşturulma olasılığını değerlendirmeye yardımcı olabilir
Riverside'daki California Üniversitesi'nde elektrik ve bilgisayar mühendisliği profesörü olan Amit Roy-Chowdhury, görüntü arka planına yakından bakarak sahte görüntüleri kendi gözlerimizle daha iyi tespit edebileceğimizi söyledi.
Bununla birlikte, AI modellerinin yinelemeyi hızlandırdığı anda, "altın göze" sahip olmak çok zordur.
Kaynaklar:
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
On milyonlarca insan "yanmış bebek" resmini izliyor! Profesör Berkeley, AI resim dedektörlerinin işe yaramaz olduğu yönündeki söylentileri çürüttü
Makale kaynağı: Shin Ji Yuan
Yapay zekanın yapay zekayı yenememesi boşuna değil. Son zamanlarda, on milyonlarca insan bebek ölümlerinin fotoğraflarını izliyor ve yapay zeka tespit araçları tutarlı bir cevap veremedi.
AI resim dedektörü tekrar yıkandı!
Son zamanlarda, Orta Doğu'daki çatışmaların çok sayıda fotoğrafı internette yayınlandı ve dünyaya bu kadar aşırı koşullar altında yaşamın ne kadar kırılgan ve çaresiz olduğunu gösterdi.
Bunların arasında "yanmış bir bebeğin" fotoğrafı gerçek olamayacak kadar acımasız.
Tabii ki, fotoğraf AI dedektörü Optik tarafından "AI tarafından oluşturulmuş" olarak tanımlandı.
Son olarak, AI dedektörü yetkilisi, resmin AI tarafından oluşturulup oluşturulmadığını belirlemenin bir yolu olmadığına inanarak ve herkesin rasyonel bir şekilde tartışacağını umarak bu olay hakkında tweet attı.
**AI resim dedektörü, ne kadar güvenilmez? **
UC Berkeley'de profesör ve dijital görüntü işlemede dünyanın önde gelen uzmanlarından biri olan Hany Farid, görüntünün yapay zeka tarafından oluşturulduğuna dair hiçbir belirti göstermediğini söyledi.
Farid, "AI görüntü oluşturucularla ilgili en büyük sorunlardan biri, yüksek düzeyde yapılandırılmış şekiller ve düz çizgilerdir" dedi. "Bacaklara ve vidalara bakarsanız ve her şey mükemmel görünüyorsa, görüntünün yapay zeka tarafından oluşturulması neredeyse imkansız."
Örneğin, "Sünger Bob Kare Pantolon 9/1 yaptı" nın bu ünlü resminde, pencerenin dışındaki ikiz kulelerin çizgileri düz değil ve uçaktaki gösterge panelleri birlikte bükülmüş, bu da "A'da A" gibi görünüyor.
Farid ayrıca görüntüyü kendi diğer AI görüntü dedektörleri aracılığıyla tanımladı ve diğer dört AI görüntü algılama aracı da görüntünün AI tarafından oluşturulmadığını varsaydı.
Farid, "AI dedektörleri bir araçtır, ancak araç setinin yalnızca bir parçasıdır" dedi. Kullanıcıların tüm görüntü üzerinde bir dizi test yapması gerekiyor ve bir düğmeye dokunarak yanıt almak imkansız."
Ve AI algılama aracı Optical, kendi algılama teknolojisinin belirli ayrıntılarını vermedi.
Optic web sitesi ayrıca "AI dedektörlerinin yanlış sonuçlar üretebileceğini" belirtiyor.
AI Görüntü Algılama Teknolojisi
Profesör Farid, geçen yıl yapay zeka biyografi araçlarındaki görüntülerin tutarlılığının nasıl değerlendirileceğine dair bir makale yazdı.
Görüntüdeki tutarlılığı değerlendirerek, görüntünün yapay zeka tarafından oluşturulup oluşturulmadığını belirlemeye yardımcı olabilir.
Profesör, her biri görüntü oluşturma sürecinin doğasında bulunan aynı temel perspektif geometrisine dayanan üç ilgili fizik tabanlı analiz yönteminin ana hatlarını çizerek başlar.
Ufuk Noktası
Sahnedeki paralel çizgiler derinlikte geri çekilmezse, yani lens sensörüne mükemmel bir şekilde paralellerse (herhangi bir mesafede), paralel çizgiler paralel çizgiler olarak görüntülenecektir ve pratik amaçlar için ufuk noktası sonsuzda kabul edilebilir. Bu geometri, perspektif projeksiyonun temellerinden kaynaklanmaktadır.
Perspektif projeksiyonu altında, sahnedeki noktalar (X, Y, Z) noktalara (f X/Z, f Y/Z) göre görüntülenir, burada f merceğin odak uzaklığıdır.
Görüntüdeki noktanın konumu Z mesafesi ile ters orantılı olduğundan, yansıtılan nokta mesafenin bir fonksiyonu olarak sıkıştırılır ve görüntüdeki çizgilerin yakınsamasına neden olur;
Uzaktaki kutu, Şekil 1(b)'deki zemindeki karolarla hizalanır, böylece kutunun kenarları karolar arasındaki çizgiye paralel olur. Paralel düzlemlerdeki paralel çizgiler bir ufuk noktasını paylaştığından, ufuk noktası kutunun yan tarafında ve karo zeminde aynıdır;
Şekil 1(c)'de gösterildiği gibi, her biri farklı bir ufuk noktasına yakınsayan birçok paralel çizgi grubu. Paralel çizgi grupları sahnede aynı düzlemi kapsıyorsa, ufuk noktaları ufuk çizgisi üzerinde olacaktır. Ufuk çizgisinin yönü, merceğin paralel çizginin geçtiği düzleme göre dönüşü ile belirlenir
Gölgeler
Biraz şaşırtıcı bir şekilde, ufuk noktasının arkasındaki aynı geometri gölgeler oluşturmak için de işe yarıyor.
Gölgeler, nesneler ve ışıkla ilişkili bu geometrik kısıtlama, gölgenin düştüğü yüzeyin konumu ve yönü, ışık kaynağının yakın (masa lambası) veya uzakta (güneş) olup olmadığına bakılmaksızın geçerlidir.
Tabii ki, analiz, sahnenin tek bir ana ışık kaynağı tarafından aydınlatıldığını varsayar, bu da nesne başına yalnızca tek bir gölgenin varlığından anlaşılır.
Yukarıdaki örnekte, sahneyi aydınlatan ışık kaynağı merceğin önündedir, bu nedenle ışık kaynağının izdüşümü görüntü düzleminin üst yarısındadır.
Bununla birlikte, ışık merceğin arkasındaysa, ışık kaynağının izdüşümü görüntü düzleminin alt yarısında olacaktır. Bu ters çevirme nedeniyle, nesne kısıtlamasının gölgesi de ters çevrilmelidir.
Bu nedenle, görüntünün gölge oluşturma analizi üç olasılığı göz önünde bulundurmalıdır:
(1) Işık merceğin önünde bulunur, ışık kaynağının izdüşümü görüntü düzleminin üst kısmında bulunur ve kısıtlama döküm gölgeye sabitlenir ve nesneyi çevreler;
(2) ışık merceğin arkasındadır ve ışık kaynağı görüntü düzleminin alt yarısına yansıtılır, nesneye sabitlenir ve döküm gölgeyi sarar;
(3) Işık, merceğin merkezinin hemen üstünde veya altında bulunur, ışık kaynağının izdüşümü sonsuzdur ve kısıtlamalar sonsuzda kesişecektir. Bu durumlardan herhangi biri tüm kısıtlamaların ortak kesişimiyle sonuçlanırsa, gölge oluşturmak fiziksel olarak mantıklıdır.
Yansıma
Aşağıdaki Şekil 2'de gösterilen sahne, düzlemsel bir aynaya yansıyan üç kutuyu göstermektedir.
Turuncu çizgi, iki kutu kümesi arasındaki orta noktada bulunan aynayı temsil eder. Sarı çizgi, gerçek ve sanal kutulardaki ilgili noktaları birbirine bağlar. Bu çizgiler birbirine paralel ve aynaya diktir.
Şimdi bu paralel çizgilerin sahneye bindirildiklerinde nasıl göründüklerini düşünün. Ayna düzleminden bakıldığında, paralel çizgiler artık paralel değildir. Bunun yerine, perspektif projeksiyonu nedeniyle, bu paralel çizgiler bir noktaya yakınsar, tıpkı dünyadaki paralel çizgilerin bir ufuk noktasına yaklaşması gibi.
Sahnedeki karşılık gelen noktaları birleştiren çizgiler ve yansımaları her zaman paralel olduğundan, çizgilerin fiziksel olarak makul olması için görüntüde ortak bir kesişime sahip olması gerekir.
Örnek Analizi
Her görüntü (birkaç piksel içinde), tutarlı bir ufuk noktasının kanıtı olarak karo zeminin perspektif geometrisini doğru bir şekilde yakalar (mavi renkle işlenir). Bununla birlikte, paralel bir tezgahın (camgöbeği ile işlenmiş) ufuk noktası, bir tezgahın ufuk noktası ile geometrik olarak tutarsızdır.
Döşemeleri uygun şekilde hizalayın. Tezgah karoya paralel olmasa bile, camgöbeği ufuk noktası, karo zeminin ufuk noktası tarafından tanımlanan ufuk çizgisi (kırmızı ile işlenmiş) üzerinde olmalıdır. Şekil 3'ün sağ üst köşesindeki görüntü için, karo zemindeki yatay çizgilerin neredeyse paralel olduğunu, bu nedenle karşılık gelen ufuk noktalarının sonsuzda olduğunu ve bu nedenle kesişmediğini unutmayın.
Bu görüntülerdeki ufuk noktaları yerel olarak tutarlı olsa da, küresel olarak tutarlı değildir. 25 kompozit mutfak görüntüsünün her birinde aynı desen bulundu.
Bu yansımalar görsel olarak gerekçelendirilse de geometrik olarak tutarsızdır.
Önceki bölümlerdeki gölgelerin ve geometrinin aksine, DALL· E-2'nin makul yansımaları sentezlemesi zordur, çünkü muhtemelen bu tür yansımalar eğitim görüntüsü veri kümesinde daha az yaygındır.
Yapay zeka tarafından oluşturulan görüntülerin sınırlamalarına ilişkin bu anlayışlara dayanarak, görüntü tutarlılığının tespiti yoluyla görüntünün yapay zeka tarafından sentezlenip sentezlenmediğini belirlemek çok yararlıdır.
Görüntü tanıma zordur, yapay zeka yapay zekayı yener
AI görüntü üreteçleri sürekli gelişiyor.
Yılın ilk yarısında Midjourney patladı ve yeterince gerçekçi resimler üretebildi, ancak birçok insanı kandırdı.
86 yaşındaki Papa, beyaz bir kavun şapkası, kloş beyaz bir ceket ve açıkta kalan metal bir haç kolye ve ayrıca ciddi bir ifade takıyor.
O zamanlar, fotoğraf yayınlanır yayınlanmaz, sosyal medyadaki herkesi aldattı ve birçok netizen tarafından çılgınca iletildi ve hatta bazıları papayı çok moda olarak nitelendirdi.
Bu olay, Musk'ı, Apple'ın kurucu ortağı Stephen Wozniak'ı ve diğer teknoloji liderlerini yapay zeka araştırma ve geliştirmesinin askıya alınması çağrısında bulunmaya doğrudan tetikledi.
Yapay zeka üretimi eğlenceli ve kullanışlı olsa da, bir bütün olarak endüstri için riskler oluşturuyor.
Küçük değilse, art niyetli kişiler tarafından yanlış bilgi yaymak, fikri mülkiyet haklarını ihlal etmek veya "meyve fotoğrafları" oluşturmak için kullanılacaktır.
Önümüzdeki birkaç ay içinde Midjourney, görüntü oluşturma açısından mükemmelleştirilmiş en son V6 sürümünü yayınlayacak.
Diğer AI görüntü oluşturucuları da hızla yineleniyor. Bir süre önce OpenAI, DALL· E 3, aynı zamanda Microsoft Bing görüntü oluşturma da DALL· E 3。
Yapay Zeka İnceleme Aracı Yarışması
Şimdi, bir düzineden fazla şirket, bir görüntünün yapay zeka tarafından oluşturulup oluşturulmadığını belirlemek için araçlar sağladı ve adları arasında Sensity AI (deepfasity detection), Fictitious.AI (intihal tespiti), Originality.AI ve daha fazlası yer alıyor.
Yapay zeka güven ve güvenlik şirketi Optic, bir "AI or Not" web sitesi başlattı.
Bu web sitesinde bir fotoğraf yükleyebilir veya bir resim URL'si yapıştırabilirsiniz ve web sitesi, fotoğrafın AI tarafından oluşturulup oluşturulmadığını otomatik olarak belirleyecektir. Yükleyebileceğiniz resim sayısında bir sınırlama yoktur.
Şirketin CEO'su Andrey Doronichev, Optic'in yapay zeka araçlarının, görüntüdeki parlaklık ve renk değişiklikleri gibi insan gözüyle görülemeyen eserler için her görüntüyü kontrol edebileceğini söyledi.
Şaşırtıcı bir şekilde, araç% 95'lik bir doğruluk oranına sahiptir.
Bununla birlikte, Midjourney gibi AI görüntü oluşturma araçlarının yükseltilmesi ve yinelenmesiyle, "AI or Not"un doğruluk oranı %88.9'a düştü.
Örneğin, Papa'nın resminde AI, insanların bunu yapma olasılığının %87 olduğuna inanıyor.
Aslında, bazı netizenler, bu resme yakından bakarsanız, birkaç bariz bulanık ayrıntı alanı da dahil olmak üzere yapay zeka tarafından oluşturulan bariz işaretler bulacağınızı söyledi:
Görünüşte tamamlanmamış el, yanında leke olan bir kahve fincanına pek benzemeyen bir şeyi kavramaya çalışıyor
Papa'nın taktığı haç dik açı şeklinde değil, aynı zamanda kilden oyulmuş gibi görünen oturan bir İsa'nın gravürüne de sahip.
Gözlükler yüzün gölgeleriyle eşleşmiyor
Bu noktaların tümü, bunun yapay zeka tarafından üretildiğini gösteriyor. Sadece gerçekliğin yüzeyini anlar, ancak fiziksel nesnelerin nasıl etkileşime girdiğini yöneten temel kuralları anlamaz.
AI aracı, DALL-E, Stable Diffusion ve Midjourney'den milyonlarca görüntü üzerinde eğitildi.
CEO Kevin Guo, insanların yapay zeka görüntülerini paylaştıklarında en gerçekçi sahte görüntüleri seçtiklerini, böylece insanların neyin gerçek olduğunu ayırt edebileceklerini söyledi.
Optik gibi, Hive da Bing Image Creator'dan görüntüleri algılayamadı.
Ancak, bu algılama araçları durgun değildir ve AI görüntü modeli yinelendikçe güncelleştirilir ve yükseltilir.
Aslında, AI görüntü tanıma, yalnızca sektördeki algılama araçlarına güvenmekle kalmaz, aynı zamanda modelleri eğitirken korkuluklar da kurar.
Birçok yapay zeka görüntü oluşturucu, bazı içeriklerin oluşturulup oluşturulamayacağını sınırlayan bir "kara listeye" de sahiptir.
Örneğin, Bing Image Creator, tanınmış kişilerin resimlerini oluşturmasını isteyen kullanıcılardan gelen istemleri işaretler ve engeller.
Midjourney'in "insan moderatörleri" var ve kullanıcı isteklerini denetlemek için algoritmaları kullanmanın bir yolunu sunuyor.
Ve DALL· E 3 teknik raporuna göre, ChatGPT'den bazı "meyve haritaları" veya siyah beyaz içeren görüntüler oluşturmasını istediğinizde, girdi doğrudan yeniden yazılır.
** AI'ya filigran ekleyin, büyük üreticiler yapıyor **
Buna ek olarak, dijital filigran da üretken yapay zeka güvenliğini artırmanın önemli yollarından biridir ve ürünlerde Microsoft ve Google gibi teknoloji devleri kullanılmıştır.
Microsoft, DALL· Eylül ayındaki Surface Konferansı'nda. E 3, Bing'in görüntü oluşturma yeteneği ile kutsanmıştır.
Aynı zamanda, görüntülerin kötüye kullanılmadığından emin olmak için Microsoft ekibi, oluşturma saati ve tarihi de dahil olmak üzere her görüntü için görünmez filigranlar oluşturmak için şifreleme yöntemleri kullanır.
Herkes her resme tıklayabilir ve yapay zeka tarafından oluşturulup oluşturulmadığını kolayca belirleyebilir.
Kararlı İmza tarafından oluşturulan dijital filigranın kırpma, sıkıştırma, renk değiştirme vb. yıkıcı işlemlerden etkilenmediğini ve görüntünün orijinal kaynağına kadar izlenebileceğini belirtmekte fayda var.
Stabil Difüzyon gibi difüzyon ve GAN gibi modellere uygulanabilir.
SynthID, biri filigran ve diğeri tanıma için olmak üzere iki derin öğrenme modeli kullanır. Bir dizi farklı görüntü üzerinde birlikte eğitilebilirler.
Birleşik model, filigranlı içeriği doğru bir şekilde tanımlamak ve filigranı orijinal içerikle görsel olarak hizalayarak filigran gizliliğini iyileştirmek dahil olmak üzere bir dizi hedef için optimize edilmiştir.
Riverside'daki California Üniversitesi'nde elektrik ve bilgisayar mühendisliği profesörü olan Amit Roy-Chowdhury, görüntü arka planına yakından bakarak sahte görüntüleri kendi gözlerimizle daha iyi tespit edebileceğimizi söyledi.
Kaynaklar: