Puluhan juta orang menonton gambar "bayi terbakar"! Profesor Berkeley membantah rumor bahwa detektor gambar AI tidak berguna

Sumber artikel: Shin Ji Yuan

Bukan tanpa alasan bahwa AI tidak bisa mengalahkan AI. Baru-baru ini, puluhan juta orang telah menonton foto kematian bayi, dan alat deteksi AI belum dapat memberikan jawaban yang konsisten.

Detektor gambar AI dicuci lagi!

Baru-baru ini, sejumlah besar foto konflik di Timur Tengah telah dipublikasikan di Internet, menunjukkan kepada dunia betapa rapuh dan tidak berdayanya kehidupan dalam kondisi ekstrem seperti itu.

Di antara mereka, foto "bayi yang terbakar" terlalu kejam untuk menjadi kenyataan.

Jadi, seseorang memasukkan foto ke detektor gambar AI untuk mendeteksi apakah foto-foto ini dihasilkan oleh AI.

Benar saja, foto itu diidentifikasi sebagai "AI-generated" oleh detektor AI Optic.

Di 4chan, bahkan ada "gambar asli", dan lokasi asli tubuhnya sebenarnya adalah seekor anjing.

Jadi netizen dengan marah pergi ke bagian bawah tweet penerbit, menyerangnya karena menggunakan foto yang dihasilkan AI untuk menyebarkan kepanikan kiamat palsu.

Tweet, yang percaya bahwa foto itu dihasilkan oleh AI, telah dibaca oleh 21 juta orang dalam waktu kurang dari 2 hari.

Namun tak lama kemudian netizen menemukan bahwa mereka meletakkan foto-foto tersebut pada detektor AI yang sama, dan hasilnya hampir acak, baik AI maupun manusia.

Seseorang telah menemukan bahwa selama gambar yang sama dipotong, atau warna latar belakang diubah menjadi hitam putih, detektor akan berpikir bahwa gambar itu diambil oleh manusia.

Bahkan terkadang ketika detektor "melempar koin", koin akan berdiri ...

Jadi, apakah grafik ini dihasilkan oleh AI?

Akhirnya, pejabat detektor AI juga men-tweet tentang kejadian ini, percaya bahwa mereka tidak memiliki cara untuk menentukan apakah gambar tersebut dihasilkan oleh AI, dan berharap semua orang akan berdiskusi secara rasional.

**Detektor gambar AI, seberapa tidak bisa diandalkan? **

Hany Farid, seorang profesor di UC Berkeley dan salah satu pakar terkemuka dunia dalam pemrosesan gambar digital, mengatakan gambar itu tidak menunjukkan indikasi bahwa itu dihasilkan oleh AI.

"Salah satu masalah terbesar dengan generator gambar AI adalah bentuk yang sangat terstruktur dan garis lurus," kata Farid. "Jika Anda melihat kaki dan sekrup dan semuanya terlihat sempurna, hampir tidak mungkin gambar dihasilkan oleh AI."

Misalnya, dalam gambar terkenal "SpongeBob SquarePants made 9/1" ini, garis-garis menara kembar di luar jendela tidak lurus, dan dasbor di pesawat dipelintir menjadi satu, yang terlihat seperti "A in A".

"Kita bisa melihat di foto itu bahwa struktur objek itu akurat, bayangannya akurat, tidak ada artefak – yang membuat saya percaya bahwa gambar itu harus benar-benar nyata," kata Farid.

Farid juga mengidentifikasi gambar melalui detektor gambar AI lainnya sendiri, dan empat alat deteksi gambar AI lainnya juga berasumsi bahwa gambar itu tidak dihasilkan AI.

"Detektor AI adalah alat, tetapi itu hanya bagian dari toolkit," kata Farid. Pengguna perlu menjalankan serangkaian tes pada seluruh gambar, dan tidak mungkin mendapatkan jawaban dengan satu sentuhan tombol."

Dan alat deteksi AI Optic tidak memberikan rincian spesifik tentang teknologi deteksinya sendiri.

Situs web Optic juga menyatakan bahwa "detektor AI dapat menghasilkan hasil yang tidak akurat."

Teknologi Deteksi Gambar AI

Profesor Farid menulis sebuah makalah tahun lalu tentang bagaimana menilai konsistensi gambar dalam alat biografi AI.

Dengan menilai konsistensi pada gambar, ini dapat membantu menentukan apakah gambar dihasilkan oleh AI.

Tautan Kertas:

Profesor memulai dengan menguraikan tiga metode analisis berbasis fisika yang relevan, masing-masing menggambar pada geometri perspektif fundamental yang sama yang melekat dalam proses pembentukan gambar.

Titik Hilang

  1. Garis kemunduran paralel bertemu pada titik lenyap.

瓷砖之间的线图1(a) paralel. Saat pencitraan, semua garis ini bertemu pada titik lenyap. Jika garis paralel dalam pemandangan jauh dari kedalaman lensa, maka ada titik lenyap, meskipun mungkin berada di luar gambar.

Jika garis paralel dalam pemandangan tidak surut secara mendalam, yaitu, jika garis tersebut sejajar sempurna dengan sensor lensa (pada jarak berapa pun), garis paralel akan dicitrakan sebagai garis paralel, dan untuk tujuan praktis, titik lenyap dapat dianggap tak terhingga. Geometri ini berasal dari dasar-dasar proyeksi perspektif.

Di bawah proyeksi perspektif, titik (X, Y, Z) dalam pemandangan dicitrakan ke titik (f X/Z, f Y/Z), di mana f adalah panjang fokus lensa.

Karena posisi titik dalam gambar berbanding terbalik dengan jarak Z, titik yang diproyeksikan dikompresi sebagai fungsi jarak, menghasilkan konvergensi garis pada gambar;

  1. Garis paralel pada bidang paralel bertemu ke titik lenyap yang sama

Kotak yang jauh sejajar dengan ubin di lantai pada Gambar 1 (b) sehingga tepi kotak sejajar dengan garis antara ubin. Karena garis paralel pada bidang paralel berbagi titik hilang, titik lenyap adalah sama di sisi kotak dan di lantai ubin;

  1. Titik lenyap semua garis di pesawat terletak di garis lenyap.

Banyak kelompok garis paralel, masing-masing menyatu ke titik lenyap yang berbeda, seperti yang ditunjukkan pada Gambar 1 (c). Jika kelompok garis paralel menjangkau bidang yang sama di tempat kejadian, titik lenyapnya akan berada di garis lenyap. Arah garis lenyap ditentukan oleh rotasi lensa relatif terhadap bidang di mana garis paralel melintasi

Bayangan

Agak mengejutkan, geometri yang sama di balik titik lenyap juga berfungsi untuk menghasilkan bayangan.

Gambar di atas menunjukkan tiga sinar yang menghubungkan titik-titik pada kotak dan rekan-rekan mereka pada bayangan casting. Memperluas batas gambar, ditemukan bahwa tiga sinar berpotongan pada titik yang sesuai dengan proyeksi sumber cahaya yang menerangi pemandangan.

Kendala geometris yang terkait dengan bayangan, objek, dan cahaya ini berlaku terlepas dari lokasi dan orientasi permukaan tempat bayangan dilemparkan, apakah sumber cahaya berada di dekatnya (lampu meja) atau jauh (matahari).

Tentu saja, analisis mengasumsikan bahwa pemandangan diterangi oleh sumber cahaya master tunggal, yang terbukti dari kehadiran hanya satu bayangan per objek.

Pada contoh di atas, sumber cahaya yang menyinari pemandangan berada di depan lensa, jadi proyeksi sumber cahaya berada di separuh bidang gambar bagian atas.

Namun demikian, jika cahaya berada di belakang lensa, proyeksi sumber cahaya akan berada di separuh bidang gambar yang lebih rendah. Karena inversi ini, bayangan batasan objek juga harus dibalik.

Oleh karena itu, analisis casting shadow gambar harus mempertimbangkan tiga kemungkinan:

(1) Cahaya terletak di depan lensa, proyeksi sumber cahaya terletak di bagian atas bidang gambar, dan kendala ditambatkan ke bayangan cor dan membungkus objek;

(2) cahaya berada di belakang lensa, dan sumber cahaya diproyeksikan di bagian bawah bidang gambar, menahan jangkar ke objek dan menyelimuti bayangan cor;

(3) Cahaya terletak tepat di atas atau di bawah pusat lensa, proyeksi sumber cahaya pada tak terhingga, dan kendala akan berpotongan pada tak terhingga. Jika salah satu dari kasus-kasus ini menghasilkan persimpangan umum dari semua kendala, secara fisik masuk akal untuk membuat bayangan.

Refleksi

Pemandangan yang ditunjukkan pada Gambar 2 di bawah ini menunjukkan tiga kotak yang dipantulkan dalam cermin planar.

Bagian bawah diagram ini menunjukkan hubungan geometris antara kotak nyata dan kotak virtual.

Garis oranye mewakili cermin, terletak di titik tengah antara dua set kotak. Garis kuning menghubungkan titik-titik yang sesuai pada kotak nyata dan virtual. Garis-garis ini sejajar satu sama lain dan tegak lurus terhadap cermin.

Sekarang, perhatikan bagaimana garis-garis paralel ini muncul ketika mereka ditumpangkan pada pemandangan. Jika dilihat dari bidang cermin, garis paralel tidak lagi sejajar. Sebaliknya, karena proyeksi perspektif, garis-garis paralel ini bertemu ke suatu titik, sama seperti garis-garis paralel di dunia bertemu ke titik lenyap.

Karena garis-garis yang menghubungkan titik-titik yang sesuai dalam pemandangan dan pantulannya selalu paralel, garis-garis tersebut harus memiliki persimpangan umum dalam gambar agar masuk akal secara fisik.

Analisis Instans

Gambar 3 di atas menunjukkan tiga contoh representatif dari gambar komposit AI dan menganalisis konsistensi perspektif geometris lantai dan counter top.

Setiap gambar (dalam beberapa piksel) secara akurat menangkap geometri perspektif lantai ubin sebagai bukti titik lenyap yang konsisten (ditampilkan dalam warna biru). Namun, titik lenyap dari meja paralel (diberikan dalam cyan) secara geometris tidak konsisten dengan titik lenyap meja.

Sejajarkan ubin yang sesuai. Bahkan jika meja tidak sejajar dengan ubin, titik lenyap cyan harus berada pada garis lenyap (diberikan dalam warna merah) yang ditentukan oleh titik lenyap lantai ubin. Perhatikan bahwa untuk gambar di sudut kanan atas Gambar 3, garis horizontal pada lantai ubin hampir sejajar, sehingga titik lenyap yang sesuai berada pada tak terhingga dan karenanya tidak berpotongan.

Sementara titik lenyap dalam gambar-gambar ini konsisten secara lokal, mereka tidak konsisten secara global. Di masing-masing dari 25 gambar dapur komposit, pola yang sama ditemukan.

Gambar di atas adalah gambar persegi yang dihasilkan dengan prompt, dan ada ketidakkonsistenan yang jelas dalam bayangan.

Gambar 8 di atas menunjukkan hasil penerapan analisis geometris pada gambar yang dihasilkan AI yang mengandung refleksi yang cukup akurat.

Meskipun pantulan ini dibenarkan secara visual, mereka secara geometris tidak konsisten.

Berbeda dengan bayangan dan geometri cor di bagian sebelumnya, DALL· E-2 sulit untuk mensintesis refleksi yang masuk akal, mungkin karena refleksi semacam itu kurang umum dalam dataset gambar pelatihannya.

Berdasarkan pemahaman tentang keterbatasan gambar yang dihasilkan AI ini, sangat membantu untuk menentukan apakah gambar disintesis oleh AI melalui deteksi konsistensi gambar.

Pengenalan gambar sulit, AI mengalahkan AI

Generator gambar AI terus berkembang.

Pada paruh pertama tahun ini, Midjourney meledak dan mampu menghasilkan gambar yang cukup realistis, tetapi menipu banyak orang.

Paus berusia 86 tahun itu mengenakan topi melon putih, jaket putih berkobar, dan kalung salib logam yang terbuka, ditambah ekspresi serius.

Saat itu, begitu foto itu dirilis, itu menipu semua orang di media sosial, dan dengan panik diteruskan oleh banyak netizen, dan beberapa bahkan menyebut paus terlalu trendi.

Ketika semua orang mempercayainya, seseorang tiba-tiba menunjukkan bahwa itu dihasilkan oleh AI, dan banyak orang langsung tercengang.

Ini hanyalah salah satu chestnut, dan berbagai gambar palsu seperti Barra, CEO pacar baru Musk GM, telah mencapai tingkat realitas palsu.

Insiden ini secara langsung memicu Musk, pendiri Apple Stephen Wozniak dan para pemimpin teknologi lainnya untuk menyerukan penangguhan penelitian dan pengembangan AI.

Sementara generasi AI menyenangkan dan nyaman, itu menimbulkan risiko bagi industri secara keseluruhan.

Jika tidak kecil, itu akan digunakan oleh orang-orang dengan motif tersembunyi untuk menyebarkan informasi palsu, melanggar hak kekayaan intelektual, atau menggunakannya untuk menghasilkan "foto buah" dan sebagainya.

Dalam beberapa bulan ke depan, Midjourney akan merilis versi V6 terbaru, yang telah disempurnakan dalam hal pembuatan gambar.

Generator gambar AI lainnya juga iterasi dengan cepat. Beberapa waktu lalu, OpenAI baru saja merilis DALL· E 3, pada saat yang sama pembuatan gambar Microsoft Bing juga menggunakan DALL· E 3。

Tentu saja, para peneliti juga mencoba membangun alat yang dapat membedakan gambar, kuncinya adalah bagaimana mengikuti kecepatan generator gambar AI?

Kompetisi Alat Inspeksi AI

Sekarang, lebih dari selusin perusahaan telah menyediakan alat untuk mengidentifikasi apakah suatu gambar dihasilkan oleh AI, dan nama mereka termasuk Sensity AI (deteksi deepfasity), Fictitious.AI (deteksi plagiarisme), Originality.AI, dan banyak lagi.

Perusahaan kepercayaan dan keamanan kecerdasan buatan Optic telah meluncurkan situs web "AI or Not".

Di situs web ini, Anda dapat mengunggah foto atau menempelkan URL gambar, dan situs web akan secara otomatis menentukan apakah foto itu dihasilkan oleh AI. Tidak ada batasan jumlah gambar yang dapat Anda unggah.

Atau, Anda dapat memposting atau me-retweet gambar di akun Twitter Optic @optic_xyz, atau menambahkan #aiornot, dan Anda akan mendapatkan balasan dengan persentase kepercayaan gambar.

Andrey Doronichev, kepala eksekutif perusahaan, mengatakan alat AI Optic dapat memeriksa setiap gambar untuk artefak yang tidak terlihat oleh mata manusia, seperti perubahan kecerahan dan warna pada gambar.

Anehnya, alat ini memiliki tingkat akurasi 95%.

Namun, dengan peningkatan dan iterasi alat pembuat gambar AI seperti Midjourney, tingkat akurasi "AI atau Tidak" turun menjadi 88,9%.

Misalnya, dalam gambar Paus, AI percaya bahwa ada kemungkinan 87% bahwa manusia akan melakukannya.

Gambar paus dengan jaket putih tertipu sebelum pembaruan Optik

Faktanya, beberapa netizen mengatakan bahwa jika Anda melihat lebih dekat pada gambar ini, Anda akan menemukan tanda-tanda jelas yang dihasilkan oleh kecerdasan buatan, termasuk beberapa area detail yang jelas buram:

  • Tangan yang tampaknya tidak lengkap mencoba untuk menangkap sesuatu yang tidak cukup menyerupai cangkir kopi dengan noda di sebelahnya

Salib yang dikenakan oleh Paus tidak berbentuk sudut siku-siku, tetapi juga memiliki ukiran Yesus duduk yang tampaknya diukir dari tanah liat

  • Kacamata tidak cocok dengan bayangan wajah

Semua poin ini menunjukkan bahwa ini dihasilkan oleh kecerdasan buatan. Ia hanya memahami permukaan realitas, tetapi bukan aturan dasar yang mengatur bagaimana objek fisik berinteraksi.

Selain alat Optic, Hive, sebuah perusahaan AI yang menandai konten, baru-baru ini memperbarui detektor konten yang dihasilkan AI gratisnya sendiri.

Alat AI dilatih pada jutaan gambar dari DALL-E, Difusi Stabil, dan Midjourney.

Hive mengharapkannya untuk secara akurat mendeteksi sekitar 95 persen gambar yang dihasilkan AI, terutama gambar bersama yang menjadi viral online, seringkali lebih baik daripada pengenalan gambar lainnya.

CEO Kevin Guo mengatakan bahwa ketika orang berbagi gambar AI, mereka memilih gambar palsu yang paling realistis, sehingga orang dapat membedakan apa yang nyata.

Gambar di sebelah kiri adalah gambar yang dihasilkan AI yang dapat dilihat dari dua jari dan tos aneh, sedangkan hal yang nyata terlihat seperti dalam foto iStock biasa ditampilkan di sebelah kanan.

Seperti Optic, Apache Hive gagal mendeteksi gambar dari Bing Image Creator.

Namun, alat deteksi ini tidak stagnan, dan mereka akan diperbarui dan ditingkatkan saat model gambar AI diulang.

Faktanya, pengenalan gambar AI tidak hanya dapat mengandalkan alat deteksi di industri untuk menyelesaikannya, tetapi juga memasang pagar pembatas saat melatih model.

Banyak generator gambar kecerdasan buatan juga memiliki "daftar hitam" yang membatasi apakah beberapa konten dapat dihasilkan.

Misalnya, Bing Image Creator menandai dan memblokir permintaan dari pengguna yang memintanya untuk membuat gambar tokoh masyarakat terkenal.

Midjourney memiliki "moderator manusia" dan meluncurkan cara untuk menggunakan algoritme untuk memoderasi permintaan pengguna.

Dan DALL· Menurut laporan teknis E3, ketika Anda meminta ChatGPT untuk menghasilkan beberapa "peta buah", atau gambar yang melibatkan hitam putih, inputnya langsung ditulis ulang.

** Tambahkan tanda air ke AI, produsen besar melakukan **

Selain itu, watermarking digital juga merupakan salah satu sarana penting untuk meningkatkan keamanan AI generatif, dan raksasa teknologi seperti Microsoft dan Google telah digunakan dalam produk.

Microsoft memperkenalkan DALL· di Surface Conference pada bulan September. E 3 diberkati dengan kemampuan Bing untuk menghasilkan gambar.

Pada saat yang sama, untuk memastikan bahwa gambar tidak disalahgunakan, tim Microsoft menggunakan metode enkripsi untuk menghasilkan tanda air yang tidak terlihat untuk setiap gambar, termasuk waktu dan tanggal pembuatan.

Siapa pun dapat mengklik setiap gambar dan dengan mudah mengidentifikasi apakah itu dihasilkan oleh AI.

Meta juga membuka sumber Stable Signature, yang menyematkan tanda air digital langsung ke gambar yang dihasilkan secara otomatis oleh AI.

Alamat kertas:

Perlu disebutkan bahwa tanda air digital yang dihasilkan oleh Tanda Tangan Stabil tidak terpengaruh oleh operasi destruktif seperti memotong, mengompresi, mengubah warna, dll., Dan dapat ditelusuri kembali ke sumber asli gambar.

Ini dapat diterapkan pada model seperti difusi dan GAN, seperti Difusi Stabil.

Dan Google, di Google Cloud Next, juga merilis SynthID yang memberi watermark pada gambar yang dihasilkan AI dan mendeteksi serta mengidentifikasinya.

SynthID menggunakan dua model pembelajaran mendalam, satu untuk watermarking dan satu untuk pengenalan. Mereka dapat dilatih bersama pada satu set gambar yang berbeda.

Model gabungan dioptimalkan untuk berbagai tujuan, termasuk mengidentifikasi konten watermark dengan benar dan meningkatkan penyembunyian watermark dengan menyelaraskan watermark secara visual dengan konten asli.

Tanda air digital yang dihasilkan oleh SynthID tertanam langsung ke piksel gambar dan tidak terlihat oleh mata manusia. Tetapi SynthID dapat mendeteksi dan mengidentifikasi mereka.

SynthID dapat membantu menilai kemungkinan bahwa gambar dibuat oleh Imagen

Amit Roy-Chowdhury, seorang profesor teknik elektro dan komputer di University of California, Riverside, mengatakan bahwa dengan melihat lebih dekat pada latar belakang gambar, kita dapat mendeteksi gambar palsu dengan lebih baik dengan mata kepala sendiri.

Namun, pada saat model AI mempercepat iterasi, terlalu sulit untuk memiliki "mata emas".

Sumber daya:

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)