"Pemberontakan data" pecah di Amerika Serikat: Sastra Hollywood, jurnalisme, dan media sosial memberontak melawan AI

Penulis: Magang Chen Xiaorui; Reporter Fang Xiao

Sumber: Makalah

Eric Goldman, seorang profesor di School of Law di Universitas Santa Clara di Amerika Serikat, percaya bahwa gelombang litigasi baru saja dimulai, dan "gelombang kedua dan ketiga" akan datang, yang akan menentukan masa depan kecerdasan buatan.

Perusahaan AI berargumen bahwa menggunakan karya berhak cipta untuk melatih AI adalah masuk akal — referensi ke konsep "penggunaan transformatif" dalam undang-undang hak cipta AS, di mana materi diubah dengan cara "transformatif" akan membuat pengecualian.

Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas

American Screenwriters Guild telah melakukan pemogokan selama lebih dari 70 hari, menuntut kenaikan upah, meningkatkan pangsa platform media streaming, dan pengawasan kecerdasan buatan.

Sebuah "pemberontakan data" sedang pecah di Amerika, dengan Hollywood, artis, penulis, perusahaan media sosial, dan organisasi berita di antara para pemberontak.

Semua kesalahan menunjuk pada alat kecerdasan buatan generatif seperti ChatGPT dan Stable Diffusion, yang dituduh secara ilegal menggunakan karya pembuat konten untuk melatih model bahasa besar tanpa izin atau kompensasi.

Inti dari "pemberontakan data" ini adalah pengakuan baru bahwa informasi online -- cerita, karya seni, artikel berita, postingan web, dan foto -- dapat memiliki nilai signifikan yang belum dimanfaatkan. Praktik menggores konten publik di internet memiliki sejarah panjang, dan sebagian besar perusahaan dan organisasi nirlaba yang melakukannya secara terbuka mengungkapkannya. Namun sebelum ChatGPT dirilis, pemilik data tidak mengetahui banyak tentangnya, juga tidak melihatnya sebagai masalah yang sangat serius. Sekarang, itu telah berubah karena publik telah belajar lebih banyak tentang dasar-dasar pelatihan AI.

"Ini adalah pembentukan ulang mendasar dari nilai data." Brandon Duderstadt, pendiri dan CEO Nomic, mengatakan dalam sebuah wawancara dengan media. Anda dapat mengakses data dan menjalankan iklan untuk mendapatkan nilai darinya. Sekarang, orang berpikir mereka harus melakukannya melindungi data mereka.”

Pasang demi gelombang

Dalam beberapa bulan terakhir, perusahaan media sosial seperti Reddit dan Twitter, organisasi berita seperti The New York Times dan NBC, penulis fiksi ilmiah Paul Tremblay dan aktris Sarah Silverman (Sarah Silverman) dan lainnya telah mengambil tindakan untuk menentang pengumpulan karya dan data mereka secara tidak sah. oleh kecerdasan buatan. Serangkaian gerakan ini dijuluki "Pemberontakan Data" oleh media Amerika.

Pekan lalu, Silverman mengajukan gugatan terhadap OpenAI dan Meta, menuduh mereka menggunakan salinan bajakan bukunya dalam data pelatihan mereka karena chatbot perusahaan dapat meringkas konten dari bukunya secara akurat. Selain itu, lebih dari 5.000 penulis, termasuk Jodi Picoult, Margaret Atwood, dan Viet Thanh Nguyen, telah menandatangani petisi yang meminta perusahaan teknologi untuk meminta izin dan memberi mereka atribusi dan kompensasi saat menggunakan buku mereka sebagai data pelatihan.

Untuk melindungi karya mereka, para penulis dan seniman menggunakan berbagai bentuk protes. Beberapa memilih untuk mengunci pekerjaan dan mencegah kecerdasan buatan untuk mendapatkannya; beberapa memilih untuk memboikot situs web yang menerbitkan konten yang dihasilkan kecerdasan buatan; beberapa memilih untuk menulis konten subversif untuk mengganggu pembelajaran kecerdasan buatan.

Pada 13 Juli, SAG-AFTRA, salah satu dari tiga serikat pekerja besar Hollywood dengan 160.000 anggota, mengumumkan pemogokan.Sebelum itu, Persatuan Penulis Skenario Amerika telah melakukan pemogokan selama lebih dari 70 hari. Menurut New York Times, pemogokan umum telah menghentikan industri film dan televisi AS senilai $134 miliar. Dijamin tidak akan mengganti aktor dengan AI dan wajah serta suara yang dihasilkan komputer.

Sementara itu, beberapa organisasi berita menentang AI. Pada bulan Juni, dalam memo internal tentang penggunaan AI generatif, The New York Times mengatakan, "Perusahaan AI harus menghormati kekayaan intelektual kami." Dalam sebuah pernyataan, penerbit online seperti The New York Times dan The Washington Post berpendapat bahwa menggunakan hak cipta artikel berita sebagai data pelatihan untuk kecerdasan buatan memiliki potensi risiko dan masalah hukum, dan mereka meminta perusahaan kecerdasan buatan untuk menghormati pengetahuan hak milik penerbit dan tenaga kerja kreatif.

Perusahaan media sosial juga mengambil sikap. Pada bulan April, situs berita sosial Reddit mengatakan ingin membebankan biaya kepada pihak ketiga untuk akses ke antarmuka pemrograman aplikasi (API). CEO Reddit Steve Hoffman mengatakan perusahaannya "tidak perlu memberikan semua nilai secara gratis kepada beberapa perusahaan terbesar di dunia." Pada bulan Juli, pemilik Twitter Elon Musk (Elon Musk) juga menyatakan bahwa beberapa perusahaan dan organisasi " secara ilegal" mengambil sejumlah besar data Twitter. Menanggapi "pengikisan data ekstrem dan manipulasi sistem", Twitter memutuskan untuk membatasi jumlah tweet yang dapat dilihat oleh masing-masing akun.

Pendiri dan CEO Reddit Steve Hoffman ingin membebankan biaya kepada pihak ketiga untuk akses ke antarmuka pemrograman aplikasi (API), yang memicu kemarahan besar-besaran di kalangan netizen.

“Pemberontakan data” ini juga mencakup “gelombang gugatan”, dengan beberapa perusahaan AI dituntut berkali-kali karena masalah privasi data. Pada bulan November, sekelompok pemrogram mengajukan gugatan class action terhadap Microsoft dan OpenAI, menuduh bahwa perusahaan tersebut melanggar hak cipta mereka dengan menggunakan kode mereka untuk melatih asisten pemrograman kecerdasan buatan. Pada bulan Juni tahun ini, firma hukum Clarkson yang berbasis di Los Angeles mengajukan gugatan class action setebal 151 halaman terhadap OpenAI dan Microsoft, menunjukkan bagaimana OpenAI mengumpulkan data dari anak di bawah umur, mengatakan bahwa pengikisan web melanggar hukum hak cipta dan merupakan "Pencurian". Perusahaan sejak itu mengajukan gugatan serupa terhadap Google.

Profesor Fakultas Hukum Universitas Santa Clara Eric Goldman (Eric Goldman) mengatakan dalam sebuah wawancara dengan media bahwa argumen gugatan ini terlalu luas dan kemungkinan besar tidak akan diterima oleh pengadilan. Namun dia berpendapat bahwa gelombang tuntutan hukum baru saja dimulai, dengan kedatangan "gelombang kedua dan ketiga" yang akan menentukan masa depan kecerdasan buatan.

Kontroversi Hukum

ChatGPT dan Dall-E OpenAI, Google Bard, Stability AI's Stable Diffusion, dan AI generatif lainnya semuanya dilatih berdasarkan artikel berita, buku, gambar, video, dan posting blog besar-besaran yang diambil dari Internet, banyak di antaranya bersifat publik dilindungi oleh hak cipta.

Pada bulan Maret tahun ini, OpenAI merilis laporan analisis model bahasa utama lembaga tersebut, yang menunjukkan bahwa bagian teks dari data pelatihan menggunakan data dari situs berita, Wikipedia, dan database buku bajakan (LibGen), yang saat ini ditutup. Departemen Kehakiman AS.

Pada 13 Juli, Komisi Perdagangan Federal (FTC) AS mengirim dokumen setebal 20 halaman ke OpenAI, meminta OpenAI untuk memberikan catatan tentang manajemen risiko, keamanan data, dan tinjauan informasi model kecerdasan buatannya untuk menyelidiki apakah itu melanggar peraturan hak konsumen. hak.

Pada 12 Juli, subkomite Senat AS mengadakan sidang tentang kecerdasan buatan, kekayaan intelektual, dan masalah hak cipta, dan para saksi yang hadir disumpah di pengadilan. Audiensi mendengar dari industri musik, pembuat Photoshop Adobe, perusahaan kecerdasan buatan Stability AI dan ilustrator Karla Ortiz.

Namun dalam penampilan publik dan tanggapan terhadap tuntutan hukum, perusahaan AI berpendapat bahwa menggunakan karya berhak cipta untuk melatih AI adalah masuk akal — referensi ke konsep "penggunaan transformatif" dalam undang-undang hak cipta A.S., yang terjadi jika materi diterbitkan dalam A " transformatif" cara mengubah yang menciptakan pengecualian.

"Model AI pada dasarnya belajar dari semua informasi. Ini seperti seorang siswa membaca di perpustakaan dan kemudian belajar menulis dan membaca," kata Kent Walker, presiden urusan global Google, dalam sebuah wawancara. "Pada saat yang sama waktu, Anda harus memastikan bahwa Anda tidak menyalin karya orang lain atau melakukan sesuatu yang melanggar hak cipta."

Halimah DeLaine Prado, penasihat umum Google, mengatakan kepada media: "Sudah jelas bagi semua orang selama bertahun-tahun bahwa kami menggunakan data dari sumber publik — seperti memposting ke web terbuka dan data publik. Mengumpulkan informasi untuk melatih model AI di balik layanan seperti Google Terjemahan." Dia mencatat, "Hukum AS mendukung penciptaan penggunaan informasi publik yang baru dan bermanfaat, dan kami berharap dapat menyangkal klaim tak berdasar ini."

Andres Sawicki, seorang profesor di University of Miami yang mempelajari hukum kekayaan intelektual, mengatakan dalam sebuah wawancara bahwa ada beberapa preseden yang dapat menguntungkan perusahaan teknologi, seperti putusan Pengadilan Banding AS tahun 1992 yang mengizinkan perusahaan untuk menuntut perusahaan lain atas kekayaan intelektual mereka. hak milik Kode perangkat lunak direkayasa balik untuk merancang produk pesaing. Tetapi banyak yang mengatakan secara intuitif tidak adil bagi perusahaan besar untuk menggunakan karya pencipta untuk membuat alat penghasil uang baru. "Pertanyaan tentang AI generatif sangat sulit dijawab," ujarnya.

Jessica D. Litman Sawicki, seorang profesor hukum hak cipta di University of Miami, mengatakan doktrin penggunaan wajar adalah pertahanan yang kuat bagi perusahaan AI karena ukuran model AI. manusia tertentu. Tetapi dia berpendapat bahwa jika pembuat yang menggugat perusahaan AI dapat menunjukkan cukup banyak contoh keluaran AI yang sangat mirip dengan karya mereka, mereka akan memiliki alasan kuat untuk percaya bahwa hak cipta telah dilanggar.

Perusahaan AI mulai merespons

Perusahaan AI dapat menghindari ini dengan memasang filter di produk mereka untuk memastikan mereka tidak menghasilkan sesuatu yang terlalu mirip dengan pekerjaan yang ada, kata Sauwicki. Misalnya, situs video YouTube sudah menggunakan teknologi untuk mendeteksi dan secara otomatis menghapus karya berhak cipta yang diunggah ke situsnya. Secara teori, perusahaan AI juga dapat membangun algoritme yang menemukan keluaran yang sangat mirip dengan karya seni, musik, atau tulisan yang ada.

"Pemberontakan data" ini mungkin tidak menimbulkan gelombang dalam jangka panjang. Raksasa teknologi seperti Google dan Microsoft sudah memiliki data hak milik dalam jumlah besar dan memiliki kemampuan untuk memperoleh lebih banyak. Tetapi perusahaan baru dan nirlaba yang ingin mengambil pemain yang lebih besar mungkin tidak mendapatkan cukup data untuk melatih sistem mereka karena konten menjadi lebih sulit diperoleh.

Baru pada awal Juli, Stuart Russell, seorang profesor ilmu komputer di University of California, Berkeley dan penulis "Artificial Intelligence: A Modern Approach," memperingatkan bahwa robot berbasis AI seperti ChatGPT dapat segera "kehabisan alam semesta. " teks", dan teknik untuk melatih bot dengan mengumpulkan teks dalam jumlah besar "mulai kesulitan".

Beberapa perusahaan juga mengikuti arus dengan sikap kooperatif. Dalam sebuah pernyataan, OpenAI mengatakan, "Kami menghormati hak kreatif dan penulis dan berharap untuk terus bekerja dengan mereka untuk melindungi kepentingan mereka." Pada 14 Juli, Associated Press setuju untuk melisensikan arsip beritanya dari tahun 1985 hingga OpenAI, sekaligus memanfaatkan teknologi dan produk OpenAI.

Google juga mengatakan dalam sebuah pernyataan bahwa pihaknya terlibat dalam negosiasi tentang bagaimana penerbit akan mengelola konten mereka di masa mendatang. "Kami percaya bahwa setiap orang dapat memperoleh manfaat dari ekosistem konten yang dinamis," kata perusahaan itu.

Margaret Mitchell (Margaret Mitchell), kepala ilmuwan etika di perusahaan kecerdasan buatan HuggingFace, mengatakan dalam sebuah wawancara dengan media, "Seluruh sistem pengumpulan data perlu diubah, dan sayangnya itu harus dicapai melalui litigasi, yang seringkali merupakan Ini adalah cara untuk mendorong perusahaan teknologi untuk berubah." Dia mengatakan dia tidak akan terkejut jika OpenAI menarik salah satu produknya sepenuhnya pada akhir tahun karena tuntutan hukum atau peraturan baru.

Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)