GPT-5 tidak jauh! OpenAI meluncurkan perayap web GPTBot, yang secara otomatis mengambil data dan dapat dimatikan secara selektif

Sunting: Persik sangat mengantuk

Sumber: Xinzhiyuan

Panduan: Baru saja, OpenAI meluncurkan GPTBot - perayap web yang dapat secara otomatis mengambil data dari seluruh Internet. Data yang dihasilkan akan digunakan untuk melatih model AI seperti GPT-4 dan GPT-5!

Beberapa waktu lalu sempat terjadi gejolak dalam pengambilan data pengguna platform, dan netizen Reddit pun berdebat.

Hari ini, OpenAI meluncurkan alat perayap web GPTBot, yang secara otomatis dapat mengikis data situs web.

**Cara Penggunaan? **

OpenAI mengatakan dalam dokumen yang diterbitkan bahwa perayap web akan memfilter untuk menghapus sumber yang memerlukan akses berbayar, tetapi juga menghapus informasi identitas pribadi (PII) atau teks yang melanggar kebijakannya.

Data yang diambil oleh GPTBot digunakan untuk melatih GPT-4 atau GPT-5, yang dapat meningkatkan akurasi dan kemampuan sistem kecerdasan buatan di masa mendatang.

Alat ini dapat diidentifikasi dengan kode berikut:

Token agen pengguna: String agen pengguna GPTBotFull: Mozilla/5.0 AppleWebKit/537.36 (KHTML, seperti Gecko; kompatibel; GPTBot/1.0; +

Larang akses ke GPTBot

Di sisi lain, Anda juga dapat menonaktifkan GPTBot dari mengakses situs web dengan menambahkannya ke situs robots.txt.

Artinya, pemilik situs web harus secara sukarela mengambil tindakan untuk melarang OpenAI mengakses situs web mereka dan tidak menggunakan data mereka sendiri untuk pelatihan.

Agen-pengguna: GPTBotLarang: /

Akses GPTBot Khusus

Anda juga dapat mengontrol akses GPTBot ke beberapa konten situs web melalui kode berikut.

Agen-pengguna: GPTBotAllow: /direktori-1/Larang: /direktori-2/

Ekspor IP

Untuk perayap OpenAI, situs web akan dipanggil dari blok alamat IP yang tercatat di situs web OpenAI.

Diskusi Hangat Netizen

Langkah OpenAI telah memicu diskusi di kalangan netizen tentang masalah etika perayap web yang digunakan untuk melatih model AI.

"OpenAI bahkan tidak mengutip secara moderat. Itu membuat karya turunan dan tidak mengutip, sehingga mengaburkan fakta bahwa itu ada."

Netizen mengatakan bahwa akhirnya ada kesempatan untuk mencegah OpenAI mengambil data jaringan Anda untuk melatih model tersebut.

Juga disarankan bahwa add-on browser ChatGPT telah dihapus selama beberapa waktu, sebagian karena memungkinkan akses ke konten di balik paywall.

Beberapa waktu lalu, OpenAI mengajukan permohonan merek dagang untuk GPT-5 ke Kantor Paten AS pada 18 Juli, menunjukkan bahwa perusahaan sedang melatih sistem AI yang lebih canggih.

GPTBot tampaknya akan membantu OpenAI mengumpulkan lebih banyak data dari internet untuk melatih model tersebut.

Referensi:

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)