Panduan: Baru saja, OpenAI meluncurkan GPTBot - perayap web yang dapat secara otomatis mengambil data dari seluruh Internet. Data yang dihasilkan akan digunakan untuk melatih model AI seperti GPT-4 dan GPT-5!
Beberapa waktu lalu sempat terjadi gejolak dalam pengambilan data pengguna platform, dan netizen Reddit pun berdebat.
Hari ini, OpenAI meluncurkan alat perayap web GPTBot, yang secara otomatis dapat mengikis data situs web.
**Cara Penggunaan? **
OpenAI mengatakan dalam dokumen yang diterbitkan bahwa perayap web akan memfilter untuk menghapus sumber yang memerlukan akses berbayar, tetapi juga menghapus informasi identitas pribadi (PII) atau teks yang melanggar kebijakannya.
Data yang diambil oleh GPTBot digunakan untuk melatih GPT-4 atau GPT-5, yang dapat meningkatkan akurasi dan kemampuan sistem kecerdasan buatan di masa mendatang.
Alat ini dapat diidentifikasi dengan kode berikut:
Token agen pengguna: String agen pengguna GPTBotFull: Mozilla/5.0 AppleWebKit/537.36 (KHTML, seperti Gecko; kompatibel; GPTBot/1.0; +
Larang akses ke GPTBot
Di sisi lain, Anda juga dapat menonaktifkan GPTBot dari mengakses situs web dengan menambahkannya ke situs robots.txt.
Artinya, pemilik situs web harus secara sukarela mengambil tindakan untuk melarang OpenAI mengakses situs web mereka dan tidak menggunakan data mereka sendiri untuk pelatihan.
Agen-pengguna: GPTBotLarang: /
Akses GPTBot Khusus
Anda juga dapat mengontrol akses GPTBot ke beberapa konten situs web melalui kode berikut.
Untuk perayap OpenAI, situs web akan dipanggil dari blok alamat IP yang tercatat di situs web OpenAI.
Diskusi Hangat Netizen
Langkah OpenAI telah memicu diskusi di kalangan netizen tentang masalah etika perayap web yang digunakan untuk melatih model AI.
"OpenAI bahkan tidak mengutip secara moderat. Itu membuat karya turunan dan tidak mengutip, sehingga mengaburkan fakta bahwa itu ada."
Netizen mengatakan bahwa akhirnya ada kesempatan untuk mencegah OpenAI mengambil data jaringan Anda untuk melatih model tersebut.
Juga disarankan bahwa add-on browser ChatGPT telah dihapus selama beberapa waktu, sebagian karena memungkinkan akses ke konten di balik paywall.
Beberapa waktu lalu, OpenAI mengajukan permohonan merek dagang untuk GPT-5 ke Kantor Paten AS pada 18 Juli, menunjukkan bahwa perusahaan sedang melatih sistem AI yang lebih canggih.
GPTBot tampaknya akan membantu OpenAI mengumpulkan lebih banyak data dari internet untuk melatih model tersebut.
Referensi:
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
GPT-5 tidak jauh! OpenAI meluncurkan perayap web GPTBot, yang secara otomatis mengambil data dan dapat dimatikan secara selektif
Sunting: Persik sangat mengantuk
Sumber: Xinzhiyuan
Panduan: Baru saja, OpenAI meluncurkan GPTBot - perayap web yang dapat secara otomatis mengambil data dari seluruh Internet. Data yang dihasilkan akan digunakan untuk melatih model AI seperti GPT-4 dan GPT-5!
Beberapa waktu lalu sempat terjadi gejolak dalam pengambilan data pengguna platform, dan netizen Reddit pun berdebat.
Hari ini, OpenAI meluncurkan alat perayap web GPTBot, yang secara otomatis dapat mengikis data situs web.
**Cara Penggunaan? **
OpenAI mengatakan dalam dokumen yang diterbitkan bahwa perayap web akan memfilter untuk menghapus sumber yang memerlukan akses berbayar, tetapi juga menghapus informasi identitas pribadi (PII) atau teks yang melanggar kebijakannya.
Data yang diambil oleh GPTBot digunakan untuk melatih GPT-4 atau GPT-5, yang dapat meningkatkan akurasi dan kemampuan sistem kecerdasan buatan di masa mendatang.
Alat ini dapat diidentifikasi dengan kode berikut:
Token agen pengguna: String agen pengguna GPTBotFull: Mozilla/5.0 AppleWebKit/537.36 (KHTML, seperti Gecko; kompatibel; GPTBot/1.0; +
Larang akses ke GPTBot
Di sisi lain, Anda juga dapat menonaktifkan GPTBot dari mengakses situs web dengan menambahkannya ke situs robots.txt.
Artinya, pemilik situs web harus secara sukarela mengambil tindakan untuk melarang OpenAI mengakses situs web mereka dan tidak menggunakan data mereka sendiri untuk pelatihan.
Agen-pengguna: GPTBotLarang: /
Akses GPTBot Khusus
Anda juga dapat mengontrol akses GPTBot ke beberapa konten situs web melalui kode berikut.
Agen-pengguna: GPTBotAllow: /direktori-1/Larang: /direktori-2/
Ekspor IP
Untuk perayap OpenAI, situs web akan dipanggil dari blok alamat IP yang tercatat di situs web OpenAI.
Diskusi Hangat Netizen
Langkah OpenAI telah memicu diskusi di kalangan netizen tentang masalah etika perayap web yang digunakan untuk melatih model AI.
"OpenAI bahkan tidak mengutip secara moderat. Itu membuat karya turunan dan tidak mengutip, sehingga mengaburkan fakta bahwa itu ada."
Referensi: