Tanpa pengumuman, OpenAI diam-diam menutup alat deteksi teks AI, dan halaman langsung 404.
Tidak ada tanggapan resmi untuk ini, dan butuh beberapa hari sebelum seseorang menemukan deskripsi singkat yang tersembunyi di halaman blog alat yang dirilis setengah tahun lalu.
...Detektor AI tidak lagi tersedia karena akurasi rendah... Kami sedang mengerjakan teknik deteksi teks yang lebih efisien dan berkomitmen untuk mengembangkan teknik deteksi audio dan visual.
Banyak netizen yang tidak puas dengan perilaku CloseAIOpenAI yang mematikan sebuah produk tanpa mengeluarkan pengumuman.
Namun banyak orang yang setuju dengan mematikan pendeteksi AI itu sendiri, terutama kelompok mahasiswa.
Terlalu banyak guru yang percaya bahwa hal ini efektif, dan sejumlah besar siswa yang bersalah berbuat curang dengan AI, yang telah menjadi perburuan penyihir.
Tingkat akurasi hampir sama dengan tebakan
Seberapa rendah keakuratan alat pengujian resmi ini?
Data yang diberikan oleh OpenAI sendiri hanya dapat mengidentifikasi dengan benar 26% teks buatan AI, dan kesalahan 9% teks tulisan manusia.
Saat pertama kali dirilis pada bulan Januari, netizen menyimpulkannya sebagai "hampir seperti menebak".
Selain itu, beberapa orang telah melakukan eksperimen dan menemukan bahwa berbagai alat pendeteksi di pasaran akan menilai bahwa teks sejarah seperti Alkitab dan Konstitusi AS dapat ditulis oleh AI. Tokoh sejarah yang tidak dapat menulis konten ini adalah penjelajah waktu, bukan?
Namun masih banyak guru yang mencoba mengecek pekerjaan siswa dengan berbagai metode deteksi.
Dalam salah satu kasus paling terkenal, seorang profesor di Texas A&M University hampir menilai setengah dari kelasnya terlambat.
Tren terbaru adalah guru meminta siswa untuk menulis tugas di dokumen online dan memeriksa catatan edit, tetapi siswa yang pintar juga dapat menemukan cara untuk menyiasatinya.
Akhirnya, di bidang pendidikan, beberapa orang telah menyarankan agar tugas besar/makalah kursus dapat menjadi sejarah, dan ujian tertutup atau ujian lisan akan menjadi arus utama.
Metode deteksi saat ini dapat diakali
Netizens menunjukkan bahwa bertentangan dengan OpenAI untuk mengembangkan alat generasi dan deteksi pada saat yang bersamaan.
Jika satu pihak baik-baik saja, pihak lain tidak baik-baik saja, dan mungkin ada konflik kepentingan.
Namun, metode deteksi yang dikembangkan oleh pihak ketiga tidak dapat diandalkan.
Yang paling awal dikenal sebagai "ChatGPT nemesis" adalah GPTZero yang dikembangkan oleh sarjana Princeton Edward Tian, yang menggunakan kerumitan dan perubahan panjang dan panjang kalimat untuk mengukur apakah suatu artikel dihasilkan oleh AI.
Pada saat itu, proyek GPTZero dibuat khusus untuk pendidik, dan guru dapat memasukkan pekerjaan rumah seluruh kelas ke dalamnya untuk diuji.
Namun pada Juli lalu, penulis mengaku sudah menyerah dengan arah pendeteksian kecurangan siswa.Rencananya GPTZero versi selanjutnya tidak lagi mendeteksi apakah teks tersebut dihasilkan oleh AI, melainkan menonjolkan bagian yang paling mirip manusia.
Metode deteksi lain yang mendapat banyak perhatian adalah metode watermarking yang dikembangkan oleh University of Maryland, yang membutuhkan model besar untuk menyembunyikan tanda saat membuat teks dan menggunakan metode statistik untuk mengidentifikasinya.
Namun cara mengelaknya juga sangat sederhana, misalnya seseorang telah mengembangkan alat pengganti sinonim sederhana yang dapat merusak fitur statistik.
Beberapa orang bahkan mulai bertanya-tanya mengapa orang harus membedakan ini.
Sama seperti apakah angka dihitung oleh manusia atau diselesaikan oleh komputer, tidak ada yang peduli sejak lama.
Apakah tidak ada yang peduli apakah naskah pembicara ditulis sendiri atau oleh sekretaris?
Penelitian perilaku manusia, menggunakan AI sebagai subjek
Ketidakmampuan untuk membedakan antara AI dan konten manusia tampaknya tidak semuanya buruk.
Sudah ada eksperimen psikologis yang menggunakan AI alih-alih subjek manusia untuk mempercepat penelitian.
Sebuah artikel di sub-jurnal Cell menunjukkan bahwa dalam skenario eksperimental yang dirancang dengan baik, respons ChatGPT berkorelasi dengan respons sekitar 95% peserta manusia.
Dan subjek mesin tidak lelah, memungkinkan ilmuwan mengumpulkan data dan menguji teori tentang perilaku manusia dengan kecepatan yang belum pernah terjadi sebelumnya.
Dalam sebuah opini baru-baru ini di jurnal utama Science, Igor Grossman, seorang profesor psikologi di University of Waterloo, percaya:
"AI bisa menjadi pengubah permainan untuk penelitian ilmu sosial, di mana manajemen bias yang hati-hati dan kesetiaan data adalah kuncinya."
### Tautan referensi
[1]
[2]
[3]
[4]
[5]
[6]
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
ChatGPT menghapus alat deteksi resmi, mengakui bahwa teks AI tidak dapat diidentifikasi
Sumber: "Qubit" (ID: QbitAI), penulis: Mengchen
Tanpa pengumuman, OpenAI diam-diam menutup alat deteksi teks AI, dan halaman langsung 404.
Terlalu banyak guru yang percaya bahwa hal ini efektif, dan sejumlah besar siswa yang bersalah berbuat curang dengan AI, yang telah menjadi perburuan penyihir.
Tingkat akurasi hampir sama dengan tebakan
Seberapa rendah keakuratan alat pengujian resmi ini?
Data yang diberikan oleh OpenAI sendiri hanya dapat mengidentifikasi dengan benar 26% teks buatan AI, dan kesalahan 9% teks tulisan manusia.
Selain itu, beberapa orang telah melakukan eksperimen dan menemukan bahwa berbagai alat pendeteksi di pasaran akan menilai bahwa teks sejarah seperti Alkitab dan Konstitusi AS dapat ditulis oleh AI. Tokoh sejarah yang tidak dapat menulis konten ini adalah penjelajah waktu, bukan?
Namun masih banyak guru yang mencoba mengecek pekerjaan siswa dengan berbagai metode deteksi.
Dalam salah satu kasus paling terkenal, seorang profesor di Texas A&M University hampir menilai setengah dari kelasnya terlambat.
Metode deteksi saat ini dapat diakali
Netizens menunjukkan bahwa bertentangan dengan OpenAI untuk mengembangkan alat generasi dan deteksi pada saat yang bersamaan.
Jika satu pihak baik-baik saja, pihak lain tidak baik-baik saja, dan mungkin ada konflik kepentingan.
Yang paling awal dikenal sebagai "ChatGPT nemesis" adalah GPTZero yang dikembangkan oleh sarjana Princeton Edward Tian, yang menggunakan kerumitan dan perubahan panjang dan panjang kalimat untuk mengukur apakah suatu artikel dihasilkan oleh AI.
Pada saat itu, proyek GPTZero dibuat khusus untuk pendidik, dan guru dapat memasukkan pekerjaan rumah seluruh kelas ke dalamnya untuk diuji.
Namun pada Juli lalu, penulis mengaku sudah menyerah dengan arah pendeteksian kecurangan siswa.Rencananya GPTZero versi selanjutnya tidak lagi mendeteksi apakah teks tersebut dihasilkan oleh AI, melainkan menonjolkan bagian yang paling mirip manusia.
Sama seperti apakah angka dihitung oleh manusia atau diselesaikan oleh komputer, tidak ada yang peduli sejak lama.
Apakah tidak ada yang peduli apakah naskah pembicara ditulis sendiri atau oleh sekretaris?
Penelitian perilaku manusia, menggunakan AI sebagai subjek
Ketidakmampuan untuk membedakan antara AI dan konten manusia tampaknya tidak semuanya buruk.
Sudah ada eksperimen psikologis yang menggunakan AI alih-alih subjek manusia untuk mempercepat penelitian.
Sebuah artikel di sub-jurnal Cell menunjukkan bahwa dalam skenario eksperimental yang dirancang dengan baik, respons ChatGPT berkorelasi dengan respons sekitar 95% peserta manusia.
Dan subjek mesin tidak lelah, memungkinkan ilmuwan mengumpulkan data dan menguji teori tentang perilaku manusia dengan kecepatan yang belum pernah terjadi sebelumnya.
"AI bisa menjadi pengubah permainan untuk penelitian ilmu sosial, di mana manajemen bias yang hati-hati dan kesetiaan data adalah kuncinya."
[1]
[2]
[3]
[4]
[5]
[6]