Kata-kata Mark Wen Xin, 4.000 yuan sebulan

Sumber: Pinwan

Penulis: Cuka

"Kecerdasan sama banyaknya dengan kecerdasan buatan".

Lelucon tersebut tersembunyi di balik kecerdasan buatan, dan masih berlaku hingga saat ini. Ding Yang, yang baru saja lulus dari universitas, untuk sementara masa depannya ada di paruh kedua kalimat.

Ding Yang mempelajari teknik kimia ringan ketika dia masih di universitas. Setelah lulus, sebagian besar mahasiswa di departemen tersebut pergi ke pabrik kertas dalam tiga shift. Dia tidak ingin pergi ke pabrik. Setelah lulus pada bulan Juni tahun ini, Ding Yang kembali ke Haikou. Dia mengambil bank soal pelatihan versi elektronik pada awal Agustus. Dua hari kemudian, dia menjadi pelabel data "pemula" di Wenxin Yiyan.

Gedung Pedagang China di Distrik Xiuying, Kota Haikou, biasa disebut "basis" oleh pelabel data Wen Xinyi. Lebih dari dua ratus orang masuk dan keluar dari pangkalan ini, tersebar di tiga lantai gedung perkantoran ini. Mereka harus menandatangani perjanjian kerahasiaan sebelum memasuki pekerjaan, dan harus memindai wajah mereka ketika memasuki pintu. Setiap orang Punya komputer, banyak komputer yang disewa dan dikirim oleh bos dari Shanxi, karena Tidak banyak kenalan yang menyewa peralatan tersebut secara lokal.

"Tidak perlu mengeluarkan biaya 500 yuan untuk membeli komputer ini. Saya pernah mengajak host untuk mencari di Xianyu—harganya 60 yuan. Saya dapat memasang yang jauh lebih baik seharga 500 yuan."

Ding Yang melamar ilmu komputer selama ujian masuk perguruan tinggi, dan kemudian dipindahkan ke teknik kimia ringan, tetapi dia tidak tertarik dengan hal ini. Sebaliknya, dia membaca banyak teknik komputer dan perangkat lunak di perguruan tinggi, yang membuatnya segera mendengarnya. pada akhir tahun lalu Munculnya ChatGPT.

Pada bulan Desember, dia mendaftarkan akun ChatGPT, dan kemudian “kemampuannya di luar prediksi saya”, katanya.

Sumber: Pinwan

Ketika saya bertemu Ding Yang di tempat kerja di pangkalan, pertanyaan di layar komputer di depannya adalah: "Apa standar orang sukses?"

Ini mungkin pertanyaan nyata dari pengguna Wenxin Yiyan, atau mungkin pertanyaan tes yang dibuat begitu saja, tetapi ditempatkan di depan layar dan perlu ditandai.

Memberi label tidaklah mudah.

Untuk satu pertanyaan seperti itu, akan ada lima jawaban berbeda yang diberikan oleh Wen Xin Yiyan. Pelabel data harus membacanya, lalu mencari tahu semua kekurangan di setiap jawaban.

Misalnya ada kesalahan ketik pada jawaban atau penggunaan kata logis yang salah seperti “karena” dan “jadi”, namun sebagian besar jawaban tidak relevan dengan pertanyaan, atau ada yang disebut “ilusi” yang tidak ada faktualnya. dasar dalam paragraf tertentu.

Kelima jawaban tersebut akan diberi skor sesuai dengan kualitas jawaban, dengan skor penuh 5 poin, total lima level, dan minimal 1 poin. Untuk jawaban dengan 3 poin ke bawah, Ding Yang perlu membagi setiap kesalahan menjadi jenis kesalahan berbeda yang diberikan oleh sistem pelabelan.

Proses koreksi kesalahan yang kompleks ini bertujuan untuk melatih dan menghasilkan model penghargaan yang sesuai RM (model penghargaan, juga disebut model preferensi), dan tindakan penilaian dan pengurutan akan semakin menyelaraskan model dengan preferensi manusia.

Hal ini juga menjadi kunci kesuksesan ChatGPT. Makalah OpenAI menjelaskan proses penyelarasan kecerdasan buatan dengan ide-ide manusia selama proses penyesuaian instruksi.

Sebelum pelabel data bekerja, dibutuhkan lebih banyak personel profesional untuk mengubah korpus yang berbeda menjadi pasangan pertanyaan-jawaban tertentu, dan kemudian memasukkannya ke model besar seperti contoh pertanyaan. Setelah yang terakhir dioptimalkan setelah sejumlah besar tanya jawab pelatihan data, itu dimulai Jawab pertanyaan.

Pada tahap ini, pelabel data mengevaluasi kualitas jawaban yang dihasilkan oleh model besar dari perspektif keamanan, akurasi, dan relevansi. Data evaluasi ini selanjutnya melatih model penghargaan. Pada akhirnya, model penghargaan ini akan menggantikan pekerjaan pelabelan manual.

Di balik valuasi OpenAI lebih dari US$30 miliar, terdapat sejumlah besar pekerja pelabelan data di Kenya yang upah per jamnya kurang dari US$2, jika tidak, maka Ding Yang tidak akan berada di depan Ding Yang pada bulan Desember tahun lalu.

Tetapi Ding Yang tidak mengetahui definisi RM atau SFT, Dia mengatakan bahwa tidak ada konten teoretis dalam pelatihan sebelum memulai, dan beberapa orang di sini bahkan tidak tahu untuk apa Wen Xinyiyan dia bekerja. Tapi itu tidak masalah, yang penting adalah menyelesaikannya.

Gaji pokok pekerjaan ini, yaitu pukul sembilan sampai enam pagi dan enam hari libur, adalah 1.800 yuan. Setelah satu bulan, jika rata-rata dapat menandai 40 soal per hari, Anda akan mendapatkan gaji pokok. Gaji pokok dihitung berdasarkan tingkat penyelesaian, dan komisi juga harus memperhitungkan tingkat yang benar. Para "veteran" yang sudah lama berada di sini memiliki beban kerja yang stabil yaitu 7 atau 80 hari, dan masalah yang dihadapi lebih sulit. Rata-rata, Anda bisa mendapat 4.000 yuan sebulan, jika Anda bekerja lebih keras, seperti menandai sekitar 100 pertanyaan sehari, Anda bisa mendapat 7.000 yuan sebulan.

Bagi lulusan baru seperti Ding Yang, 4.000 yuan dianggap sebagai pekerjaan dengan awal yang baik. Gaji bulanan rata-rata orang Haikou hanya sedikit di atas 3.000 yuan, dan bahkan 6 dari 10 orang tidak bisa mendapatkan 3.000 yuan sebulan. Bubuk Hou'an lokal yang terkenal berharga 11 yuan, dan pemberi tag ChatGPT dapat membeli semangkuk selama satu jam. Sebagai perbandingan, bedak tabur itu mahal. Menurutnya, masyarakat Haikou tidak mempunyai banyak uang, namun rela mengeluarkan uang untuk membeli makanan.

Sumber: Pinwan

"Saham adalah yang paling sulit, atau mobil," kata Ding Yang. Mungkin diperlukan waktu 20 menit untuk menemukan masalah di area ini.

"Misalnya, seseorang akan bertanya apakah akan membeli BMW Seri 3 atau Mercedes-Benz C Series." Saat ini, model besar akan mencantumkan lebih dari 80 parameter tentang kedua mobil tersebut untuk dibandingkan oleh pengguna, dan dia harus melakukannya ikuti di belakangnya satu per satu. Verifikasi keaslian setiap parameter.

Setelah setengah bulan bekerja, ratusan soal sudah ditandai, namun menurutnya, mendapat skor 3 sudah bagus, dan jarang mendapat skor 4.

Ia teringat sebuah pertanyaan yang mendapat 4 poin, judulnya "Mengapa Lin Daiyu melawan Bone Demon?"

Wen Xin tidak mengikuti tiang dengan sepatah kata pun, dan menyadari bahwa bukanlah Lin Daiyu yang mengalahkan Bone Demon, lalu memperkenalkan latar belakang Lin Daiyu dan Bone Demon. Dari setiap dimensi kualitas jawaban, ini hampir sempurna.

Saya mengajukan pertanyaan ini kepada Claude 2, yang mengatakan: "Bone Demon berubah menjadi Wang Xifeng dan mempermalukan Lin Daiyu berkali-kali, dan Lin Daiyu marah atas pembunuhan Bone Demon."—Halusinasinya memang cukup merepotkan.

Sumber: Pinwan

Pada awal tahun 2020, “pelatih kecerdasan buatan” resmi menjadi sebuah profesi dan masuk dalam direktori klasifikasi pekerjaan nasional.Dua tahun kemudian, gelombang model besar tiba-tiba membuka lubang yang lebih besar di direktori ini.

Menyaksikan kecerdasan buatan menghilangkan pekerjaan-pekerjaan lama dari manusia dan kemudian berharap hal itu akan menciptakan pekerjaan-pekerjaan baru. Sama seperti gerbong yang digantikan oleh mobil, industri baru akan memberikan metafora umum kepada pengemudi gerbong tentang dunia kerja baru untuk menjadi kaya. Banyak investor yang mencari target dengan uang membeli pernyataan ini, dan beberapa orang tidak 'jangan percaya. Misalnya, mereka telah meletakkan dasar untuk pembelajaran mendalam. Sekarang orang Inggris Geoffrey Hinton khawatir.

Namun ciptaan yang paling langsung saat ini adalah pelabel data model besar seperti Ding Yang.

Sebelum tahun 2022, batasan kecerdasan buatan masih ditentukan oleh mobil self-driving yang tidak dapat mengendalikan diri. Ada metafora dingin bagi pelabel data:

“Jika Anda menganggap AI sebagai hewan, tugas pelabel data kira-kira setara dengan menyiapkan pakan.”

Pekerjaan ini murah, berulang-ulang - bahkan tidak cukup dekat untuk menjadi pemberi makan.

Sebagai pelabel data tradisional, pekerjaan sehari-harinya hanyalah mengamati dengan cermat setiap gambar yang diterima, melingkari garis luar mobil atau anjing, memberi label, menyeret dan melepaskannya ke dalam folder berbeda; atau menggunakan dot matriks Alat ini menandai rintangan di setiap bingkai dari video mengemudi, meninggalkan "area yang dapat dilalui" secara lengkap.

Tindakan tersebut dapat dilakukan 2.000 kali sehari oleh pelabel data.

Hanya data berlabel yang dapat dipelajari dengan kecerdasan buatan. Salah satu pemasok data berkendara otonom pernah menyatakan bahwa tingkat otomatisasi pelabelan data masih hanya 5% sejak dikembangkannya pelabelan data, dan 95% pekerjaan pelabelan lainnya masih dilakukan secara manual.

Setelah hadirnya model besar, jenis pelabelan data itu sendiri mulai berubah. Tidak hanya sekadar menggambar kotak, menggambar titik, atau menggambar garis di layar, tugas utama pelabel data model besar adalah mengevaluasi, menyortir, dan menilai konten yang dihasilkan. Jika melibatkan beberapa putaran dialog atau pembuatan konten multi-modal, kesulitannya Peningkatan tajam lainnya.

Jika dikatakan model anotasi pada era CV dan NLP tradisional cenderung bertindak sesuai dengan kaidah objektif, kaidah anotasi model besar lebih subjektif, dan juga menguji kualitas personel anotasi. Oleh karena itu, tim pelabelan model besar Baidu di Haikou dan Shanxi semuanya adalah mahasiswa tingkat sarjana atau lebih tinggi.

Pelabelan biasa di pangkalan Haikou memiliki peluang untuk dipromosikan menjadi inspektur kualitas, dan kemudian mereka dapat menjadi pelatih, kemudian menjadi supervisor, dan akhirnya menjadi manajer proyek. Ini adalah saluran yang telah didirikan dalam beberapa bulan. Seorang agen yang membuat anotasi data untuk Wenxin Yiyan di Haikou mengatakan bahwa setelah masa percobaan, seseorang dapat dipromosikan jika ada posisi internal, dan tidak ada batasan waktunya.

Ini adalah industri baru yang berkembang pesat. "Setiap tautan adalah pendatang baru," kata Ding Yang.

Setelah pemeriksa mutu menyelesaikan peninjauan pertama, ia akan menyerahkan bank soal ke peninjauan kedua. Tinjauan kedua dilakukan secara internal oleh Baidu, dan data pelatihan berada di tangan tim pelabelan Ding Yang.

Ding Yang, yang bekerja untuk Wen Xinyiyan, dan lebih dari 200 orang di seluruh pangkalan bukanlah karyawan Baidu.

Para pelabel di pangkalan Haikou berasal dari empat agensi berbeda. Kontrak kerja mereka ditandatangani dengan perusahaan pelabelan data pihak ketiga ini. Ini adalah praktik dari posisi ini. Sejarah panjang kecerdasan buatan Baidu mulai dari pencarian, mengemudi otonom hingga model skala besar berada di belakang lebih dari 600 agen di seluruh negeri dan 200.000 pelabel data di lebih dari 300 kota.

Baidu memperkirakan jumlah tim model skala besar penuh waktu hampir mencapai 10.000 orang.Rencana ini akan dipenuhi sebagai "basis" baru di lebih dari sepuluh kota di seluruh negeri di masa depan.

Hu Chi, manajer produk Baidu Intelligent Cloud Data Annotation Base, percaya bahwa anotator data model besar akan menjadi karier jangka panjang. Dengan pendalaman kemampuan model besar dalam berbagai skenario, akan muncul permasalahan baru yang berarti juga akan muncul persyaratan pelabelan baru.Manusia akan selalu membutuhkan penyelarasan yang cermat.

Ding Yang berkata dia akan pergi dari sini.

Ada lebih dari 20 pelabel data pemula yang datang bersamaan dengannya, dan sebagian besar dari mereka segera keluar—sebagian besar keluar secara sukarela. Isi pekerjaan yang membosankan, cara menghasilkan uang dengan upah borongan, dan konsumsi masyarakat, tidak sulit untuk membayangkan bahwa ini akan menjadi posisi yang sangat fluktuatif. Dan tidak peduli seberapa banyak orang bertepuk tangan, ketidakamanan akan digantikan oleh mesin tetap ada, dan semua orang senang melihatnya.

Ding Yang melihat ini sebagai peluang untuk tumbuh bersama industri ini. “Cobalah dan lihat apakah Anda bisa menjadi supervisor,” ujarnya, sebelum menemukan posisi yang lebih dekat dengan gelombang AI.

(Ding Yang adalah nama samaran dalam teks)

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)