Berapa banyak perusahaan pelabelan AI yang akan dibunuh oleh “langkah besar” Google?

Sumber asli: AI New Intelligence

Sumber gambar: Dihasilkan oleh AI Tanpa Batas‌

Jika AI generatif saat ini seperti seorang anak yang tumbuh dengan pesat, maka data yang berkelanjutan adalah makanan yang memberinya makan untuk tumbuh.

Anotasi data adalah proses pembuatan “makanan” ini.

Namun, proses ini sangat banyak dan melelahkan.

"Annotator" yang melakukan anotasi tidak hanya perlu berulang kali mengidentifikasi berbagai objek, warna, bentuk, dll. dalam gambar, namun terkadang bahkan perlu membersihkan dan memproses data terlebih dahulu.

Dengan kemajuan teknologi AI yang berkelanjutan, keterbatasan anotasi data manual menjadi semakin jelas. Anotasi data manual tidak hanya memakan waktu dan tenaga, namun kualitasnya terkadang sulit dijamin.

Untuk mengatasi masalah ini, Google baru-baru ini mengusulkan metode yang menggunakan model besar untuk menggantikan manusia dalam anotasi preferensi, yang disebut AI Feedback Reinforcement Learning (RLAIF).

Hasil penelitian menunjukkan bahwa RLAIF dapat menghasilkan peningkatan yang sebanding dengan pembelajaran penguatan dengan umpan balik manusia (RLHF) tanpa bergantung pada anotasi manusia, dengan tingkat kemenangan keduanya sebesar 50%. Sementara itu, baik RLAIF maupun RLHF memiliki kinerja yang lebih baik daripada strategi dasar penyempurnaan yang diawasi (SFT).

Hasil ini menunjukkan bahwa RLAIF tidak perlu bergantung pada anotasi manual dan merupakan alternatif yang layak untuk RLHF. **

Jadi, jika teknologi ini benar-benar dipromosikan dan dipopulerkan di masa depan, akankah banyak perusahaan yang masih mengandalkan "kotak penarik" manual untuk anotasi data akan menemui jalan buntu mulai sekarang?

1 Status anotasi data saat ini

Jika kita ingin meringkas status industri anotasi dalam negeri saat ini, adalah: **Beban kerjanya besar, tetapi efisiensinya tidak terlalu tinggi, dan keadaan tanpa pamrih. **

Perusahaan pelabelan dikenal sebagai pabrik data di bidang AI dan biasanya terkonsentrasi di wilayah dengan sumber daya manusia yang kaya seperti Asia Tenggara, Afrika, atau Henan, Shanxi, dan Shandong di China.

Untuk mengendalikan biaya, para bos perusahaan pelabelan akan menyewa tempat di daerah tersebut, menyiapkan komputer, dan jika ada pesanan, mereka akan merekrut orang-orang terdekat untuk bekerja paruh waktu. Jika tidak ada pesanan, mereka akan dibubarkan. dan beristirahat.

Sederhananya, jenis pekerjaan ini mirip dengan pekerja dekorasi sementara di pinggir jalan.

Di stasiun kerja, sistem akan secara acak memberikan sekumpulan data kepada "annotator", yang biasanya mencakup beberapa pertanyaan dan beberapa jawaban.

Setelah itu, "annotator" perlu menandai terlebih dahulu jenis pertanyaannya, lalu menilai dan memberi peringkat pada jawabannya.

Sebelumnya, ketika orang membicarakan kesenjangan antara model besar dalam negeri dan model besar yang canggih seperti GPT-4, mereka merangkum alasan rendahnya kualitas data dalam negeri.

Namun mengapa kualitas datanya tidak tinggi? Sebagian alasannya terletak pada "jalur perakitan" anotasi data.

Saat ini, terdapat dua jenis sumber data untuk model besar Tiongkok: satu adalah kumpulan data sumber terbuka; yang lainnya adalah data Internet Tiongkok yang dirayapi melalui crawler.

**Salah satu alasan utama mengapa kinerja model besar Tiongkok tidak cukup baik adalah kualitas data Internet. **Misalnya, para profesional umumnya tidak menggunakan Baidu saat mencari informasi.

Oleh karena itu, ketika menghadapi beberapa masalah data yang lebih profesional dan vertikal, seperti perawatan medis, keuangan, dll, diperlukan kerjasama dengan tim yang profesional.

Namun saat ini, masalah muncul lagi: bagi tim profesional, tidak hanya periode pengembalian data yang lama, namun penggerak pertama (first mover) kemungkinan besar akan mengalami kerugian.

Misalnya, jika tim anotasi tertentu menghabiskan banyak uang dan waktu untuk menghasilkan banyak data, tim lain mungkin hanya mengemas dan membelinya dengan sedikit uang.

Dihadapkan pada "dilema pengendara bebas", model domestik berukuran besar mengalami kesulitan yang aneh karena memiliki banyak data tetapi kualitasnya rendah.

Oleh karena itu, bagaimana perusahaan AI asing terkemuka, seperti OpenAI, mengatasi masalah ini?

Faktanya, dalam hal anotasi data, OpenAI tidak berhenti menggunakan tenaga kerja yang murah dan intensif untuk mengurangi biaya.

Misalnya, sebelumnya terungkap bahwa mereka telah mempekerjakan sejumlah besar pekerja di Kenya untuk memberi label informasi beracun dengan harga US$2/jam.

**Tetapi perbedaan utamanya terletak pada cara memecahkan masalah kualitas data dan efisiensi anotasi. **

Secara khusus, perbedaan terbesar antara OpenAI dan perusahaan domestik dalam hal ini adalah bagaimana mengurangi dampak "subjektivitas" dan "ketidakstabilan" anotasi manual.

2 Pendekatan OpenAI

Untuk mengurangi "subjektivitas" dan "ketidakstabilan" anotator manusia, OpenAI secara kasar mengadopsi dua strategi utama:

1. Kombinasi umpan balik buatan dan pembelajaran penguatan;

Mari kita bahas poin pertama terlebih dahulu. Dalam hal metode pelabelan, perbedaan terbesar antara umpan balik manual OpenAI dan umpan balik domestik adalah bahwa metode ini terutama mengurutkan atau menilai perilaku sistem cerdas, bukan memodifikasi atau memberi label pada keluarannya.

Perilaku sistem cerdas mengacu pada sistem cerdas yang membuat serangkaian tindakan atau keputusan berdasarkan tujuan dan strateginya sendiri dalam lingkungan yang kompleks.

Misalnya bermain game, mengendalikan robot, berbicara dengan seseorang, dll.

Keluaran dari sistem cerdas mengacu pada menghasilkan hasil atau jawaban berdasarkan masukan data dalam tugas sederhana, seperti menulis artikel atau menggambar lukisan.

Secara umum, perilaku sistem cerdas lebih sulit dinilai berdasarkan "benar" atau "salah" dibandingkan keluarannya, dan perlu dievaluasi berdasarkan preferensi atau kepuasan.

Sistem evaluasi berdasarkan "preferensi" atau "kepuasan" semacam ini tidak memerlukan modifikasi atau anotasi konten tertentu, sehingga mengurangi dampak subjektivitas manusia, tingkat pengetahuan, dan faktor lain terhadap kualitas dan keakuratan anotasi data.

Memang benar bahwa perusahaan dalam negeri juga akan menggunakan sistem yang mirip dengan "penyortiran" dan "penilaian" saat memberi label, namun karena kurangnya "model penghargaan" seperti OpenAI sebagai fungsi penghargaan untuk mengoptimalkan strategi sistem cerdas, seperti " penyortiran" dan "skor" "Skor" pada dasarnya masih merupakan metode memodifikasi atau memberi anotasi pada keluaran.

2. Saluran sumber data yang terdiversifikasi dan berskala besar;

Sumber utama anotasi data di Tiongkok adalah perusahaan anotasi pihak ketiga atau tim perusahaan teknologi yang dibentuk sendiri. Tim ini sebagian besar terdiri dari mahasiswa sarjana dan kurang profesionalisme serta pengalaman untuk memberikan umpan balik yang berkualitas tinggi dan efisien.

Sebaliknya, masukan manual OpenAI berasal dari berbagai saluran dan tim.

OpenAI tidak hanya menggunakan kumpulan data sumber terbuka dan perayap Internet untuk memperoleh data, tetapi juga bekerja sama dengan beberapa perusahaan dan institusi data, seperti Scale AI, Appen, Lionbridge AI, dll., untuk memperoleh data yang lebih beragam dan berkualitas tinggi.

Dibandingkan dengan perusahaan-perusahaan di dalam negeri, metode pelabelan perusahaan dan lembaga data ini jauh lebih "otomatis" dan "cerdas".

Misalnya, Scale AI menggunakan teknik yang disebut Snorkel, yaitu metode pelabelan data berdasarkan pembelajaran dengan pengawasan lemah yang dapat menghasilkan label berkualitas tinggi dari berbagai sumber data yang tidak tepat.

Pada saat yang sama, Snorkel juga dapat menggunakan berbagai sinyal seperti aturan, model, dan basis pengetahuan untuk menambahkan label ke data tanpa memberi label langsung pada setiap titik data secara manual. Hal ini dapat sangat mengurangi biaya dan waktu anotasi manual.

Karena biaya dan siklus anotasi data diperpendek, perusahaan data dengan keunggulan kompetitif ini dapat memilih subdivisi bernilai tinggi, tingkat kesulitan tinggi, dan ambang batas tinggi, seperti mengemudi otonom, model bahasa besar, data sintetis, dll. Dapat terus meningkatkan daya saing intinya dan keunggulan yang berbeda.

Dengan cara ini, dilema penumpang bebas yang menyatakan "penggerak pertama akan menderita" juga telah dihilangkan dengan adanya hambatan teknologi dan industri yang kuat.

3 Standardisasi VS bengkel kecil

Terlihat bahwa **teknologi pelabelan otomatis AI hanya akan menghilangkan perusahaan pelabelan yang masih menggunakan pelabelan manual murni. **

Meskipun anotasi data terdengar seperti industri yang "padat karya", setelah Anda mempelajari detailnya, Anda akan menyadari bahwa mendapatkan data berkualitas tinggi bukanlah tugas yang mudah.

Diwakili oleh Scale AI, sebuah unicorn anotasi data luar negeri, Scale AI tidak hanya menggunakan sumber daya manusia murah dari Afrika dan tempat lain, tetapi juga merekrut puluhan PhD untuk menangani data profesional di berbagai industri.

Kualitas anotasi data adalah nilai terbesar yang diberikan Scale AI kepada perusahaan model besar seperti OpenAI.

Untuk memastikan kualitas data semaksimal mungkin, selain penggunaan anotasi berbantuan AI yang disebutkan di atas, inovasi besar lainnya dari **Scale AI adalah platform data terpadu. **

Platform ini mencakup Audit Skala, Analisis Skala, Kualitas ScaleData, dll. Melalui platform tersebut, pelanggan dapat memantau dan menganalisis berbagai indikator dalam proses anotasi, memverifikasi dan mengoptimalkan data anotasi, serta mengevaluasi keakuratan, konsistensi, dan kelengkapan anotasi.

Dapat dikatakan bahwa alat dan proses yang terstandarisasi dan terpadu telah menjadi faktor kunci yang membedakan antara "pabrik jalur perakitan" dan "bengkel buatan tangan" dalam perusahaan pelabelan.

Dalam hal ini, sebagian besar perusahaan anotasi domestik masih menggunakan "tinjauan manual" untuk meninjau kualitas anotasi data.Hanya beberapa raksasa seperti Baidu yang memperkenalkan alat manajemen dan evaluasi yang lebih canggih, seperti platform layanan data cerdas EasyData.

Jika tidak ada alat khusus untuk memantau dan menganalisis hasil anotasi dan indikator dalam aspek tinjauan data utama, maka pengendalian kualitas data akan tetap direduksi ke tingkat seperti lokakarya dengan mengandalkan visi seorang "master".

Oleh karena itu, semakin banyak perusahaan domestik, seperti Baidu dan My Neighbor Totoro Data, mulai menggunakan teknologi pembelajaran mesin dan kecerdasan buatan untuk meningkatkan efisiensi dan kualitas anotasi data serta menerapkan model kolaborasi manusia-mesin.

Terlihat bahwa munculnya pelabelan AI bukanlah akhir dari perusahaan pelabelan dalam negeri, namun akhir dari metode pelabelan yang tidak efisien, murah, dan padat karya serta tidak memiliki konten teknis.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)