Penulis: Chris Dixon, pendiri a16z crypto; Elizabeth Harkavy, mitra a16z crypto; Terjemahan: Xiaozou dari Jinse Caijing
Sistem kecerdasan buatan modern tidak hanya bergantung pada daya komputasi dan algoritma, tetapi juga tidak terlepas dari umpan balik manusia. Perusahaan menggunakan umpan balik manusia dalam pembelajaran penguatan (RLHF) dan optimasi preferensi langsung (DPO) sebagai teknik optimasi setelah pelatihan untuk meningkatkan model. Teknik-teknik ini dapat mengurangi bias, sehingga model memberikan respons yang lebih berkualitas dan lebih koheren terhadap kata kunci - ini sangat penting untuk mempercepat perkembangan AI. Evaluasi model juga sama pentingnya, tetapi hanya dengan mendefinisikan apa yang dimaksud dengan "lebih baik" kita dapat mencapai optimasi model.
Tantangan muncul dari sini: perusahaan enggan untuk berbagi - mereka menganggap data dan proses pelatihan sebagai rahasia. Ini mengakibatkan evaluasi model AI hanya dapat bergantung pada informasi terbatas dari sistem tertutup, atau pengujian standar statis yang terputus dari aplikasi nyata, yang sangat membatasi ruang perbaikan model. Pengguna juga berada dalam zona buta informasi, tidak jelas bagaimana umpan balik mereka mempengaruhi model, bahkan tidak dapat memastikan apakah umpan balik tersebut diadopsi. Beberapa papan peringkat model dan platform crowdsourcing berusaha meningkatkan transparansi, tetapi biasanya tidak mendukung pengguna untuk menelusuri kontribusi mereka sendiri, dan tidak memberikan imbalan partisipasi yang substansial. Platform yang mengklaim adil dan transparan sering kali bergantung pada integritas daripada standar yang dapat dilaksanakan.
Kami percaya bahwa teknologi kripto dapat membawa transparansi dan kepemilikan di area abu-abu AI ini. Blockchain tidak hanya membantu kontributor mendapatkan imbalan dengan mudah, tetapi juga memberikan jaminan yang dapat diandalkan tentang kualitas dan sumber data umpan balik bagi pengembang AI. Pengguna mendapatkan insentif, pengembang mendapatkan data yang dapat dipercaya, dan semua orang dapat melakukan audit dua arah di pasar terbuka ini. Untuk itu, kami memimpin putaran benih senilai $33 juta untuk produk konsumen Yupp, platform yang memungkinkan setiap orang untuk menjelajahi dan membandingkan model AI terbaru secara gratis.
Yupp menggunakan model crowdsourcing untuk evaluasi model: pengguna memasukkan kata kunci, melihat beberapa respons yang dihasilkan AI secara bersamaan, lalu memilih jawaban terbaik. Pilihan mereka akan menghasilkan data preferensi "data paket" yang ditandatangani secara digital, yang sangat berharga untuk optimasi dan evaluasi setelah pelatihan AI. Pengguna tidak hanya dapat menggunakan model terbaru secara gratis, tetapi juga dapat mendapatkan hadiah berdasarkan umpan balik yang diberikan.
Desain Yupp mengubah penilaian manusia menjadi sumber daya ekonomi yang dapat diperbaharui. Dengan munculnya data interaksi baru, data lama akan "kedaluwarsa", sehingga membentuk roda alami: lebih banyak adopsi menghasilkan penilaian yang lebih segar; penilaian yang lebih segar melahirkan model yang lebih berkualitas; model yang lebih berkualitas menarik lebih banyak penggunaan. Semua peserta—baik pengguna biasa maupun pengembang model AI—dapat bergabung dan melihat aturan transparan yang berlaku untuk semua, memastikan pasar tetap memiliki netralitas yang dapat dipercaya. Tidak ada yang dapat menyembunyikan skor, dan tidak ada yang dapat memanipulasi hadiah atau hasil.
Tim pendiri memiliki pengalaman mendalam di bidang AI dan kripto. Mereka pernah bersama-sama mengembangkan produk pembelajaran mesin untuk konsumen di awal Twitter. Pankaj Gupta sebelumnya menjabat sebagai kepala rekayasa konsumen global di Google Pay dan Coinbase, sementara Gilad Mishne adalah mantan kepala pembelajaran mesin di GoogleX. Tim startup ini mengumpulkan insinyur senior dari Google, Coinbase, dan laboratorium terkemuka.
AI perlu sistem evaluasi yang kuat dan dapat diandalkan yang didasarkan pada masukan manusia dalam skala besar, dan teknologi kriptografi adalah mesin kepercayaan untuk mencapai tujuan ini. Dengan memungkinkan pengguna global berkontribusi pada umpan balik untuk memperbaiki model, Yupp berkomitmen untuk menjadi lapisan evaluasi dasar untuk AI di masa depan. Kami merasa terhormat dapat mendukung Yupp dan berharap dapat membantu mereka membangun siklus umpan balik di blockchain, memastikan bahwa hasil inovasi AI dibagikan oleh semua pembangun.
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
a16z: Mengapa kami berinvestasi di Yupp
Penulis: Chris Dixon, pendiri a16z crypto; Elizabeth Harkavy, mitra a16z crypto; Terjemahan: Xiaozou dari Jinse Caijing
Sistem kecerdasan buatan modern tidak hanya bergantung pada daya komputasi dan algoritma, tetapi juga tidak terlepas dari umpan balik manusia. Perusahaan menggunakan umpan balik manusia dalam pembelajaran penguatan (RLHF) dan optimasi preferensi langsung (DPO) sebagai teknik optimasi setelah pelatihan untuk meningkatkan model. Teknik-teknik ini dapat mengurangi bias, sehingga model memberikan respons yang lebih berkualitas dan lebih koheren terhadap kata kunci - ini sangat penting untuk mempercepat perkembangan AI. Evaluasi model juga sama pentingnya, tetapi hanya dengan mendefinisikan apa yang dimaksud dengan "lebih baik" kita dapat mencapai optimasi model.
Tantangan muncul dari sini: perusahaan enggan untuk berbagi - mereka menganggap data dan proses pelatihan sebagai rahasia. Ini mengakibatkan evaluasi model AI hanya dapat bergantung pada informasi terbatas dari sistem tertutup, atau pengujian standar statis yang terputus dari aplikasi nyata, yang sangat membatasi ruang perbaikan model. Pengguna juga berada dalam zona buta informasi, tidak jelas bagaimana umpan balik mereka mempengaruhi model, bahkan tidak dapat memastikan apakah umpan balik tersebut diadopsi. Beberapa papan peringkat model dan platform crowdsourcing berusaha meningkatkan transparansi, tetapi biasanya tidak mendukung pengguna untuk menelusuri kontribusi mereka sendiri, dan tidak memberikan imbalan partisipasi yang substansial. Platform yang mengklaim adil dan transparan sering kali bergantung pada integritas daripada standar yang dapat dilaksanakan.
Kami percaya bahwa teknologi kripto dapat membawa transparansi dan kepemilikan di area abu-abu AI ini. Blockchain tidak hanya membantu kontributor mendapatkan imbalan dengan mudah, tetapi juga memberikan jaminan yang dapat diandalkan tentang kualitas dan sumber data umpan balik bagi pengembang AI. Pengguna mendapatkan insentif, pengembang mendapatkan data yang dapat dipercaya, dan semua orang dapat melakukan audit dua arah di pasar terbuka ini. Untuk itu, kami memimpin putaran benih senilai $33 juta untuk produk konsumen Yupp, platform yang memungkinkan setiap orang untuk menjelajahi dan membandingkan model AI terbaru secara gratis.
Yupp menggunakan model crowdsourcing untuk evaluasi model: pengguna memasukkan kata kunci, melihat beberapa respons yang dihasilkan AI secara bersamaan, lalu memilih jawaban terbaik. Pilihan mereka akan menghasilkan data preferensi "data paket" yang ditandatangani secara digital, yang sangat berharga untuk optimasi dan evaluasi setelah pelatihan AI. Pengguna tidak hanya dapat menggunakan model terbaru secara gratis, tetapi juga dapat mendapatkan hadiah berdasarkan umpan balik yang diberikan.
Desain Yupp mengubah penilaian manusia menjadi sumber daya ekonomi yang dapat diperbaharui. Dengan munculnya data interaksi baru, data lama akan "kedaluwarsa", sehingga membentuk roda alami: lebih banyak adopsi menghasilkan penilaian yang lebih segar; penilaian yang lebih segar melahirkan model yang lebih berkualitas; model yang lebih berkualitas menarik lebih banyak penggunaan. Semua peserta—baik pengguna biasa maupun pengembang model AI—dapat bergabung dan melihat aturan transparan yang berlaku untuk semua, memastikan pasar tetap memiliki netralitas yang dapat dipercaya. Tidak ada yang dapat menyembunyikan skor, dan tidak ada yang dapat memanipulasi hadiah atau hasil.
Tim pendiri memiliki pengalaman mendalam di bidang AI dan kripto. Mereka pernah bersama-sama mengembangkan produk pembelajaran mesin untuk konsumen di awal Twitter. Pankaj Gupta sebelumnya menjabat sebagai kepala rekayasa konsumen global di Google Pay dan Coinbase, sementara Gilad Mishne adalah mantan kepala pembelajaran mesin di GoogleX. Tim startup ini mengumpulkan insinyur senior dari Google, Coinbase, dan laboratorium terkemuka.
AI perlu sistem evaluasi yang kuat dan dapat diandalkan yang didasarkan pada masukan manusia dalam skala besar, dan teknologi kriptografi adalah mesin kepercayaan untuk mencapai tujuan ini. Dengan memungkinkan pengguna global berkontribusi pada umpan balik untuk memperbaiki model, Yupp berkomitmen untuk menjadi lapisan evaluasi dasar untuk AI di masa depan. Kami merasa terhormat dapat mendukung Yupp dan berharap dapat membantu mereka membangun siklus umpan balik di blockchain, memastikan bahwa hasil inovasi AI dibagikan oleh semua pembangun.