Mark Wen Xin'in sözleri, ayda 4.000 yuan

2023-08-29 02:16:25

Kaynak: Pinwan

Yazar: Sirke

"Yapay zekanın olduğu kadar zeka".

Şakalar yapay zekanın arkasına gizlenmiş durumda ve şu ana kadar geçerliliğini koruyor. Üniversiteden yeni mezun olan Ding Yang'ın geleceği geçici olarak cümlenin ikinci yarısındadır.

Ding Yang üniversitedeyken hafif kimya mühendisliği okudu.Mezun olduktan sonra bölümdeki öğrencilerin çoğu üç vardiya halinde kağıt fabrikalarına gitti.O fabrikaya gitmek istemedi. Ding Yang, bu yılın Haziran ayında mezun olduktan sonra Haikou'ya döndü. Ağustos başında eğitim soru bankasının elektronik versiyonunu aldı. İki gün sonra Wenxin Yiyan'ın "acemi" veri etiketleyicisi oldu.

Haikou Şehri, Xiuying Bölgesindeki Çin Tüccarlar Binası, Wen Xinyi'nin veri etiketleyicileri tarafından "üs" olarak adlandırılıyordu. Bu ofis binasının üç katına dağılmış iki yüzden fazla kişi bu üsse girip çıkıyordu, işe girmeden önce bir gizlilik sözleşmesi imzalamaları ve kapıdan girerken yüzlerini taramaları gerekiyordu. bir bilgisayarı vardı Birçok bilgisayar Shanxi'deki patron tarafından kiralanıp nakledildi çünkü Bu ekipmanı yerel olarak kiralayan çok fazla tanıdık yok.

"Bu bilgisayarı satın almanın maliyeti 500 yuan değil. Bir keresinde Xianyu'da arama yapmak için sunucuyu götürdüm; 60 yuan değerindeydi. 500 yuan'a çok daha iyi bir bilgisayar kurabilirim."

Ding Yang, üniversiteye giriş sınavı sırasında bilgisayar bilimi için başvurdu ve daha sonra hafif kimya mühendisliğine geçti, ancak bununla ilgilenmedi. Bunun yerine üniversitede çok sayıda bilgisayar ve yazılım mühendisliği okudu ve bu da onun bu konuyu hızla duymasını sağladı. geçen yılın sonunda ChatGPT'nin ortaya çıkışı.

Aralık ayında bir ChatGPT hesabı kaydettirdi ve ardından "yeteneğin benim öngörümün ötesinde olduğunu" söyledi.

Kaynak: Pinwan

Üssün çalışma istasyonunda Ding Yang'la tanıştığımda önündeki bilgisayar ekranındaki soru şuydu: "Başarılı bir insanın standardı nedir?"

Bu bir Wenxin Yiyan kullanıcısı tarafından gönderilen gerçek bir soru olabilir veya yoktan var olan bir test sorusu olabilir, ancak ekranın önüne yerleştirilmiştir ve işaretlenmesi gerekmektedir.

Etiketlemek kolay değil.

Böyle bir soruya Wen Xin Yiyan'ın vereceği beş farklı cevap olacak. Veri etiketleyicinin bunu okuması ve ardından her yanıttaki tüm kusurları bulması gerekir.

Örneğin cevaplarda yazım hataları ya da “çünkü” ve “öyleyse” gibi mantıksal kelimelerin yanlış kullanımı var ancak cevapların çoğu soruyla alakasız ya da hiçbir gerçekliğe dayanmayan sözde “illüzyonlar” mevcut. belirli bir paragrafta temel alınır.

Bu beş cevaba, cevabın niteliğine göre tam puan 5 puan, toplam beş seviye ve minimum 1 puan olacak şekilde bir puan verecektir. 3 puan ve altındaki cevaplar için Ding Yang'ın her hatayı etiketleme sistemi tarafından verilen farklı hata türlerine bölmesi gerekir.

Bu karmaşık hata düzeltme süreci, uygun bir ödül modeli RM'yi (ödül modeli, aynı zamanda tercih modeli olarak da adlandırılır) eğitmek ve oluşturmaktır ve puanlama ve sıralama eylemleri, modeli insan tercihleriyle daha da uyumlu hale getirecektir.

Bu aynı zamanda ChatGPT'nin başarısının da anahtarıdır. OpenAI'nin makalesi, talimat ayarlama süreci sırasında yapay zekayı insan fikirleriyle hizalama sürecini anlattı.

Veri etiketleyicilerin çalışmasından önce, farklı veri kümesini belirli soru-cevap çiftlerine dönüştürmek ve daha sonra bunları örnek sorular gibi büyük modele beslemek için daha fazla profesyonel personele ihtiyaç vardır. veri eğitimi, soruları yanıtlamaya başlar.

Bu aşamada veri etiketleyici, büyük model tarafından oluşturulan yanıtların kalitesini güvenlik, doğruluk ve uygunluk açısından değerlendirir.Bu değerlendirme verileri, bir ödül modelini daha da eğitir. Sonunda bu ödül modeli manuel etiketleme işinin yerini alacak.

OpenAI'nin 30 milyar ABD dolarını aşan değerlemesinin arkasında, saatlik ücretleri 2 ABD dolarından az olan çok sayıda Kenyalı veri etiketli işçi var; aksi takdirde bu, geçen yılın Aralık ayında Ding Yang'ın önünde olmazdı.

Ancak Ding Yang, RM veya SFT'nin tanımını bilmediğini, başlamadan önce eğitimde böyle bir teorik içeriğin olmadığını, buradaki bazı kişilerin Wen Xinyiyan'ın ne için çalıştığını bile bilmediğini söyledi. Ama bu önemli değil, önemli olan işleri halletmek.

Sabah dokuzdan altıya kadar ve altı gün izinli olan bu işin temel maaşı 1.800 yuan. Bir ay sonra günde ortalama 40 soru işaretlerseniz temel maaşı alırsınız. Temel maaş tamamlanma oranına göre hesaplanır ve komisyonun da doğru oranı dikkate alması gerekir. Bir süredir burada olan "gazi"nin günde 7 veya 80 civarında sabit bir iş yükü var ve karşılaşılan sorunlar daha zor. Ortalama olarak ayda 4.000 yuan kazanabilirsiniz.Daha çok çalışırsanız, örneğin her gün yaklaşık 100 soruyu işaretlerseniz ayda 7.000 yuan kazanabilirsiniz.

Ding Yang gibi yeni mezun biri için 4.000 yuan iyi bir başlangıca sahip bir iş olarak kabul ediliyor. Haikou halkının ortalama aylık maaşı sadece 3.000 yuan'ın biraz üzerinde ve hatta 10 kişiden 6'sı ayda 3.000 yuan alamıyor. Ünlü yerel Hou'an tozunun fiyatı 11 yuan ve ChatGPT'nin etiketleyicileri bir saatliğine bir kase satın alabiliyor. Karşılaştırıldığında, toz pahalıdır. Ona göre Haikou'daki insanlar fazla para kazanmıyor ama gıdaya harcamaya hazırlar.

Kaynak: Pinwan

Ding Yang, "Hisse senetleri veya arabalar en zorudur" dedi. Bu alanda bir sorunla karşılaşmanız 20 dakikayı bulabilir.

"Örneğin, birisi BMW 3 Serisi mi yoksa Mercedes-Benz C Serisi mi satın alacağını soracak." Şu anda büyük model, kullanıcının karşılaştırması için iki otomobil hakkında 80'den fazla parametre listeleyecek ve kullanıcının karşılaştırma yapması gerekiyor. Arkasından tek tek takip edin. Her parametrenin gerçekliğini doğrulayın.

Yarım aylık çalışmanın ardından yüzlerce soru işaretlendi ancak kendi izlenimine göre 3 puan almanın zaten iyi olduğunu, 4 puan almanın ise nadir olduğunu söyledi.

4 puan alan bir soruyu hatırladı, başlığı "Lin Daiyu neden Kemik Şeytanıyla savaştı?"

Wen Xin, direği tek kelimeyle takip etmedi ve Lin Daiyu'nun Bone Demon'u yenenin olmadığını fark etti ve ardından Lin Daiyu ve Bone Demon'un geçmişlerini tanıttı. Yanıt kalitesinin her boyutunda bu neredeyse kusursuzdur.

Bu soruyu Claude 2'ye yönelttim ve o şunu söyledi: "Kemik Şeytanı Wang Xifeng'e dönüştü ve Lin Daiyu'yu birçok kez küçük düşürdü ve Lin Daiyu Kemik Şeytanının öldürülmesine kızmıştı."——Halüsinasyon gerçekten yeterince sıkıntı verici.

Kaynak: Pinwan

2020 yılı başında "yapay zeka eğitmenliği" resmi olarak bir meslek haline geldi ve ulusal mesleki sınıflandırma dizinine dahil edildi.İki yıl sonra büyük modellerin dalgası bu dizinde birdenbire daha büyük bir boşluk açtı.

Yapay zekanın insanlardan eski işleri alıp götürdüğünü izlemek ve ardından yenilerini yaratacağını ummak. Tıpkı faytonun yerini arabanın alması gibi, yeni endüstri de fayton sürücüsüne zengin olmak için yeni bir emek dünyasının genel metaforunu verecek. Satın almayın. Mesela derin öğrenmenin temelini attılar. Şimdi İngiliz Geoffrey Hinton endişeleniyor.

Ancak şu anda en doğrudan yaratım, Ding Yang gibi büyük model veri etiketleyicidir.

2022'den önce yapay zekanın sınırları hâlâ kendi kendini kontrol edemeyen sürücüsüz arabalarla tanımlanıyor.Veri etiketleyicileri için soğuk bir metafor var:

"Yapay zekayı bir hayvan olarak düşünürseniz, veri etiketleyicinin işi kabaca yem hazırlamakla eşdeğerdir."

İş ucuz ve tekrarlayıcı; besleyici olacak kadar yakın bile değil.

Geleneksel bir veri etiketleyicinin günlük işi yalnızca alınan her görüntüyü dikkatlice gözlemlemek, bir arabanın veya bir köpeğin ana hatlarını daire içine almak, etiketlemek, farklı klasörlere sürükleyip bırakmak veya nokta matrisi kullanmaktır. Araç, her karedeki engelleri işaretler tam bir "sürülebilir alan" bırakarak bir sürüş videosunun.

Böyle bir eylem, bir veri etiketleyici tarafından günde 2.000 kez yapılabilir.

Yapay zeka ile yalnızca etiketlenmiş veriler öğrenilebilir. Bir otonom sürüş verileri tedarikçisi, bir zamanlar veri etiketlemenin otomasyon derecesinin, veri etiketlemenin geliştirilmesinden bu yana yalnızca %5 olduğunu ve etiketleme işinin diğer %95'inin hala manuel olarak yapıldığını belirtmişti.

Büyük modelin gelişinden sonra veri etiketlemenin türü de değişmeye başladı. Sadece ekranda kutu çizmek, noktalar çizmek veya çizgiler çizmek değil, büyük model veri etiketleyicinin ana işi, oluşturulan içeriğin değerlendirilmesi, sıralanması ve puanlanması haline gelir.Birden fazla diyalog turu veya çok modlu içerik oluşturmayı içeriyorsa, zorluk Başka bir dik artış.

Geleneksel CV ve NLP döneminde model açıklamalarının nesnel kurallara göre hareket etme eğiliminde olduğu söylenirse, büyük modellerin açıklama kuralları daha subjektiftir ve aynı zamanda açıklama personelinin kalitesini de test eder. Bu nedenle, Baidu'nun Haikou ve Shanxi'deki büyük model etiketleme ekiplerinin tümü lisans veya üzeri öğrencilerden oluşuyor.

Haikou üssündeki sıradan etiketleyiciler, kalite müfettişlerine terfi etme fırsatına sahipler ve daha sonra eğitmen, ardından süpervizör ve son olarak proje yöneticisi olabilirler. Bu birkaç ay içinde kurulmuş bir kanal. Haikou'da Wenxin Yiyan için veri açıklamaları yapan bir temsilci, deneme süresinden sonra kişinin dahili pozisyonlar olması ve herhangi bir zaman çizelgesi olmaması durumunda terfi ettirilebileceğini söyledi.

Bu hızla gelişen yeni bir endüstridir. Ding Yang, "Her bağlantı yeni gelen bir bağlantıdır" dedi.

Kalite denetçisi ilk incelemeyi tamamladıktan sonra soru bankasını ikinci incelemeye devreder. İkinci inceleme Baidu tarafından dahili olarak gerçekleştirildi ve eğitim verileri Ding Yang'ın etiketleme ekibinin elinde değildi.

Wen Xinyiyan için çalışan Ding Yang ve üssün tamamındaki 200'den fazla kişi Baidu çalışanı değil.

Haikou üssündeki etiketleyiciler dört farklı kuruma ait. Bu üçüncü taraf veri etiketleme şirketleri ile iş sözleşmeleri imzalanmaktadır. Baidu'nun aramadan otonom sürüşe ve büyük ölçekli modellere kadar uzun yapay zeka geçmişi, ülke çapında 600'den fazla temsilcinin ve 300'den fazla şehirde 200.000 veri etiketleyicinin arkasında yer alıyor.

Baidu, tam zamanlı büyük ölçekli model ekibinin büyüklüğünün 10.000 kişiye yakın olduğunu varsayıyor ve bu plan, gelecekte ülke çapında ondan fazla şehirde yeni bir "üs" olarak hayata geçirilecek.

Baidu Akıllı Bulut Veri Açıklama Tabanı ürün müdürü Hu Chi, büyük model veri açıklayıcılarının uzun vadeli bir kariyer olacağına inanıyor. Büyük model yeteneklerinin çeşitli senaryolarda derinleşmesiyle birlikte yeni sorunlar ortaya çıkacak, bu da yeni etiketleme gereksinimlerinin ortaya çıkması anlamına geliyor.İnsanoğlu böylesine titiz bir uyumlamaya her zaman ihtiyaç duyacaktır.

Ding Yang buradan ayrılacağını söyledi.

Onunla aynı anda gelen 20'den fazla acemi veri etiketleyici vardı ve bunların çoğu kısa sürede ayrıldı; çoğu gönüllü olarak ayrıldı. İşin sıkıcı içeriği, parça başı ücretle para kazanma şekli ve insanların tüketimi, bunun akışkanlığı yüksek bir pozisyon olacağını hayal etmek zor değil. Ve insanlar ne kadar alkışlarsa alkışlasın, herkesin görmekten hoşlandığı, makinelerin yerini almanın yarattığı güvensizlik var.

Ding Yang bunu sektörle birlikte büyümek için bir fırsat olarak görüyor. Yapay zeka dalgasına daha yakın bir pozisyon bulmadan önce "Süpermen olup olamayacağınızı deneyin" dedi.

(Ding Yang metinde takma addır)

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
ETH Breaks $3600
19k Popularity
Gate Derivatives Volume Hits New High
18k Popularity
CPI Data Incoming
61k Popularity
4Join Gate VIP to Win MacBook
31k Popularity
5MicroStrategy Buys More Bitcoin
3k Popularity
6BTC Hits New High
113k Popularity
7My Gate Moments
28k Popularity
8VIP Exclusive Airdrop Carnival
27k Popularity
9Fed June Meeting Minutes
7k Popularity
10Trump Tariff Hikes
18k Popularity

sitemap