Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur
Zheng Wen birkaç ay önceki o öğleden sonrayı hâlâ hatırlıyor ve o gün saatte 20 sent kazanıyordu. Hunan'daki bir kolejden mezun oldu ve büyük model veri açıklayıcısı olarak çalışıyor. Günlük işi karmaşık değil; aldığı ham verilere (resimler, videolar, metinler vb.) etiketler ekliyor.
Ancak büyük modellerin veri kalitesi açısından çok yüksek gereksinimleri var.O gün bir resim onaylanmadan önce sekiz kez revize edildi.Tüm revizyon süreci bir saat sürdü. Yani saatte sadece 2 sent kazanıyordu, oysa normal şartlarda 12 yuan kazanıp 600 kutu çekebiliyordu. "Para kazanmak kolay değil" diye defalarca vurguladı.
Bu neredeyse tüm veri açıklaması uygulayıcılarının fikir birliğidir. Veri açıklamasının bir ucunda uygulayıcıların 5.000 yuan'dan az olan aylık maaşı yer alıyor ve onlar bir karınca ordusu gibi büyük modelin temel taşını inşa ediyorlar. Diğer tarafta büyük internet şirketlerinin Chat GPT 4'ü geçmeyi umdukları yapay zeka hayali var.
Veri açıklaması, ücretleri hesaplamak için en ilkel parça başı ücret sistemini kullanıyor ve işyerinde entrika yok. Tek sorun, bu sıkıcı işin çoğunun üç ay boyunca dayanmasını zorlaştırmasıdır. Ve neredeyse herkes Planet Tech'e gitmemenizin daha iyi olacağını söyledi.
Ancak bilmedikleri şey, çoğunun sıkıcı işlerini yakında kaybedebileceğidir. Çünkü bu basit veri açıklamalarının yerini yapay zeka alacak.
Fiyat 5 sentten 4 sente düştü
Lin Shuang, 2017'de çok fazla "kısa para" kazandı: 15 günde 6.000 yuan'den fazla. Bir ortaokuldan mezun olan Lin Shuang için bu gelir gerçekten de kayda değer. O zamanlar insanların yapay zekaya dair beklentileri hızla artıyordu.Neredeyse hiç kimse onun geleceğinden şüphe duymuyordu.Tüm yatırım kurumları milyarlarca, on milyarlarca, hatta yüz milyarlarca dolarlık şirketlerin burada doğabileceğine inanıyordu.
Neredeyse tüm yapay zeka teknolojilerinin arkasında algoritmalar, bilgi işlem gücü ve hesaplamalar arasındaki rekabet vardır.Devasa veriler, teknik mükemmelliğin en alt katmanıdır. Parlak geçmişe sahip programcılar "Pekin, Şanghay ve Guangzhou"daki ofislerde oturuyor ve kod yineleme algoritmaları aracılığıyla yapay zeka planları çiziyor; üniversite öğrencileri, anneler vb. ise üçüncü ve sonraki kabinlerdeki devasa veri paketlerindeki görüntüleri, metinleri ve sesleri işliyor. dördüncü kademe şehirler, bekleyin.
ChatGPT bir istisna değildir. Baidu Wenxinyiyan proje ekibinden bir çalışan, büyük modelin herhangi bir yeni teknolojiye sahip olmadığını ve yüksek teknik engellere sahip olmadığını, asıl sorunun bilgi işlem gücü bariyerinin oluşturduğu parametre bariyeri olduğunu söyledi.
Büyük modeller çağındaki veri açıklayıcıları geçmiştekilerden özellikle farklı değildir.Birkaç fark, daha rahat bir ofis ortamı ve açıklama kalitesine yönelik daha yüksek gereksinimler olabilir. Bir veri açıklama uygulayıcısı Tech Planet'e, sektöre ilk girdiklerinde genellikle yaklaşık 10 kişilik bir ekip oluşturduklarını ve bu ekiplerden birinin kalite kontrolünden sorumlu olduğunu söyledi. Tekrar yap. Verilerin kalitesi büyük modellerin kalitesini belirler.
Veri göçmeni işçiler yapay zeka teknolojisinin yeni dallarını umursamıyorlar, birim fiyatı daha çok önemsiyorlar çünkü burada ücretler parça parça hesaplanıyor.
Lin Shuang, "Birim fiyatın yüksek olduğu o dönemde, 2 boyutlu bir çerçevenin maliyeti 1 sentten fazla olurdu. Zirvedeyken 10 saatten fazla çalıştım ve günde 600 yuan'dan fazla kazandım" diye hatırladı. Ancak bu en yüksek rakam değil.Bir yorumcu, ilk 2D çerçeve çizimlerinin fiyatının 50 sente kadar çıkabileceğini söyledi.
Çerçeve çizimi, veri açıklamasında yaygın olarak yapılan bir işlemdir. Açıklayıcı, resimdeki araçlar, kırmızı sokak lambaları, engeller vb. gibi nesneleri gereksinimlere göre işaretler. Çerçeveler 2D ve 3D'ye ayrılmıştır, ikincisi daha pahalı olacaktır.
Ancak bu popülerlik uzun sürmedi. Gittikçe daha fazla insanın akın etmesi ve yapay zeka sektörünün genel gelişiminin sorunsuz gitmemesi nedeniyle, bir resme açıklama eklemenin birim fiyatı giderek düşüyor. Lin Shuang, en düşük fiyatın olduğunu söyledi. şimdi sadece 4 sent.
"Eğer bir çekme çerçevesi ise sektördeki ortalama birim fiyatı 0,15 yuan civarındadır, ancak bu yine de projeye bağlıdır. Sipariş alabiliyorsanız, ilk elden sipariş almak için minimum gereksinim 100 çalışan olmalıdır. ölçek oldukça büyük ve 3D Çerçevenin fiyatı 30 sent olabilir, ancak 50 sente kadar çıkması nadirdir.”
Elbette tıp ve finans alanlarında mesleki bilginiz varsa birim fiyatı daha yüksek olacaktır. Örneğin, birçok büyük tıbbi model, açıklayıcıların klinik uzmanlığa ve ilgili deneyime sahip olmasını gerektirir.
Uygulayıcıların çoğunun aylık geliri 5.000 yuan'ı geçmiyor ve aralarında birkaç şanslı olanlar da var. Yang Shuo başlangıçta Sichuan'da bir giyim mağazası işletiyordu, ancak salgın işini etkiledi. Bu yıl büyük ölçekli model veri açıklamasına geçti. Şimdi ayda 8.000 yuan geliri var. "Şirketle bir sözleşme imzaladım ve ödendi Franchise ücreti 9.500 yuan ve sözleşmede asgari aylık gelirin 7.000 yuan olduğu belirtiliyor."
Parayı kim kazandı
Alibaba, Tencent, Byte gibi internet devlerinin yanı sıra SAIC ve Lynk & Co gibi otomobil firmaları da veri notu iş dağıtımının kaynaklarıdır.En iyi fiyata doğrudan kaynaktan sipariş almak istiyorsanız veri notu Firmaların belli bir ölçeğe sahip olması gerekiyor.
Bir veri açıklama şirketinin çalışanı, Tech Planet'e doğrudan büyük üreticilerden sipariş aldıklarını, ancak büyük üreticilerin 500 kişiye ihtiyaç duyduklarını, dolayısıyla personel gereksinimlerini franchising veya yan kuruluşlar yoluyla karşılamayı seçeceklerini söyledi.
İkisi arasındaki fark franchisingin sektöre yeni başlayan kişilerin stüdyo kurması için uygun olmasıdır.Eğer şube kurmak istiyorsanız genellikle bir bölgede sadece bir tane bulunur. Xiaobai Studio'nun 25.000 veya 30.000 tutarında bir franchise ücreti alması gerekiyor. Bağlı ortaklık bir bölgedeki münhasır acentedir ve 50.000 tutarında bir ücret ödemesi gerekmektedir. Ve üç yıl içinde yeterli siparişleri garanti edebilirler ve üç yıl içinde teknik eğitimden sorumlu olabilirler.Bu stüdyolar veya yan kuruluşlar, birkaç yüzden birkaç bine kadar değişen büyük bir işçi birliği oluşturur.
Yukarıda adı geçen veri açıklama şirketinin çalışanları, büyük modellerin popülaritesinin veri açıklama sektörünü bir kez daha çılgınlığa sürüklediğini ve artık insanların neredeyse her gün şirketlerini ziyaret ettiğini söyledi.
Ancak aslında bir veri etiketleme şirketini yönetmek kolay değildir. Veri açıklama şirketinin size söylediği şey, bu sektörün ilk 1-2 ayda yapılmasının zor olduğu çünkü çalışanların bir yükseliş dönemine ihtiyacı olduğu.İlk aşamada sadece 5-8 kişi yeterli oluyor, hatta içinde bir teyze bile var. 40'lı yaşlarda hiçbir sorun olmayacak.
Bir veri açıklama şirketi veya stüdyosu için istikrar en önemli faktördür. Ancak Tech Planet'in temasa geçtiği ek açıklama çalışanlarının çoğu sık sık sıkılma nedeniyle 3 ay içinde işlerini ışık hızıyla bırakıyorlar, yeni çalışanlar pratik operasyonlar için hemen müsait olmuyor, yüksek personel devir hızının sonucu kalitenin düşmesidir. ve veri açıklaması döngüsü yeterince kararlı değil. Para sıkıntısı çeken anneler, veri açıklama stüdyoları için en popüler kişilerdir.
Verileri yöneten Wei Ming, "Yarı zamanlı bir iş bulmak kesinlikle mümkün değil. Boşluklar olacak. Kiraya ve bilgisayarlara yatırım yaparsanız para kaybedersiniz. En iyi yol, tüm çalışanların çalışmasını sağlamaktır." ek açıklama stüdyosu Tech Planet'e söyledi.
Verilerin çoğu, şirketin geri ödeme döngüsünün 3 aydan başlayıp yarım yıla kadar çıkabildiğini ancak çalışanlarına aylık ödeme yapmaları gerektiğini, bunun da belirli bir sermaye rezervi gerektirdiğini gösteriyor. "Kişi başı 3500, 100 kişi, 3 ay 1,05 milyon."
Zhang Jian bir zamanlar 200'den fazla çalışanı olan bir sendikaya katılmıştı. İlk yıl sektörün patlama dönemini yakaladılar ve 2 boyutlu çerçeve çiziminin birim fiyatı 5 kuruşa kadar yükseldi.O yıl sendikası 4 milyonun üzerinde gelir elde etti.
Ancak ertesi yıl işler daha da kötüye gitti. Belirlenen birim fiyat düştü, çalışanlar daha hareketli hale geldi ve boşluk süresi arttı.Ayrıca iki büyük proje sonuçlandırılmadı.Tam bir yıl sonra 3 milyon yuan'dan fazla para kaybettiler. Zhang Jian, "Patronlar kısa vadede veri açıklamasına dokunmayacaklarını söyledi" dedi ve "Şu anda yukarı yönlü bir dava içindeler."
Bu düşük marjlı bir iş. Haitian Ruisheng, veri açıklama endüstrisinde yönetim kurulunda listelenen ilk şirkettir.Geçen yıl şirket 263 milyon yuan gelir, yalnızca 29,45 milyon yuan kar ve %10'un biraz üzerinde net kar marjı elde etti. Ancak bu yılın ilk yarısında müşteri sayısının azalması nedeniyle şirket zarara uğradı.
İstenildiği zaman değiştirilebilen "Vidalar"
Kenya'da hareket eden karıncaların birikimine dayanan OpenAI, sonunda geniş ölçekli dil diyalog modeli yetenekleriyle öne çıktı. Veri işçileri olarak adlandırılan bu sıradan insanlar, Sam Altman'ın (OpenAI'nin kurucusu) yapay zeka hayalini destekliyor ancak başka bir şey olmazsa, ellerindeki işlerin çoğu, yakında yaratılmasına katıldıkları yeni ürünlerle değiştirilecek. değiştirildi.
Yurtdışında, Open AI'nin eski çalışanları tarafından 2021 yılında kurulan Anthropic, bu yıl 5,15 milyar ABD doları topladı; bu, son iki yıldaki toplam finansmanın yedi katından fazla. Şirket, modelleri daha az insan katılımıyla eğitmek için yeni bir yol sunuyor.
Bu yıl, AI start-up yakıt ikmali, veri kümelerini etiketlemek için piyasadaki ana akım büyük modelleri kullanabilen Autolabel adlı açık kaynaklı bir aracı piyasaya sürdü. Şirketin test sonuçları, Autolabel'in etiketleme verimliliğinin manuel etiketlemeye göre 100 kat daha yüksek olduğunu ve maliyetinin işçilik maliyetinin yalnızca 1/7'si olduğunu belirtti.
Çin'de Vision Future adlı bir şirket de büyük ölçekli açıklama modelleri inşa ediyor. Bir röportajda bazı projelerin GPT kullanılarak teslim edildiğini ve doğruluğun %80'in üzerine çıktığını, bunun da manuel çalışmaya yakın olduğunu söylediler.
Ancak Haitili Ruisheng, yapay zekanın tamamen otomatikleştirilmiş açıklamaları kesinlikle gerçekleştiremeyeceğine inanıyor çünkü makine gelişmeye devam etmek ve onu insan muhakeme ve anlayışına daha yakın hale getirmek istiyorsa kesinlikle insan rehberliğine ihtiyaç duyacaktır.
Veri açıklamasıyla uğraşan hemen hemen herkes Tech Planet'e aynı bakış açısını ortaya koydu: Veri açıklaması eşiksiz bir iştir ve yalnızca bilgisayar kullanma konusunda yetkin olmanızı gerektirir.
Ancak aslında basit açıklama yapay zeka ile tamamlanabiliyorsa manuel katılım, veri taraması ve standart çalışma açısından daha zor olacaktır; bu aynı zamanda endüstrinin eşiğinin özellikle ChatGPT, Wen Xinyiyan için artmaya devam edeceği anlamına gelir. sınıflar.
Karşılaştırma yapmak gerekirse, ChatGPT'nin popüler hale gelmesinden çok önce, OpenAI bir düzineden fazla doktora öğrencisini "işaretlemek" için organize etmişti. Baidu'nun Haikou'daki veri açıklama tabanında yüzlerce tam zamanlı büyük model veri açıklayıcısı bulunuyor ve lisans düzeyinde açıklayıcıların oranı %100'e ulaşıyor.
Bu tip geniş dil modelinin özelliği, açıklamayı yapan kişinin belirli bir bilgi birikimine ve mantıksal analiz yeteneğine sahip olmasının gerekli olmasıdır. "Financial Eleven" raporuna göre yorumcuların soru tipini belirlemesi ve ardından beş cevabı sırasıyla puanlaması ve sıralaması gerekiyor. Puan aralığı 0-5 puandır. Puan 3 puanın altındaysa özel nedenler belirtilmelidir. “Cevap sorunun sorulduğu gibi değil (0 puan)”, “ciddi konu dışı (1 puan)”, “mantıksal problemler ve olgusal hatalar var ve oran küçük ve 2 puan verildi" vb.
Veri açıklamasının bir diğer popüler alanı ise otonom sürüş. Deloitte raporuna göre, otonom sürüş alanındaki etiketleme talebi 2022 yılında tüm yapay zeka uygulamalarının %38'ini oluşturacak ve bu oranın 2027 yılına kadar %52'ye çıkması bekleniyor. Otonom sürüş alanındaki modeller için, büyük dil modelleriyle karşılaştırıldığında, bu basit kutu çekme operasyonlarının akademik gereksinimleri hâlâ nispeten gevşek.
Annotatörler, mobil internet çağından yapay zeka çağına kadar insanoğlunun temel taşıdır.Tech Planet'in temas kurduğu uygulayıcıların çoğu, yapay zekanın kendilerine getireceği değişiklikleri ve yapay zekanın gelişimine yaptıkları katkıları bilmiyor. Yapay Zeka: Bunlar İnternet çağındaki yeni nesil vidalardır ve herhangi bir zamanda değiştirilebilirler.
(Not: Makaledeki karakterlerin tamamı takma adlardır.)
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AI büyük model katlama: Veriler, "göçmen işçilerin" aylık gelirinin 5.000'den fazla olmadığını ve birim fiyatın 5 sentten 4 sente düştüğünü gösteriyor
Orijinal kaynak: Tech Planet
Zheng Wen birkaç ay önceki o öğleden sonrayı hâlâ hatırlıyor ve o gün saatte 20 sent kazanıyordu. Hunan'daki bir kolejden mezun oldu ve büyük model veri açıklayıcısı olarak çalışıyor. Günlük işi karmaşık değil; aldığı ham verilere (resimler, videolar, metinler vb.) etiketler ekliyor.
Ancak büyük modellerin veri kalitesi açısından çok yüksek gereksinimleri var.O gün bir resim onaylanmadan önce sekiz kez revize edildi.Tüm revizyon süreci bir saat sürdü. Yani saatte sadece 2 sent kazanıyordu, oysa normal şartlarda 12 yuan kazanıp 600 kutu çekebiliyordu. "Para kazanmak kolay değil" diye defalarca vurguladı.
Bu neredeyse tüm veri açıklaması uygulayıcılarının fikir birliğidir. Veri açıklamasının bir ucunda uygulayıcıların 5.000 yuan'dan az olan aylık maaşı yer alıyor ve onlar bir karınca ordusu gibi büyük modelin temel taşını inşa ediyorlar. Diğer tarafta büyük internet şirketlerinin Chat GPT 4'ü geçmeyi umdukları yapay zeka hayali var.
Veri açıklaması, ücretleri hesaplamak için en ilkel parça başı ücret sistemini kullanıyor ve işyerinde entrika yok. Tek sorun, bu sıkıcı işin çoğunun üç ay boyunca dayanmasını zorlaştırmasıdır. Ve neredeyse herkes Planet Tech'e gitmemenizin daha iyi olacağını söyledi.
Ancak bilmedikleri şey, çoğunun sıkıcı işlerini yakında kaybedebileceğidir. Çünkü bu basit veri açıklamalarının yerini yapay zeka alacak.
Fiyat 5 sentten 4 sente düştü
Lin Shuang, 2017'de çok fazla "kısa para" kazandı: 15 günde 6.000 yuan'den fazla. Bir ortaokuldan mezun olan Lin Shuang için bu gelir gerçekten de kayda değer. O zamanlar insanların yapay zekaya dair beklentileri hızla artıyordu.Neredeyse hiç kimse onun geleceğinden şüphe duymuyordu.Tüm yatırım kurumları milyarlarca, on milyarlarca, hatta yüz milyarlarca dolarlık şirketlerin burada doğabileceğine inanıyordu.
Neredeyse tüm yapay zeka teknolojilerinin arkasında algoritmalar, bilgi işlem gücü ve hesaplamalar arasındaki rekabet vardır.Devasa veriler, teknik mükemmelliğin en alt katmanıdır. Parlak geçmişe sahip programcılar "Pekin, Şanghay ve Guangzhou"daki ofislerde oturuyor ve kod yineleme algoritmaları aracılığıyla yapay zeka planları çiziyor; üniversite öğrencileri, anneler vb. ise üçüncü ve sonraki kabinlerdeki devasa veri paketlerindeki görüntüleri, metinleri ve sesleri işliyor. dördüncü kademe şehirler, bekleyin.
ChatGPT bir istisna değildir. Baidu Wenxinyiyan proje ekibinden bir çalışan, büyük modelin herhangi bir yeni teknolojiye sahip olmadığını ve yüksek teknik engellere sahip olmadığını, asıl sorunun bilgi işlem gücü bariyerinin oluşturduğu parametre bariyeri olduğunu söyledi.
Büyük modeller çağındaki veri açıklayıcıları geçmiştekilerden özellikle farklı değildir.Birkaç fark, daha rahat bir ofis ortamı ve açıklama kalitesine yönelik daha yüksek gereksinimler olabilir. Bir veri açıklama uygulayıcısı Tech Planet'e, sektöre ilk girdiklerinde genellikle yaklaşık 10 kişilik bir ekip oluşturduklarını ve bu ekiplerden birinin kalite kontrolünden sorumlu olduğunu söyledi. Tekrar yap. Verilerin kalitesi büyük modellerin kalitesini belirler.
Veri göçmeni işçiler yapay zeka teknolojisinin yeni dallarını umursamıyorlar, birim fiyatı daha çok önemsiyorlar çünkü burada ücretler parça parça hesaplanıyor.
Lin Shuang, "Birim fiyatın yüksek olduğu o dönemde, 2 boyutlu bir çerçevenin maliyeti 1 sentten fazla olurdu. Zirvedeyken 10 saatten fazla çalıştım ve günde 600 yuan'dan fazla kazandım" diye hatırladı. Ancak bu en yüksek rakam değil.Bir yorumcu, ilk 2D çerçeve çizimlerinin fiyatının 50 sente kadar çıkabileceğini söyledi.
Çerçeve çizimi, veri açıklamasında yaygın olarak yapılan bir işlemdir. Açıklayıcı, resimdeki araçlar, kırmızı sokak lambaları, engeller vb. gibi nesneleri gereksinimlere göre işaretler. Çerçeveler 2D ve 3D'ye ayrılmıştır, ikincisi daha pahalı olacaktır.
Ancak bu popülerlik uzun sürmedi. Gittikçe daha fazla insanın akın etmesi ve yapay zeka sektörünün genel gelişiminin sorunsuz gitmemesi nedeniyle, bir resme açıklama eklemenin birim fiyatı giderek düşüyor. Lin Shuang, en düşük fiyatın olduğunu söyledi. şimdi sadece 4 sent.
"Eğer bir çekme çerçevesi ise sektördeki ortalama birim fiyatı 0,15 yuan civarındadır, ancak bu yine de projeye bağlıdır. Sipariş alabiliyorsanız, ilk elden sipariş almak için minimum gereksinim 100 çalışan olmalıdır. ölçek oldukça büyük ve 3D Çerçevenin fiyatı 30 sent olabilir, ancak 50 sente kadar çıkması nadirdir.”
Elbette tıp ve finans alanlarında mesleki bilginiz varsa birim fiyatı daha yüksek olacaktır. Örneğin, birçok büyük tıbbi model, açıklayıcıların klinik uzmanlığa ve ilgili deneyime sahip olmasını gerektirir.
Uygulayıcıların çoğunun aylık geliri 5.000 yuan'ı geçmiyor ve aralarında birkaç şanslı olanlar da var. Yang Shuo başlangıçta Sichuan'da bir giyim mağazası işletiyordu, ancak salgın işini etkiledi. Bu yıl büyük ölçekli model veri açıklamasına geçti. Şimdi ayda 8.000 yuan geliri var. "Şirketle bir sözleşme imzaladım ve ödendi Franchise ücreti 9.500 yuan ve sözleşmede asgari aylık gelirin 7.000 yuan olduğu belirtiliyor."
Parayı kim kazandı
Alibaba, Tencent, Byte gibi internet devlerinin yanı sıra SAIC ve Lynk & Co gibi otomobil firmaları da veri notu iş dağıtımının kaynaklarıdır.En iyi fiyata doğrudan kaynaktan sipariş almak istiyorsanız veri notu Firmaların belli bir ölçeğe sahip olması gerekiyor.
Bir veri açıklama şirketinin çalışanı, Tech Planet'e doğrudan büyük üreticilerden sipariş aldıklarını, ancak büyük üreticilerin 500 kişiye ihtiyaç duyduklarını, dolayısıyla personel gereksinimlerini franchising veya yan kuruluşlar yoluyla karşılamayı seçeceklerini söyledi.
İkisi arasındaki fark franchisingin sektöre yeni başlayan kişilerin stüdyo kurması için uygun olmasıdır.Eğer şube kurmak istiyorsanız genellikle bir bölgede sadece bir tane bulunur. Xiaobai Studio'nun 25.000 veya 30.000 tutarında bir franchise ücreti alması gerekiyor. Bağlı ortaklık bir bölgedeki münhasır acentedir ve 50.000 tutarında bir ücret ödemesi gerekmektedir. Ve üç yıl içinde yeterli siparişleri garanti edebilirler ve üç yıl içinde teknik eğitimden sorumlu olabilirler.Bu stüdyolar veya yan kuruluşlar, birkaç yüzden birkaç bine kadar değişen büyük bir işçi birliği oluşturur.
Yukarıda adı geçen veri açıklama şirketinin çalışanları, büyük modellerin popülaritesinin veri açıklama sektörünü bir kez daha çılgınlığa sürüklediğini ve artık insanların neredeyse her gün şirketlerini ziyaret ettiğini söyledi.
Ancak aslında bir veri etiketleme şirketini yönetmek kolay değildir. Veri açıklama şirketinin size söylediği şey, bu sektörün ilk 1-2 ayda yapılmasının zor olduğu çünkü çalışanların bir yükseliş dönemine ihtiyacı olduğu.İlk aşamada sadece 5-8 kişi yeterli oluyor, hatta içinde bir teyze bile var. 40'lı yaşlarda hiçbir sorun olmayacak.
Bir veri açıklama şirketi veya stüdyosu için istikrar en önemli faktördür. Ancak Tech Planet'in temasa geçtiği ek açıklama çalışanlarının çoğu sık sık sıkılma nedeniyle 3 ay içinde işlerini ışık hızıyla bırakıyorlar, yeni çalışanlar pratik operasyonlar için hemen müsait olmuyor, yüksek personel devir hızının sonucu kalitenin düşmesidir. ve veri açıklaması döngüsü yeterince kararlı değil. Para sıkıntısı çeken anneler, veri açıklama stüdyoları için en popüler kişilerdir.
Verileri yöneten Wei Ming, "Yarı zamanlı bir iş bulmak kesinlikle mümkün değil. Boşluklar olacak. Kiraya ve bilgisayarlara yatırım yaparsanız para kaybedersiniz. En iyi yol, tüm çalışanların çalışmasını sağlamaktır." ek açıklama stüdyosu Tech Planet'e söyledi.
Verilerin çoğu, şirketin geri ödeme döngüsünün 3 aydan başlayıp yarım yıla kadar çıkabildiğini ancak çalışanlarına aylık ödeme yapmaları gerektiğini, bunun da belirli bir sermaye rezervi gerektirdiğini gösteriyor. "Kişi başı 3500, 100 kişi, 3 ay 1,05 milyon."
Zhang Jian bir zamanlar 200'den fazla çalışanı olan bir sendikaya katılmıştı. İlk yıl sektörün patlama dönemini yakaladılar ve 2 boyutlu çerçeve çiziminin birim fiyatı 5 kuruşa kadar yükseldi.O yıl sendikası 4 milyonun üzerinde gelir elde etti.
Ancak ertesi yıl işler daha da kötüye gitti. Belirlenen birim fiyat düştü, çalışanlar daha hareketli hale geldi ve boşluk süresi arttı.Ayrıca iki büyük proje sonuçlandırılmadı.Tam bir yıl sonra 3 milyon yuan'dan fazla para kaybettiler. Zhang Jian, "Patronlar kısa vadede veri açıklamasına dokunmayacaklarını söyledi" dedi ve "Şu anda yukarı yönlü bir dava içindeler."
Bu düşük marjlı bir iş. Haitian Ruisheng, veri açıklama endüstrisinde yönetim kurulunda listelenen ilk şirkettir.Geçen yıl şirket 263 milyon yuan gelir, yalnızca 29,45 milyon yuan kar ve %10'un biraz üzerinde net kar marjı elde etti. Ancak bu yılın ilk yarısında müşteri sayısının azalması nedeniyle şirket zarara uğradı.
İstenildiği zaman değiştirilebilen "Vidalar"
Kenya'da hareket eden karıncaların birikimine dayanan OpenAI, sonunda geniş ölçekli dil diyalog modeli yetenekleriyle öne çıktı. Veri işçileri olarak adlandırılan bu sıradan insanlar, Sam Altman'ın (OpenAI'nin kurucusu) yapay zeka hayalini destekliyor ancak başka bir şey olmazsa, ellerindeki işlerin çoğu, yakında yaratılmasına katıldıkları yeni ürünlerle değiştirilecek. değiştirildi.
Yurtdışında, Open AI'nin eski çalışanları tarafından 2021 yılında kurulan Anthropic, bu yıl 5,15 milyar ABD doları topladı; bu, son iki yıldaki toplam finansmanın yedi katından fazla. Şirket, modelleri daha az insan katılımıyla eğitmek için yeni bir yol sunuyor.
Bu yıl, AI start-up yakıt ikmali, veri kümelerini etiketlemek için piyasadaki ana akım büyük modelleri kullanabilen Autolabel adlı açık kaynaklı bir aracı piyasaya sürdü. Şirketin test sonuçları, Autolabel'in etiketleme verimliliğinin manuel etiketlemeye göre 100 kat daha yüksek olduğunu ve maliyetinin işçilik maliyetinin yalnızca 1/7'si olduğunu belirtti.
Çin'de Vision Future adlı bir şirket de büyük ölçekli açıklama modelleri inşa ediyor. Bir röportajda bazı projelerin GPT kullanılarak teslim edildiğini ve doğruluğun %80'in üzerine çıktığını, bunun da manuel çalışmaya yakın olduğunu söylediler.
Ancak Haitili Ruisheng, yapay zekanın tamamen otomatikleştirilmiş açıklamaları kesinlikle gerçekleştiremeyeceğine inanıyor çünkü makine gelişmeye devam etmek ve onu insan muhakeme ve anlayışına daha yakın hale getirmek istiyorsa kesinlikle insan rehberliğine ihtiyaç duyacaktır.
Veri açıklamasıyla uğraşan hemen hemen herkes Tech Planet'e aynı bakış açısını ortaya koydu: Veri açıklaması eşiksiz bir iştir ve yalnızca bilgisayar kullanma konusunda yetkin olmanızı gerektirir.
Ancak aslında basit açıklama yapay zeka ile tamamlanabiliyorsa manuel katılım, veri taraması ve standart çalışma açısından daha zor olacaktır; bu aynı zamanda endüstrinin eşiğinin özellikle ChatGPT, Wen Xinyiyan için artmaya devam edeceği anlamına gelir. sınıflar.
Karşılaştırma yapmak gerekirse, ChatGPT'nin popüler hale gelmesinden çok önce, OpenAI bir düzineden fazla doktora öğrencisini "işaretlemek" için organize etmişti. Baidu'nun Haikou'daki veri açıklama tabanında yüzlerce tam zamanlı büyük model veri açıklayıcısı bulunuyor ve lisans düzeyinde açıklayıcıların oranı %100'e ulaşıyor.
Bu tip geniş dil modelinin özelliği, açıklamayı yapan kişinin belirli bir bilgi birikimine ve mantıksal analiz yeteneğine sahip olmasının gerekli olmasıdır. "Financial Eleven" raporuna göre yorumcuların soru tipini belirlemesi ve ardından beş cevabı sırasıyla puanlaması ve sıralaması gerekiyor. Puan aralığı 0-5 puandır. Puan 3 puanın altındaysa özel nedenler belirtilmelidir. “Cevap sorunun sorulduğu gibi değil (0 puan)”, “ciddi konu dışı (1 puan)”, “mantıksal problemler ve olgusal hatalar var ve oran küçük ve 2 puan verildi" vb.
Veri açıklamasının bir diğer popüler alanı ise otonom sürüş. Deloitte raporuna göre, otonom sürüş alanındaki etiketleme talebi 2022 yılında tüm yapay zeka uygulamalarının %38'ini oluşturacak ve bu oranın 2027 yılına kadar %52'ye çıkması bekleniyor. Otonom sürüş alanındaki modeller için, büyük dil modelleriyle karşılaştırıldığında, bu basit kutu çekme operasyonlarının akademik gereksinimleri hâlâ nispeten gevşek.
Annotatörler, mobil internet çağından yapay zeka çağına kadar insanoğlunun temel taşıdır.Tech Planet'in temas kurduğu uygulayıcıların çoğu, yapay zekanın kendilerine getireceği değişiklikleri ve yapay zekanın gelişimine yaptıkları katkıları bilmiyor. Yapay Zeka: Bunlar İnternet çağındaki yeni nesil vidalardır ve herhangi bir zamanda değiştirilebilirler.
(Not: Makaledeki karakterlerin tamamı takma adlardır.)