Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur
** Beklentiler ve yıkım aynı anda mevcuttur ve veri etiketleme uygulayıcıları hiç bu kadar çelişkili olmamıştı. **
30 yaşında bir İç Moğol olan Dai Yan, işine bu yılın başlarında başladı ve yaklaşık 30 kişilik bir çevrimiçi etiketleme ekibi kurdu. Daha önce Daiyan, iki yıl boyunca veri açıklamaları için bir kitle kaynak platformunda çalıştı. "Nitelikli işçi" olarak adlandırılabilecek olan kişi, mevcut durumu hem sabırsızlıkla bekliyor hem de tedirgin ediyor.
Yılın başından beri ChatGPT'ye dikkat ediyor. AI şirketlerinin kayıt sayısındaki hızlı artıştan Dai Yan, AI endüstrisindeki patlamayı ve veri etiketlemenin girişimcilik fırsatlarını gördü. **Tianyancha verileri, yalnızca bu yılın ilk çeyreğinde yapay zeka ile ilgili 170.000 şirketin yeni tescil edildiğini ve toplam sayının şu anda 2,67 milyon olduğunu gösteriyor. **
Sektörü takip edebileceğini ve şirketin ileride 100 kişilik bir skalaya ulaşacağını hayal ediyor. **Ancak mevcut statükonun beklentilerini karşılaması zor: veri etiketleme çemberi yakında kırılacak - çok sayıda etiketleme ihtiyacı, etiketleme işçileri ve aracılar bir araya gelecek ve birim fiyat daha düşük olacak. **
Tıpkı mühendislik ekibinin inşaat ihtiyacı olan A Tarafı ile temasa geçememesi ve projeyi yalnızca müteahhitten devralabilmesi gibi, **Daiyan'ın temasa geçtiği ücretler proje el değiştirdikçe daha da düşüyor. **Günde yalnızca 30 yuan alabildiği etiketleme projesini yapmayı reddetti.
Aynı zamanda, ** Daiyan ayrıca etiketleme endüstrisinde kariyer terfisi olmamasının, sözleşme garantisinin olmamasının ve ertelenmekten şikayet etmenin hiçbir yolunun olmamasının utancıyla karşı karşıyadır. **Kendi kendine güldü: "Biz yeni çağın veri göçmeni işçileriyiz."
Ama hikayenin tamamı bu değil. **Daha büyük sorun, otomatik etiketlemenin sahip oldukları projeleri de tüketmesidir. ** Dai Yan gibi veri etiketleyicileri tarafından eğitilen yapay zeka, insan gözetimi altında öğreniyor ve kendini etiketliyor.
Otomatik etiketleme, kurumsal maliyetleri büyük ölçüde azaltacak ve veri etiketleme pazarında en umut verici yön haline geldi.
Daiyan, "AI tamamen insanların yerini alabilir" için hazırlanmak zorunda kaldı. Ekibin, metin açıklama kategorisinde öğretim yardımı açıklama ve 3D nokta bulutu açıklama projelerini aynı anda yapmasına öncülük etti. Biri metin, diğeri görüntü videosu. Dai Yan, bir proje yapay zeka tarafından bozulursa ekibin hemen başka bir alana geçmesine öncülük edeceğine dair bir plan yaptı.
Ek olarak, takım büyüklüğü azaltılmalıdır. Dai Yan, kafasında hayal ettiği 100 kişilik şirketin ölçeğini çizdi. Sonunda ancak 20 kişilik deneyimli ekibin elde tutulabileceğine inanıyor.
**Veri etiketleyicileri tarafından eğitilen bu yapay zekalar, onları altüst olmayı planlamaya zorlarken daha fazla kazanma hayali kurmalarına neden olur. **
1. İşaretleme, yapay zekanın dünyayı görmek için gözlerini açmasına izin verin
Makinelerin metin, ses ve resimleri insanlar gibi anlaması için insanlar bir makine öğrenimi zinciri oluşturmuştur: fiziksel dünyadaki fiziksel görüntüleri ve sesleri toplamak, verileri etiketlemek ve temizlemek, verileri bir dizi koda dönüştürmek ve göndermek makineye
AI bilim adamları, üç yaşındaki bebeklerin, dünyayı tekrar tekrar anlayarak yüz milyonlarca fotoğrafı gözlerinden "çektiklerine" inanıyor. Makineye yeterli veri verildiği sürece, makine aynı zamanda cümleleri okumayı ve tanımayı öğrenebilir ve sonunda dilin ardındaki derin anlamı anlayabilir.
Etiketli atlas ImageNet'te 15 milyon resim var.Bu veri seti, sayısız AI şirketinin yüz tanıma ve görüntü arama gibi bilgisayar görüşünde çığır açmasına yardımcı oldu.
ImageNet'i oluşturmak için, dünya çapında 167 ülkeden yaklaşık 50.000 veri etiketleyici, iki buçuk yıl boyunca birlikte çalıştı ve hepsi kitle kaynak platformu Mechanical Turk'ten geliyor.
Etiketleme gereksinimleri çok basit, MTurk'ün ortak görevi, fotoğrafın rengini ayırt etmek veya görüntüde görünen hayvanları sınıflandırmak veya seçilen nesneleri çerçevelemek ve adlarını etiketlemek için kutular kullanmak: bu bir pasta, bu bir araba, Bu bir bulut vb.
Grafik/Tamsayı Zekası
Platformdaki 200.000 yarı zamanlı çalışan, işgücü maliyetlerinin düşük olduğu ve hatta karakteristik bir "veri açıklama köyü" oluşturduğu Afrika ve Güneydoğu Asya'ya dağılmıştır. İşaretledikleri veriler, yapay zekadaki teknoloji şirketlerinin keşfini destekler.
Çin'de, Guizhou, Shanxi, Shandong, Henan ve diğer eyaletlerdeki ikinci ve üçüncü kademe şehirlerde milyonlarca noter dağıtılıyor ve kademeli olarak daha düşük işçilik maliyetleri olan ilçelere giriyor. Ya çevrimiçi kitle kaynak platformlarına güveniyorlar ya da çevrimdışı veri etiketleme şirketlerine ve etiketleme üslerine katılıyorlar. **
Ek açıklama içeriği, makinenin okuryazarlık kazanmasına yardımcı olma, resim tanıma ve ses dinleme işlevlerine karşılık gelen sahneye göre metin, görüntü ve sese bölünmüştür.
İlk ek açıklama projeleri, esas olarak ses ve metin açıklamaları olmak üzere İnternet şirketlerine odaklandı. Şimdi, nokta bulutu etiketleme gibi lidar taramayla elde edilen 3D sahneleri etiketlemek veya daha dikey metin ve ses etiketleme yönergeleri için kendi kendini yöneten şirketlere yöneliyor: eğitim şirketlerinin büyük modeller veya tıbbi kurumlar için öğretim yardımcı etiketleme verileri sağlamasına yardımcı olmak için Büyük model, harmanlanmış tıbbi veriler sağlar.
AI 2.0 çağına girdiğinde, ChatGPT yatırımcıları, girişimcileri ve girişimcileri hayrete düşürdü. Herkesin AI'dan beklentisi sadece metin, ses ve resim bilgilerini katı bir şekilde tanımak değildir. İnsanlar ayrıca, AI'nın insanlar gibi şeyler arasındaki bağlantıyı gerçekten anlayabileceğini, eylemlerin ardındaki ince farklılıkları ve duyguları tanıyabileceğini ve aktif olarak ayırt edip bilgi toplayabileceğini umuyor.
Örneğin kendi kendine giden araba, önündeki benzer renk ve büyüklükteki bir taşı değil, önündeki boş bir plastik poşeti ayırt etsin, havuzun yanındaki kamera artık sadece havuzun başında olanları kaydetmekle kalmayıp, ne olduğunu anlasın. oldu ve birisi boğulduğunda Uyarı.
Bunların yine de veri açıklamalarına dayanması ve açıklama için daha yüksek gereksinimler ortaya koyması gerekir - daha dikey, daha doğru ve daha ekonomik.
Etiketleme pazarındaki yükseliş de buradan başladı.
2. "Yetiştirilmesi gereken çok fazla sipariş var"
Yeni ek açıklamalara yönelik talepteki artışı doğrudan açıklayan verilere sahip olmak zordur, ancak bunu yargılamak zor değildir. Çünkü yalnızca 2023'ün ilk çeyreğinde Çin 170.000 yapay zeka şirketini bünyesine kattı ve yapay zeka kullanan bir şirket olduğu sürece veri etiketleme konusunda mutlaka bir talep olacaktır.
Talep hızla veri etiketleme pazarına yayıldı. Veri ek açıklama uygulayıcılarının bir araya geldiği gönderi çubuğunda, metin açıklama, konu inceleme, drone satış video açıklama, 2B algılama çubuğu, 3B nokta bulutu vb. metinden görüntüye videolar için öğeler.
Uzun yıllardır sektörde yer alan bir veri etiketleyici, bu yılki insansız araç etiketleme projelerinin arttığını ve AI2.0 patlamasının doğurduğu dikey alanda büyük ölçekli model girişimciliğinin başlangıçta azalan metin etiketleme projelerine izin verdiğini fark etti. farklı parçalara bölünmüş olması, niş veri etiketleme talebini de artırır.
Talebe göre hareket eden Daiyan, altın aramak için yeni bir ekip kuran tek kişi değil. Shandong, Dongying'den Zhang Wei de geçen yılın sonunda kendini veri etiketlemeye adamaya başladı ve altı ay içinde bir düzineden fazla kişiden oluşan küçük bir ekibe dönüştü. Sübvansiyonlara ve yerel hükümetin desteğine güvenen Zhang Wei'nin şirketi, yalnızca ücretsiz bir ofis elde etmekle kalmadı, aynı zamanda hükümet, Parti A'dan kaynakların kanalize edilmesine de yardımcı oldu.
100.000 yuan'dan fazla ilk projeden 400.000 yuan'lık son siparişe kadar çok sayıda proje siparişi var, acil teslimat görevi Zhang Wei'yi daha aktif bir şekilde etiketleme işçileri aramaya itti: birkaç gün önce, Zhang Wei 6 bilgisayar daha satın aldı sadece bir gün içinde.
Henan, Zhengzhou'da, veri açıklamaları için bir kitle kaynak platformu, 100 kişiyi barındırabilen iki katlı bir ofis binasına taşınıyor. Kapıda ve ofiste bulunan tabelaya şirketin konumunu yazıyorlar: "AI yapay zeka büyük veri araştırma ve geliştirme üssü" "tekrarlanan veri temizleme, AI'nızın daha akıllı olması içindir".
Sorumlu kişi, "Etiketleme projesinin yapılması için çok fazla sipariş var" dedi.
Bir veri etiketleme şirketinin yer değiştirme töreni
Görüntü kaynağı/görüşme yapılan kişiler tarafından sağlandı
Etiket şirketlerinin cebine de uzun süre sıcak para girdi. Verilere göre lider şirket Haitian AAC'nin hisse fiyatı bu yıl Mart'tan Mayıs'a kadar 4 kata kadar yükseldi.
36 Krypton haberine göre, bu yılın başından bu yana, B turunda ve öncesinde bir düzineden fazla veri etiketleme platformu, toplu olarak yaklaşık %100'lük bir artışla yüksek değerlemelere öncülük etti. Geçen yılın ikinci yarısından itibaren otomatik etiketleme firmaları art arda yeni finansman sağladı.
Eylül 2022'de Borden Intelligence 10 milyon yuan finansman aldı, Aralık ayında Stardust Data 50 milyon yuan'lık A-round finansmanını tamamladı.Haziran 2018'deki son finansmanın üzerinden dört buçuk yıl geçti.
Nisan 2023'te veri etiketleme çözümü şirketi "Kaiwang Data" yeni bir stratejik finansman turu aldı; Haziran ayında yapay zeka veri şirketi "Integer Intelligence" on milyonlarca Pre A turu finansmanı aldı.
Manüel etiketlemenin yerini alacak sloganlar atma hevesiyle dolular: "Veri etiketi üretimini yeniden yapılandırın", "Otomatik üretim hattı + büyük ölçekli insan gücü", "Otomatik sürüş etiketlemesinin manuel modunu kırın".
Açıkçası, sermaye piyasası da yeniden bu gelişen alana dikkat çekiyor.
3. Daha fazla hacim ve daha sıkı
Veri etiketleme zinciri üç bölümden oluşur.
Upstream: 1~150 çalışanı olan veri etiketleme şirketleri, çevrimiçi başıboş çalışanlar ve küçük atölyeler.
Midstream: Veri hizmeti sağlayıcıları, biri yukarı ve aşağı akışı üstlenen aracı kitle kaynak platformudur, diğeri ise işletmelerin sektöre istikrarlı yatırım için kendi etiketleme tabanlarını oluşturmayı seçmesidir.
Downstream: Teknoloji şirketleri, endüstri şirketleri, AI şirketleri ve bilimsel araştırma birimleri 2018 civarında internet şirketleri hakim oldu ve şimdi bunlar otomobil şirketlerine ve otonom sürüş şirketlerine devredildi.
Sektör genel olarak taşeronluk modelini benimser, yani birinci taraf firma ihaleyi verir ve üçüncü taraf hizmet sağlayıcı da ihaleye katılır.İhale başarılı olduktan sonra şirketin tedarikçi kademesine ve çekirdek tedarikçilere girer. öncelikli görevler ve daha fazla sipariş seçme hakkının tadını çıkarabilir.
İşletmenin ana tedarikçiler için gereksinimleri, en az 30 kişilik bir teslimat ekibine, olgun sipariş teslimat deneyimine, bir eğitim sistemi oluşturmaya ve teslimat kalitesini ve miktarını kontrol etme becerisine sahip olmaktır. İstikrarlı bir üretim ekibi nihayetinde şirketi daha rekabetçi hale getiren düşük bir teklife yol açar.
Ancak yönetim ve kontrol ekibinin getirdiği düşük fiyat avantajı sekteye uğradı. Bir hizmet sağlayıcı, "Jiazi Guangnian"a, "Bu yılki teklif şiddetli!" Dedi, "Bir proje için 200 yuan teklif ediyoruz ve bazı insanlar günde 80 yuan teklif ediyor."
Sonunda, proje en düşük teklifi veren takım tarafından kazanıldı, ancak daha olgun takıma geri döndü. "Bitiremediklerinde A Partisi tarafından bize geri transfer edildiler, ancak fiyat artık yükselemezdi."
Çünkü Daiyan'ın çevrimiçi ekibi, Taraf A ile doğrudan iletişime geçmez. Bu nedenle, çok katlı kaplama ve lamine fiyatlarının piyasadaki kaotik durumu onları baskı altında hissettiriyor.
Veri etiketleme, kaynak tabanlı bir endüstridir ve A Tarafı ile kim işbirliği yapabilirse, o avantaj elde edecektir. Dai Yan, bir şirketi kaydettikten sonra bazı kişilerin yanlış bir şekilde 40-50 kişilik profesyonel bir ekibe sahip olduklarını ve çok düşük bir fiyata ihaleye katıldıklarını iddia ettiklerini, projeyi kazandıktan sonra 4-5 hisseye bölüp dağıttıklarını açıkladı. Ekip daha da alta bölünür, komisyon katman katman toplanır, aradaki farkı aracı kazanır ve veri etiketleme çalışanlarına dağıtılan parça fiyatı gittikçe düşer. **
Birisi plakayı aldığı sürece, aşağı doğru sarmal olarak devam edecektir.
"Jiazi Guangnian" tarafından elde edilen bir fiyat listesi, 2D etiketlemeden 3D lazer nokta bulutu etiketlemeye kadar, etiketleme öğelerinin birim fiyatının çerçeve başına genellikle 0,5 ila 1,5 yuan olduğunu gösteriyor. Dai Yan bir keresinde %50 indirimli tek çerçeve fiyatı aldı, "en az dört veya beş el transfer edildi."
**Birim fiyatın içe dönük olması doğrudan etiketleme personelinin maaşının düşmesine neden olur. **Daiyanhe'nin ekibi yarı zamanlı tam zamanlı.Ekip üyelerinin çoğu anneler, üniversite öğrencileri, serbest çalışanlar ve meslek lisesi öğrencilerinden oluşuyor.Günde 6 saat çalışıyorlar. Bu halini koruyan Daiyan, 2022'deki salgın döneminde aylık 4 ila 5 bin yuan gelir elde edecek.
"Bilgisayarınız ve elektriğiniz varsa çalıştırabilirsiniz." Bu, veri etiketleme işe alım posterlerinde yaygın olarak kullanılan çekici bir ifadedir. Geçmişte, bu bir zamanlar veri etiketleme endüstrisinin en önemli avantajıydı. Ama bugün bu avantaj tüm sektörün involüsyona girmesine neden oldu. Şimdi Daiyan'ın aylık geliri sadece 2-3 bin yuan.
Gelirler düşerken iş yükleri düşmedi. Aksine, veri etiketleme işi daha karmaşık ve ayrıntılıdır.
Kıdemli veri ek açıklama uygulayıcıları, İnternet çağındaki açıklama pazarını kaçırıyor: tek bir çerçevenin fiyatı üç kat daha yüksek ve öğe sayısı çok fazla. 60-70 kişilik bir ekip aylık 300.000 yuan gelir elde edebilir. Bir uygulayıcı, "Artık piyasa, çıktı değeri (günde tek bir kişi tarafından üretilen değer) 100 yuan'dan daha az olan, eskiden günde yüzlerce doları bulan projelerle dolu." dedi.
O zamanlar projenin işletilmesi kolaydı ve herhangi bir gereklilik yoktu.Örneğin insansız araç için 2D sahneyi işaretlemek ve resimdeki aracın çerçevesini çizerken çerçevelenebildiği sürece, şart yok
**Fakat şimdi durum farklı.A Partisi için en önemli kabul kriteri "Fitness". ** Dai Yan, "Geçen yıl hata 5-7 mm olması gerekiyordu, bu yıl 3-5 mm olacak. Hata gereksinimi gittikçe küçülüyor." dedi.
Yapay zeka bilimcisi Wu Enda, yapay zekanın değerinin ancak etiketlenmiş yüksek kaliteli verilerle ortaya çıkabileceğini defalarca vurguladı. Yüksek kaliteli veriler ne kadar yüksek olursa, yapay zekanın gelişimi de o kadar hızlı olur.
İnsansız araçların etiketli verilerinde dikdörtgen çerçeve ile işaretlenen nesne arasındaki uyum derecesi olarak ifade edilmektedir.Uygunluk derecesi ne kadar yüksekse algoritmanın doğruluğu o kadar yüksek ve algoritmanın aracı o kadar hassas şekilde kontrol edebilmesi .
Yüksek kaliteli metin açıklama öğeleri, anlamsal anlamanın doğruluğuna ve soruları doğru yanıtlama oranına yansır. Doğru oran ne kadar yüksek olursa, eğitilen büyük model o kadar akıllı olur.
Becerikli eller, hızlı ve iyi veri iletimini sağlayabilir. Daiyan bir keresinde bir acemiden ChatGPT tarafından tamamlanan matematik problemlerinin tamamlanıp tamamlanmadığını, mantığın doğru olup olmadığını ve dilin ilkokul öğrencileri tarafından anlaşılıp anlaşılmadığını kontrol etmeye katılmasını istedi. Acemi tarafından işaretlenen 7.500 verinin doğruluk oranı çok düşük olduğu için Taraf A tarafından yeniden işlenmesi gerekti Dai Yan ve meslektaşlarının bunu düzeltmesi on günden fazla sürdü.
Veri etiketleme, eşiksiz bir iş olmaktan çıkıyor. Karmaşık sesli açıklama, tıbbi, yasal, finansal ve diğer profesyonel veri seti açıklama üretimi, profesyonel açıklama yapmak için konu bilgisi rezervine sahip profesyonelleri gerektirir.
Dai Yan, insansız araç projesini örnek alarak, yeni gelenlerin 2D etiketlemede yetkinleşmesinin 3 ay, 3D etiketlemede yetkinleşmesinin ise 4 ila 6 ay sürdüğüne inanıyor.
Bu tür bir alıştırma, çerçeve çizmenin doğruluğunu eğitmek, fareyi kullanarak bilgisayarın etiketleme sayfasına tek seferde dikdörtgen bir çerçeve çizmek, bu da çizgiye basmadan, eksik noktalar olmadan işaretli nesneyi doğru bir şekilde kaplayabilir ve hatta sorunsuz.
Şekil/veri açıklama uzmanları, açıklamadaki sorunlara dikkat çekiyor
Sadece makine kendi kendine öğrenmeye başladığında ve makineyi etiketlemek için insanın yerini aldığında, insanların eğitime zaman ayırdığı beceri hala anlamlı mı?
4. Alternatif kriz
Dai Yan, AI'nın yaklaştığını fark etti ve bu, bir süre önce yaptığı resim açıklama projesindeydi.
Bu, Daiyan'ın iki yıldır üzerinde çalıştığı eski bir proje - harita tanıma. Veri etiketleyicilerin resimdeki metni tanıması ve çıktı alması gerekir, fiyat adet başına 8 kuruştur. Uzantı adına işaretlenen veriler, görüntü tanıma modeline beslenir. Model artık resimlerdeki metni tanıma konusunda yetkin. Daiyan'ın etiketleme işi revizyon ve incelemeye indirgenmeye başlandı. Zorluk azaldı ve işaretli birim fiyatı da düştü.
** İnsanlar tarafından etiketleme ile eğitilen yapay zeka, insan etiketleme işinin yerini alıyor. **Zürih Üniversitesi'nin anket raporunda araştırmacılar, gerçek ölçüm yoluyla ChatGPT'nin 15 etiketleme görevindeki işleme yeteneğinin kitle kaynak sağlayıcılardan daha yüksek olduğunu bulmuşlardır. **Büyük modeli kitle kaynak platformuna yerleştirme ilerleme çubuğu da hızlandırıldı. **Lozan'daki Federal Teknoloji Enstitüsü tarafından yapılan müteakip araştırma, kitle kaynaklı açıklama yapanların %30'undan fazlasının metin açıklamalarını işlerken büyük modeller kullandığını ortaya çıkardı.
Yapay zeka şüphesiz el emeğine göre daha fazla zaman ve emek tasarrufu sağlar: Araştırmacılar, ChatGPT'nin birim maliyetinin MTurk'ün yalnızca 1/20'sine eşdeğer olduğunu söylediler.
Daiyan, bu iş kolunun her an "daha mükemmel yapay zeka" ile değiştirileceğine de hazırlıklı. Daha fazla beceri gerektiren kendi kendine sürüş etiketleri üzerine geleceğine bahse girdi.
Ancak otonom sürüş etiketlemesi de yapay zeka tarafından işgal ediliyor. Manuel çerçeve çizim yöntemiyle karşılaştırıldığında, otomatik etiketleme yalnızca dahili büyük bir model gerektirir.Parametre ayarından sonra, orijinal olarak manuel etiketleme gerektiren dikdörtgen çerçeve otomatik olarak oluşturulur. Şu anda tek sorun, oluşturulan dikdörtgen çerçevenin, tek tek manuel incelemeyi gerektiren çizgiye basma ve düşük uyum gibi kalite sorunlarına sahip olmasıdır.
Verimlilikteki iyileşme otomobil şirketlerini şaşırttı. İdeal olan, insanlardan 1000 kat daha verimli olan otomatik kalibrasyon için büyük model 2.0 kullanmaktır; Tesla, Amerikan çalışanlarına yardımcı sistemi iyileştirmek için Haziran 2022'de 200 Tesla etiketleme videosunu iptal etmek gibi otomatik etiketlemenin ilerlemesini aktif olarak teşvik ediyor, çünkü Tesla'nın otomatik etiketleme yeteneği büyük ölçüde geliştirildi, 60 saniyeden daha kısa 10.000 videoyu etiketleyin, birkaç ay boyunca manuel etiketleme yerine yalnızca bir hafta boyunca çalışacak büyük bir modele ihtiyaç duyar.
AI veri şirketi Integer Intelligence'ın kurucusu Lin Qunshu, giderek daha fazla otomobil şirketinin ve AIGC şirketinin otomatik etiketleme için büyük ölçekli model ürünleri kullandığını ve gelirlerinin önemli ölçüde arttığını söyledi. Son hamleleri ise Singapur'da bir araştırma ve geliştirme şubesi kurmak.
**Ancak, üçüncü taraf hizmet sağlayıcılar, otomatik etiketlemenin büyümesi konusunda o kadar iyimser değil. **Henan'daki bir kitle kaynak platformunun proje yöneticisi, otomatik etiketlemenin etiketleme gereksinimlerinin %60'ından fazlasının yerini alamayacağını ve yalnızca tek veya belirli verileri işlemek ve insan verimliliğini artırmak için yardımcı bir etiketleme aracı olarak kullanılabileceğini söyledi.
Başka bir veri etiketleme şirketinin ürün müdürü, otomatik etiketlemenin yalnızca basit temel verileri filtreleyebileceğine ve insanlar gibi karmaşık ve tartışmalı sahnelerdeki nesneleri doğru bir şekilde tanımlayamayacağına inanıyor. Bu aynı zamanda, veri etiketleme pazarına hala otonom sürüş etiketleme verilerinin hakim olmasının nedenidir.
Bununla birlikte, herkes gelecekteki veri etiketlemenin insan gücünden teknolojiye kayacağı konusunda hemfikirdir.
Kısacası, ya akranları tarafından "sıkıştırılmak" ya da teknoloji tarafından "sıkıştırılmak". Ama yine de hareketsiz oturmak kesinlikle mümkün değil ve verileri işaretleyen üçüncü taraf şirketler gelecekte bir çıkış yolu arıyor.
Daiyan'ın planı, piyasaya ayak uydurmak, tetikte olmak, personeli istediği zaman işten çıkarmak ve aynı zamanda otomatik bir etiketleme aracı doğrultusunda gelişmek. Bir kitle kaynak platformunun kurucusu, meslektaşlarıyla iletişim kurarken gelecekte insan gücü biriktirmememiz gerektiğini, ancak araştırma ve geliştirme yeteneklerine sahip olmamız gerektiğini söyledi.
Peki ya bireyler? Sektörde dolaşan kariyer yolu, acemi etiketçiler-deneyimli etiketçiler-etiketleme proje yöneticileri/yöneticiler-taraf A'nın şirket veri analistleri ve sonunda on binlerce aylık maaşla bir terfi elde etmektir.
Dai Yan'ın tanıdığı veri etiketleyicilerin hiçbiri bu yöne gitmiyordu.Ya oldukları yerde kaldılar ya da istifa ettiler.En iyi seçenek, Dai Yan'ın yaptığı gibi kendi etiketleme ekiplerini kurmaktı, ama o daha kolay hissetmedi.
Bir yanda yapay zeka trendinin getirdiği proje talebindeki artış varken diğer yanda daha kaotik teklif verme, kişi başına düşen çıktı değerinin daha düşük olması ve hızla büyüyen yapay zeka var. İki duygu iç içe geçmiş durumda, yapay zeka sonsuz fırsatlar getirecek ve yapay zeka aynı zamanda "biz"i de ortadan kaldıracak.
(Görüşülenlerin isteği üzerine yazıdaki isimler müsteardır)
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Veri etiketleme çalışanları: eğitim yapay zekası, yerini yapay zekaya bırakıyor
Büyüme ve eliminasyon aynı anda gerçekleşir.
Yazar|Ma Hui
Düzenle|Kestane
** Beklentiler ve yıkım aynı anda mevcuttur ve veri etiketleme uygulayıcıları hiç bu kadar çelişkili olmamıştı. **
30 yaşında bir İç Moğol olan Dai Yan, işine bu yılın başlarında başladı ve yaklaşık 30 kişilik bir çevrimiçi etiketleme ekibi kurdu. Daha önce Daiyan, iki yıl boyunca veri açıklamaları için bir kitle kaynak platformunda çalıştı. "Nitelikli işçi" olarak adlandırılabilecek olan kişi, mevcut durumu hem sabırsızlıkla bekliyor hem de tedirgin ediyor.
Yılın başından beri ChatGPT'ye dikkat ediyor. AI şirketlerinin kayıt sayısındaki hızlı artıştan Dai Yan, AI endüstrisindeki patlamayı ve veri etiketlemenin girişimcilik fırsatlarını gördü. **Tianyancha verileri, yalnızca bu yılın ilk çeyreğinde yapay zeka ile ilgili 170.000 şirketin yeni tescil edildiğini ve toplam sayının şu anda 2,67 milyon olduğunu gösteriyor. **
Sektörü takip edebileceğini ve şirketin ileride 100 kişilik bir skalaya ulaşacağını hayal ediyor. **Ancak mevcut statükonun beklentilerini karşılaması zor: veri etiketleme çemberi yakında kırılacak - çok sayıda etiketleme ihtiyacı, etiketleme işçileri ve aracılar bir araya gelecek ve birim fiyat daha düşük olacak. **
Tıpkı mühendislik ekibinin inşaat ihtiyacı olan A Tarafı ile temasa geçememesi ve projeyi yalnızca müteahhitten devralabilmesi gibi, **Daiyan'ın temasa geçtiği ücretler proje el değiştirdikçe daha da düşüyor. **Günde yalnızca 30 yuan alabildiği etiketleme projesini yapmayı reddetti.
Aynı zamanda, ** Daiyan ayrıca etiketleme endüstrisinde kariyer terfisi olmamasının, sözleşme garantisinin olmamasının ve ertelenmekten şikayet etmenin hiçbir yolunun olmamasının utancıyla karşı karşıyadır. **Kendi kendine güldü: "Biz yeni çağın veri göçmeni işçileriyiz."
Ama hikayenin tamamı bu değil. **Daha büyük sorun, otomatik etiketlemenin sahip oldukları projeleri de tüketmesidir. ** Dai Yan gibi veri etiketleyicileri tarafından eğitilen yapay zeka, insan gözetimi altında öğreniyor ve kendini etiketliyor.
Otomatik etiketleme, kurumsal maliyetleri büyük ölçüde azaltacak ve veri etiketleme pazarında en umut verici yön haline geldi.
Daiyan, "AI tamamen insanların yerini alabilir" için hazırlanmak zorunda kaldı. Ekibin, metin açıklama kategorisinde öğretim yardımı açıklama ve 3D nokta bulutu açıklama projelerini aynı anda yapmasına öncülük etti. Biri metin, diğeri görüntü videosu. Dai Yan, bir proje yapay zeka tarafından bozulursa ekibin hemen başka bir alana geçmesine öncülük edeceğine dair bir plan yaptı.
Ek olarak, takım büyüklüğü azaltılmalıdır. Dai Yan, kafasında hayal ettiği 100 kişilik şirketin ölçeğini çizdi. Sonunda ancak 20 kişilik deneyimli ekibin elde tutulabileceğine inanıyor.
**Veri etiketleyicileri tarafından eğitilen bu yapay zekalar, onları altüst olmayı planlamaya zorlarken daha fazla kazanma hayali kurmalarına neden olur. **
1. İşaretleme, yapay zekanın dünyayı görmek için gözlerini açmasına izin verin
Makinelerin metin, ses ve resimleri insanlar gibi anlaması için insanlar bir makine öğrenimi zinciri oluşturmuştur: fiziksel dünyadaki fiziksel görüntüleri ve sesleri toplamak, verileri etiketlemek ve temizlemek, verileri bir dizi koda dönüştürmek ve göndermek makineye
AI bilim adamları, üç yaşındaki bebeklerin, dünyayı tekrar tekrar anlayarak yüz milyonlarca fotoğrafı gözlerinden "çektiklerine" inanıyor. Makineye yeterli veri verildiği sürece, makine aynı zamanda cümleleri okumayı ve tanımayı öğrenebilir ve sonunda dilin ardındaki derin anlamı anlayabilir.
Etiketli atlas ImageNet'te 15 milyon resim var.Bu veri seti, sayısız AI şirketinin yüz tanıma ve görüntü arama gibi bilgisayar görüşünde çığır açmasına yardımcı oldu.
ImageNet'i oluşturmak için, dünya çapında 167 ülkeden yaklaşık 50.000 veri etiketleyici, iki buçuk yıl boyunca birlikte çalıştı ve hepsi kitle kaynak platformu Mechanical Turk'ten geliyor.
Etiketleme gereksinimleri çok basit, MTurk'ün ortak görevi, fotoğrafın rengini ayırt etmek veya görüntüde görünen hayvanları sınıflandırmak veya seçilen nesneleri çerçevelemek ve adlarını etiketlemek için kutular kullanmak: bu bir pasta, bu bir araba, Bu bir bulut vb.
Platformdaki 200.000 yarı zamanlı çalışan, işgücü maliyetlerinin düşük olduğu ve hatta karakteristik bir "veri açıklama köyü" oluşturduğu Afrika ve Güneydoğu Asya'ya dağılmıştır. İşaretledikleri veriler, yapay zekadaki teknoloji şirketlerinin keşfini destekler.
Çin'de, Guizhou, Shanxi, Shandong, Henan ve diğer eyaletlerdeki ikinci ve üçüncü kademe şehirlerde milyonlarca noter dağıtılıyor ve kademeli olarak daha düşük işçilik maliyetleri olan ilçelere giriyor. Ya çevrimiçi kitle kaynak platformlarına güveniyorlar ya da çevrimdışı veri etiketleme şirketlerine ve etiketleme üslerine katılıyorlar. **
Ek açıklama içeriği, makinenin okuryazarlık kazanmasına yardımcı olma, resim tanıma ve ses dinleme işlevlerine karşılık gelen sahneye göre metin, görüntü ve sese bölünmüştür.
İlk ek açıklama projeleri, esas olarak ses ve metin açıklamaları olmak üzere İnternet şirketlerine odaklandı. Şimdi, nokta bulutu etiketleme gibi lidar taramayla elde edilen 3D sahneleri etiketlemek veya daha dikey metin ve ses etiketleme yönergeleri için kendi kendini yöneten şirketlere yöneliyor: eğitim şirketlerinin büyük modeller veya tıbbi kurumlar için öğretim yardımcı etiketleme verileri sağlamasına yardımcı olmak için Büyük model, harmanlanmış tıbbi veriler sağlar.
AI 2.0 çağına girdiğinde, ChatGPT yatırımcıları, girişimcileri ve girişimcileri hayrete düşürdü. Herkesin AI'dan beklentisi sadece metin, ses ve resim bilgilerini katı bir şekilde tanımak değildir. İnsanlar ayrıca, AI'nın insanlar gibi şeyler arasındaki bağlantıyı gerçekten anlayabileceğini, eylemlerin ardındaki ince farklılıkları ve duyguları tanıyabileceğini ve aktif olarak ayırt edip bilgi toplayabileceğini umuyor.
Örneğin kendi kendine giden araba, önündeki benzer renk ve büyüklükteki bir taşı değil, önündeki boş bir plastik poşeti ayırt etsin, havuzun yanındaki kamera artık sadece havuzun başında olanları kaydetmekle kalmayıp, ne olduğunu anlasın. oldu ve birisi boğulduğunda Uyarı.
Bunların yine de veri açıklamalarına dayanması ve açıklama için daha yüksek gereksinimler ortaya koyması gerekir - daha dikey, daha doğru ve daha ekonomik.
Etiketleme pazarındaki yükseliş de buradan başladı.
2. "Yetiştirilmesi gereken çok fazla sipariş var"
Yeni ek açıklamalara yönelik talepteki artışı doğrudan açıklayan verilere sahip olmak zordur, ancak bunu yargılamak zor değildir. Çünkü yalnızca 2023'ün ilk çeyreğinde Çin 170.000 yapay zeka şirketini bünyesine kattı ve yapay zeka kullanan bir şirket olduğu sürece veri etiketleme konusunda mutlaka bir talep olacaktır.
Talep hızla veri etiketleme pazarına yayıldı. Veri ek açıklama uygulayıcılarının bir araya geldiği gönderi çubuğunda, metin açıklama, konu inceleme, drone satış video açıklama, 2B algılama çubuğu, 3B nokta bulutu vb. metinden görüntüye videolar için öğeler.
Uzun yıllardır sektörde yer alan bir veri etiketleyici, bu yılki insansız araç etiketleme projelerinin arttığını ve AI2.0 patlamasının doğurduğu dikey alanda büyük ölçekli model girişimciliğinin başlangıçta azalan metin etiketleme projelerine izin verdiğini fark etti. farklı parçalara bölünmüş olması, niş veri etiketleme talebini de artırır.
Talebe göre hareket eden Daiyan, altın aramak için yeni bir ekip kuran tek kişi değil. Shandong, Dongying'den Zhang Wei de geçen yılın sonunda kendini veri etiketlemeye adamaya başladı ve altı ay içinde bir düzineden fazla kişiden oluşan küçük bir ekibe dönüştü. Sübvansiyonlara ve yerel hükümetin desteğine güvenen Zhang Wei'nin şirketi, yalnızca ücretsiz bir ofis elde etmekle kalmadı, aynı zamanda hükümet, Parti A'dan kaynakların kanalize edilmesine de yardımcı oldu.
100.000 yuan'dan fazla ilk projeden 400.000 yuan'lık son siparişe kadar çok sayıda proje siparişi var, acil teslimat görevi Zhang Wei'yi daha aktif bir şekilde etiketleme işçileri aramaya itti: birkaç gün önce, Zhang Wei 6 bilgisayar daha satın aldı sadece bir gün içinde.
Henan, Zhengzhou'da, veri açıklamaları için bir kitle kaynak platformu, 100 kişiyi barındırabilen iki katlı bir ofis binasına taşınıyor. Kapıda ve ofiste bulunan tabelaya şirketin konumunu yazıyorlar: "AI yapay zeka büyük veri araştırma ve geliştirme üssü" "tekrarlanan veri temizleme, AI'nızın daha akıllı olması içindir".
Sorumlu kişi, "Etiketleme projesinin yapılması için çok fazla sipariş var" dedi.
Görüntü kaynağı/görüşme yapılan kişiler tarafından sağlandı
Etiket şirketlerinin cebine de uzun süre sıcak para girdi. Verilere göre lider şirket Haitian AAC'nin hisse fiyatı bu yıl Mart'tan Mayıs'a kadar 4 kata kadar yükseldi.
36 Krypton haberine göre, bu yılın başından bu yana, B turunda ve öncesinde bir düzineden fazla veri etiketleme platformu, toplu olarak yaklaşık %100'lük bir artışla yüksek değerlemelere öncülük etti. Geçen yılın ikinci yarısından itibaren otomatik etiketleme firmaları art arda yeni finansman sağladı.
Eylül 2022'de Borden Intelligence 10 milyon yuan finansman aldı, Aralık ayında Stardust Data 50 milyon yuan'lık A-round finansmanını tamamladı.Haziran 2018'deki son finansmanın üzerinden dört buçuk yıl geçti.
Nisan 2023'te veri etiketleme çözümü şirketi "Kaiwang Data" yeni bir stratejik finansman turu aldı; Haziran ayında yapay zeka veri şirketi "Integer Intelligence" on milyonlarca Pre A turu finansmanı aldı.
Manüel etiketlemenin yerini alacak sloganlar atma hevesiyle dolular: "Veri etiketi üretimini yeniden yapılandırın", "Otomatik üretim hattı + büyük ölçekli insan gücü", "Otomatik sürüş etiketlemesinin manuel modunu kırın".
Açıkçası, sermaye piyasası da yeniden bu gelişen alana dikkat çekiyor.
3. Daha fazla hacim ve daha sıkı
Veri etiketleme zinciri üç bölümden oluşur.
Upstream: 1~150 çalışanı olan veri etiketleme şirketleri, çevrimiçi başıboş çalışanlar ve küçük atölyeler.
Midstream: Veri hizmeti sağlayıcıları, biri yukarı ve aşağı akışı üstlenen aracı kitle kaynak platformudur, diğeri ise işletmelerin sektöre istikrarlı yatırım için kendi etiketleme tabanlarını oluşturmayı seçmesidir.
Downstream: Teknoloji şirketleri, endüstri şirketleri, AI şirketleri ve bilimsel araştırma birimleri 2018 civarında internet şirketleri hakim oldu ve şimdi bunlar otomobil şirketlerine ve otonom sürüş şirketlerine devredildi.
Sektör genel olarak taşeronluk modelini benimser, yani birinci taraf firma ihaleyi verir ve üçüncü taraf hizmet sağlayıcı da ihaleye katılır.İhale başarılı olduktan sonra şirketin tedarikçi kademesine ve çekirdek tedarikçilere girer. öncelikli görevler ve daha fazla sipariş seçme hakkının tadını çıkarabilir.
İşletmenin ana tedarikçiler için gereksinimleri, en az 30 kişilik bir teslimat ekibine, olgun sipariş teslimat deneyimine, bir eğitim sistemi oluşturmaya ve teslimat kalitesini ve miktarını kontrol etme becerisine sahip olmaktır. İstikrarlı bir üretim ekibi nihayetinde şirketi daha rekabetçi hale getiren düşük bir teklife yol açar.
Ancak yönetim ve kontrol ekibinin getirdiği düşük fiyat avantajı sekteye uğradı. Bir hizmet sağlayıcı, "Jiazi Guangnian"a, "Bu yılki teklif şiddetli!" Dedi, "Bir proje için 200 yuan teklif ediyoruz ve bazı insanlar günde 80 yuan teklif ediyor."
Sonunda, proje en düşük teklifi veren takım tarafından kazanıldı, ancak daha olgun takıma geri döndü. "Bitiremediklerinde A Partisi tarafından bize geri transfer edildiler, ancak fiyat artık yükselemezdi."
Çünkü Daiyan'ın çevrimiçi ekibi, Taraf A ile doğrudan iletişime geçmez. Bu nedenle, çok katlı kaplama ve lamine fiyatlarının piyasadaki kaotik durumu onları baskı altında hissettiriyor.
Veri etiketleme, kaynak tabanlı bir endüstridir ve A Tarafı ile kim işbirliği yapabilirse, o avantaj elde edecektir. Dai Yan, bir şirketi kaydettikten sonra bazı kişilerin yanlış bir şekilde 40-50 kişilik profesyonel bir ekibe sahip olduklarını ve çok düşük bir fiyata ihaleye katıldıklarını iddia ettiklerini, projeyi kazandıktan sonra 4-5 hisseye bölüp dağıttıklarını açıkladı. Ekip daha da alta bölünür, komisyon katman katman toplanır, aradaki farkı aracı kazanır ve veri etiketleme çalışanlarına dağıtılan parça fiyatı gittikçe düşer. **
Birisi plakayı aldığı sürece, aşağı doğru sarmal olarak devam edecektir.
"Jiazi Guangnian" tarafından elde edilen bir fiyat listesi, 2D etiketlemeden 3D lazer nokta bulutu etiketlemeye kadar, etiketleme öğelerinin birim fiyatının çerçeve başına genellikle 0,5 ila 1,5 yuan olduğunu gösteriyor. Dai Yan bir keresinde %50 indirimli tek çerçeve fiyatı aldı, "en az dört veya beş el transfer edildi."
**Birim fiyatın içe dönük olması doğrudan etiketleme personelinin maaşının düşmesine neden olur. **Daiyanhe'nin ekibi yarı zamanlı tam zamanlı.Ekip üyelerinin çoğu anneler, üniversite öğrencileri, serbest çalışanlar ve meslek lisesi öğrencilerinden oluşuyor.Günde 6 saat çalışıyorlar. Bu halini koruyan Daiyan, 2022'deki salgın döneminde aylık 4 ila 5 bin yuan gelir elde edecek.
"Bilgisayarınız ve elektriğiniz varsa çalıştırabilirsiniz." Bu, veri etiketleme işe alım posterlerinde yaygın olarak kullanılan çekici bir ifadedir. Geçmişte, bu bir zamanlar veri etiketleme endüstrisinin en önemli avantajıydı. Ama bugün bu avantaj tüm sektörün involüsyona girmesine neden oldu. Şimdi Daiyan'ın aylık geliri sadece 2-3 bin yuan.
Gelirler düşerken iş yükleri düşmedi. Aksine, veri etiketleme işi daha karmaşık ve ayrıntılıdır.
Kıdemli veri ek açıklama uygulayıcıları, İnternet çağındaki açıklama pazarını kaçırıyor: tek bir çerçevenin fiyatı üç kat daha yüksek ve öğe sayısı çok fazla. 60-70 kişilik bir ekip aylık 300.000 yuan gelir elde edebilir. Bir uygulayıcı, "Artık piyasa, çıktı değeri (günde tek bir kişi tarafından üretilen değer) 100 yuan'dan daha az olan, eskiden günde yüzlerce doları bulan projelerle dolu." dedi.
O zamanlar projenin işletilmesi kolaydı ve herhangi bir gereklilik yoktu.Örneğin insansız araç için 2D sahneyi işaretlemek ve resimdeki aracın çerçevesini çizerken çerçevelenebildiği sürece, şart yok
**Fakat şimdi durum farklı.A Partisi için en önemli kabul kriteri "Fitness". ** Dai Yan, "Geçen yıl hata 5-7 mm olması gerekiyordu, bu yıl 3-5 mm olacak. Hata gereksinimi gittikçe küçülüyor." dedi.
Yapay zeka bilimcisi Wu Enda, yapay zekanın değerinin ancak etiketlenmiş yüksek kaliteli verilerle ortaya çıkabileceğini defalarca vurguladı. Yüksek kaliteli veriler ne kadar yüksek olursa, yapay zekanın gelişimi de o kadar hızlı olur.
İnsansız araçların etiketli verilerinde dikdörtgen çerçeve ile işaretlenen nesne arasındaki uyum derecesi olarak ifade edilmektedir.Uygunluk derecesi ne kadar yüksekse algoritmanın doğruluğu o kadar yüksek ve algoritmanın aracı o kadar hassas şekilde kontrol edebilmesi .
Yüksek kaliteli metin açıklama öğeleri, anlamsal anlamanın doğruluğuna ve soruları doğru yanıtlama oranına yansır. Doğru oran ne kadar yüksek olursa, eğitilen büyük model o kadar akıllı olur.
Becerikli eller, hızlı ve iyi veri iletimini sağlayabilir. Daiyan bir keresinde bir acemiden ChatGPT tarafından tamamlanan matematik problemlerinin tamamlanıp tamamlanmadığını, mantığın doğru olup olmadığını ve dilin ilkokul öğrencileri tarafından anlaşılıp anlaşılmadığını kontrol etmeye katılmasını istedi. Acemi tarafından işaretlenen 7.500 verinin doğruluk oranı çok düşük olduğu için Taraf A tarafından yeniden işlenmesi gerekti Dai Yan ve meslektaşlarının bunu düzeltmesi on günden fazla sürdü.
Veri etiketleme, eşiksiz bir iş olmaktan çıkıyor. Karmaşık sesli açıklama, tıbbi, yasal, finansal ve diğer profesyonel veri seti açıklama üretimi, profesyonel açıklama yapmak için konu bilgisi rezervine sahip profesyonelleri gerektirir.
Dai Yan, insansız araç projesini örnek alarak, yeni gelenlerin 2D etiketlemede yetkinleşmesinin 3 ay, 3D etiketlemede yetkinleşmesinin ise 4 ila 6 ay sürdüğüne inanıyor.
Bu tür bir alıştırma, çerçeve çizmenin doğruluğunu eğitmek, fareyi kullanarak bilgisayarın etiketleme sayfasına tek seferde dikdörtgen bir çerçeve çizmek, bu da çizgiye basmadan, eksik noktalar olmadan işaretli nesneyi doğru bir şekilde kaplayabilir ve hatta sorunsuz.
Sadece makine kendi kendine öğrenmeye başladığında ve makineyi etiketlemek için insanın yerini aldığında, insanların eğitime zaman ayırdığı beceri hala anlamlı mı?
4. Alternatif kriz
Dai Yan, AI'nın yaklaştığını fark etti ve bu, bir süre önce yaptığı resim açıklama projesindeydi.
Bu, Daiyan'ın iki yıldır üzerinde çalıştığı eski bir proje - harita tanıma. Veri etiketleyicilerin resimdeki metni tanıması ve çıktı alması gerekir, fiyat adet başına 8 kuruştur. Uzantı adına işaretlenen veriler, görüntü tanıma modeline beslenir. Model artık resimlerdeki metni tanıma konusunda yetkin. Daiyan'ın etiketleme işi revizyon ve incelemeye indirgenmeye başlandı. Zorluk azaldı ve işaretli birim fiyatı da düştü.
** İnsanlar tarafından etiketleme ile eğitilen yapay zeka, insan etiketleme işinin yerini alıyor. **Zürih Üniversitesi'nin anket raporunda araştırmacılar, gerçek ölçüm yoluyla ChatGPT'nin 15 etiketleme görevindeki işleme yeteneğinin kitle kaynak sağlayıcılardan daha yüksek olduğunu bulmuşlardır. **Büyük modeli kitle kaynak platformuna yerleştirme ilerleme çubuğu da hızlandırıldı. **Lozan'daki Federal Teknoloji Enstitüsü tarafından yapılan müteakip araştırma, kitle kaynaklı açıklama yapanların %30'undan fazlasının metin açıklamalarını işlerken büyük modeller kullandığını ortaya çıkardı.
Yapay zeka şüphesiz el emeğine göre daha fazla zaman ve emek tasarrufu sağlar: Araştırmacılar, ChatGPT'nin birim maliyetinin MTurk'ün yalnızca 1/20'sine eşdeğer olduğunu söylediler.
Daiyan, bu iş kolunun her an "daha mükemmel yapay zeka" ile değiştirileceğine de hazırlıklı. Daha fazla beceri gerektiren kendi kendine sürüş etiketleri üzerine geleceğine bahse girdi.
Ancak otonom sürüş etiketlemesi de yapay zeka tarafından işgal ediliyor. Manuel çerçeve çizim yöntemiyle karşılaştırıldığında, otomatik etiketleme yalnızca dahili büyük bir model gerektirir.Parametre ayarından sonra, orijinal olarak manuel etiketleme gerektiren dikdörtgen çerçeve otomatik olarak oluşturulur. Şu anda tek sorun, oluşturulan dikdörtgen çerçevenin, tek tek manuel incelemeyi gerektiren çizgiye basma ve düşük uyum gibi kalite sorunlarına sahip olmasıdır.
Verimlilikteki iyileşme otomobil şirketlerini şaşırttı. İdeal olan, insanlardan 1000 kat daha verimli olan otomatik kalibrasyon için büyük model 2.0 kullanmaktır; Tesla, Amerikan çalışanlarına yardımcı sistemi iyileştirmek için Haziran 2022'de 200 Tesla etiketleme videosunu iptal etmek gibi otomatik etiketlemenin ilerlemesini aktif olarak teşvik ediyor, çünkü Tesla'nın otomatik etiketleme yeteneği büyük ölçüde geliştirildi, 60 saniyeden daha kısa 10.000 videoyu etiketleyin, birkaç ay boyunca manuel etiketleme yerine yalnızca bir hafta boyunca çalışacak büyük bir modele ihtiyaç duyar.
AI veri şirketi Integer Intelligence'ın kurucusu Lin Qunshu, giderek daha fazla otomobil şirketinin ve AIGC şirketinin otomatik etiketleme için büyük ölçekli model ürünleri kullandığını ve gelirlerinin önemli ölçüde arttığını söyledi. Son hamleleri ise Singapur'da bir araştırma ve geliştirme şubesi kurmak.
**Ancak, üçüncü taraf hizmet sağlayıcılar, otomatik etiketlemenin büyümesi konusunda o kadar iyimser değil. **Henan'daki bir kitle kaynak platformunun proje yöneticisi, otomatik etiketlemenin etiketleme gereksinimlerinin %60'ından fazlasının yerini alamayacağını ve yalnızca tek veya belirli verileri işlemek ve insan verimliliğini artırmak için yardımcı bir etiketleme aracı olarak kullanılabileceğini söyledi.
Başka bir veri etiketleme şirketinin ürün müdürü, otomatik etiketlemenin yalnızca basit temel verileri filtreleyebileceğine ve insanlar gibi karmaşık ve tartışmalı sahnelerdeki nesneleri doğru bir şekilde tanımlayamayacağına inanıyor. Bu aynı zamanda, veri etiketleme pazarına hala otonom sürüş etiketleme verilerinin hakim olmasının nedenidir.
Bununla birlikte, herkes gelecekteki veri etiketlemenin insan gücünden teknolojiye kayacağı konusunda hemfikirdir.
Kısacası, ya akranları tarafından "sıkıştırılmak" ya da teknoloji tarafından "sıkıştırılmak". Ama yine de hareketsiz oturmak kesinlikle mümkün değil ve verileri işaretleyen üçüncü taraf şirketler gelecekte bir çıkış yolu arıyor.
Daiyan'ın planı, piyasaya ayak uydurmak, tetikte olmak, personeli istediği zaman işten çıkarmak ve aynı zamanda otomatik bir etiketleme aracı doğrultusunda gelişmek. Bir kitle kaynak platformunun kurucusu, meslektaşlarıyla iletişim kurarken gelecekte insan gücü biriktirmememiz gerektiğini, ancak araştırma ve geliştirme yeteneklerine sahip olmamız gerektiğini söyledi.
Peki ya bireyler? Sektörde dolaşan kariyer yolu, acemi etiketçiler-deneyimli etiketçiler-etiketleme proje yöneticileri/yöneticiler-taraf A'nın şirket veri analistleri ve sonunda on binlerce aylık maaşla bir terfi elde etmektir.
Dai Yan'ın tanıdığı veri etiketleyicilerin hiçbiri bu yöne gitmiyordu.Ya oldukları yerde kaldılar ya da istifa ettiler.En iyi seçenek, Dai Yan'ın yaptığı gibi kendi etiketleme ekiplerini kurmaktı, ama o daha kolay hissetmedi.
Bir yanda yapay zeka trendinin getirdiği proje talebindeki artış varken diğer yanda daha kaotik teklif verme, kişi başına düşen çıktı değerinin daha düşük olması ve hızla büyüyen yapay zeka var. İki duygu iç içe geçmiş durumda, yapay zeka sonsuz fırsatlar getirecek ve yapay zeka aynı zamanda "biz"i de ortadan kaldıracak.
(Görüşülenlerin isteği üzerine yazıdaki isimler müsteardır)