Resim kredisi: Sınırsız AI tarafından oluşturuldu
Bu yılın ilk yarısında birinci sınıf şehirlerin teknoloji çemberleri yapay zeka ile harekete geçirildi.
Wenxinyiyan, Tongyiqianwen ve Light Years Away gibi büyük modeller ısı dalgasını dalga dalga yayıyor. Üst düzey kaynaklara sahip kodamanlar bu büyük etkinliğin merkezinde duruyor. Birbiri ardına kahraman yazıları gönderdiler. Büyükler için savaş- model yeteneği de masada.
AI endüstri zinciri ile yakından bağlantılı bir bağlantı olarak Pekin'e 500 kilometre uzaklıktaki Shanxi'deki Taiyuan Veri Endüstrisi Üssü sakin, binlerce yapay zeka etiketçisi burada toplandı. Konuştukları konular proje ilerlemesi, kutuyu standarda çekme oranı ve günde üç öğün yemek üzerine kaldı.
Times Finance'e konuşan bir veri etiketleyici, "Heyecan onların ve bizim elimizde yalnızca sayısız kutu var."
Veri etiketleme şirketinin sahibi He Qing'in anısına, heyecan dört ya da beş yıl önce yaşandı. Yapay zekanın bahar esintisi ilk kez bu orta batı kentine esti.Hassas işadamları, yapay zeka için sürekli bir "beslenme" akışı sağlayarak bölge oluşturmaya ve insanları işe almaya başladı. Çoğu, yapay zekanın sıradan insanları, ani büyük işgücü talebi nedeniyle, en son teknoloji ile harika bir bağları var.
"O zamanlar, birçok patron tüm aile üyelerini buraya getirdi ve sadece parmaklarını hareket ettirerek para kazanabiliyorlardı." He Qing, veri etiketleme endüstrisinde pek çok heyecan verici haber duydu - bazı insanlar üç ay içinde milyonlar kazanıyor ve diğerleri Kapanan siparişler ikinci yıla kadar kuyruğa alınabilir.
Ancak bu güzel günler yavaş yavaş kayboluyor.
Makul bir "boru hattı"
Sabah 8:45'te yoğun bir insan kalabalığı asansör girişini kapattı, insanların sadece üçte biri ilk asansöre sıkıştı ve herkesin son durağı altıncı kattı.
Asansörün kapısı yavaşça açıldı ve kalabalık dört bir yana dağılarak hiçbir farkın olmadığı ofislere girdi.Yaklaşık 100 metrekarelik alan yüzlerce bilgisayar ayağıyla doluydu.
"Ev numarasını takip edip tek tek sorduğun sürece hepsi verilerle işaretlenecek." Parkın zemin katındaki satıcı bu şekilde tarif etti.
Bine yakın kişinin ilgisini çeken bu veri etiketleme tabanı, parkın içine gizlenmiş gizli bir internet kafe gibidir.Bilgisayarların başında oturanlar ustaca klavye ve fareye tıklarlar ve yaklaşık bir metrekarelik masalar dolup taşar. devasa bilgisayarlar.
İş yerindeki veri etiketleyicisinin kaynağı: Fotoğraf: Times Finance
Bireyselliklerini gösterebilecek tek şey başlarına taktıkları renkli kulaklıklardır.Ortak bir kimlikleri vardır: veri etiketleyiciler.
Fare sol ve sağ düğmeleri ileri geri tıkladı ve ekrandaki resimler yakınlaştırıp uzaklaştırdı ve imleç hızla farklı boyutlarda çerçeveler çizdi... Yarım saat süren tekrarlanan eylemlerden sonra Meiling, boynunu hafifçe büktü ve omurgasındaki kemikler gıcırdayarak gıcırdadı.
Meiling, gözlerini ekrana dikmiş halde Times Finance'e verdiği demeçte, "Yeni gelenlerin ilk haftayı atlatması yeterli, alışması da çabuk oluyor" dedi. İlk haftada pes edenlerin sayısı %30'a kadar çıkıyor .
Her iki haftada bir, ustabaşı Bayan Zhou, bir düzineden fazla yeni gelenin çıraklık eğitimlerine başlamasına öncülük edecek.Böyle tekrarlayan ve sıkıcı işler birçok genci caydırdı.
Meiling, iki yıl önce bir anaokulu öğretmeninden bir veri etiketleyicisine dönüştü. Memleketi Luliang'da çok az iş var ve telefonla pazarlama en saygın yerlerden biri Şimdi, yapay zeka dalgasının etkisi altında, veri etiketleyiciler ilçedeki kadınlara başka bir seçenek sunuyor.
Altı ay önce, etiketleme üssünün değişmesi nedeniyle Meiling memleketinden eyalet başkenti Taiyuan'a taşındı. "Otomatik sürüş veya yüz tanıma, büyük ölçekli etiketleyicilerin katılımını gerektirmez." Aylık geliri 3.000 yuan'dan fazla olan bir ofiste oturan ve bilgisayar kullanan ailesinin gözünde gururlu bir görünüm sergiledi. , tedavi ilçenin çoğunu aştı.Zaten çalışıyor.
2005 yılında, bir bilgisayar görme uzmanı olan Zhu Songchun, Amerika Birleşik Devletleri'nden memleketi Ezhou, Hubei'ye döndü, Lianhuashan Araştırma Enstitüsü'nü kurdu ve Çin'deki en eski büyük veri etiketleme ekibini kurdu. Daha sonra, veri etiketleme fabrikaları yavaş yavaş ikinci ve üçüncü kademe şehirlerde kök saldı ve Hebei, Henan, Shandong, Shanxi ve diğer bölgelerde endüstriyel kümelenmeler ortaya çıktı.
Tekrarlanan etiket eğitimi sayesinde yapay zeka "uyanma" anına ulaşabilir Meiling'e göre bu, anaokulu öğretmenlerinin daha önceki çalışmalarının aynısıdır.
Yapay zeka ürünlerinin doğuşunda ilk halka olan veri etiketleme, bunu model eğitimi ve optimizasyonu, model yönetimi, akıl yürütme uygulamaları vb. takip etmektedir. Yapay zeka ürünlerini beslemek, önce "güzellerin" bilgisayarlarına akacak olan yüz milyonlarca veri gerektirir.
Ancak Meiling'in "yüksek teknoloji" hayali, mekanik farenin tekrarlayan sesiyle yavaş yavaş paramparça oldu. Günlük iş yükünün sınırının 1.500 kare olduğunu hesaplamış, bu uyarı çizgisini bir kez geçtikten sonra gözler ağrıyor.
İşten çıktıktan sonra, yüzünü TV'ye çevirdiğinde bile gördüğü şey, yakınlaştırdıktan sonra işaretlenmesi gereken bulanık resimlere benzeyen bir mozaik mozaik.
"Yan koltukta her zaman yabancı yüzler oluyor ve meslektaşlar arasında çok az iletişim var." Aynı üste çalışan Wu Xia, bir buçuk yıl çalıştıktan sonra ofisteki sessizliğe henüz alışamadı. .
Ortaokuldan mezun olduktan sonra, başlangıçta sınıf arkadaşlarıyla birlikte fabrikaya girdi, ancak proje değişiklikleri ve sınıf arkadaşlarının ayrılması nedeniyle "yalnız bir korucu" oldu. İş başlar başlamaz ofis, soğuk bir endüstriyel atmosfer ve çok az insan dokunuşu ile otomatik montaj hattının başladığı bir "atölye" haline geldi.
Veri etiketleme endüstrisinin özelliklerinden biri, bireysel parça sayımı ve ekip çalışmasına gerek olmaması, sıradan beyaz yakalılardan farklı bir yönetim yöntemidir.
Burada etiketleyicilerin sabit bir konumu olmayıp, proje değişikliklerine göre rastgele yüzlerce kişiyi akış yönüne atar. En uzun proje 2-3 ay ve kısa vadeli proje sadece 2-3 gündür.Bir düzineden fazla kişiden oluşan bir proje ekibinin, herkesin iş ilerlemesini takip edecek bir yöneticisi vardır.
Noterler enerjilerini meslektaşlar arasındaki ilişkiyi yönetmeye harcamazlar.Parça başı çalışma türü verimliliğe ve konsantrasyona önem verir ve zaman ve para bağlantılıdır.Ortalama 1.000 çerçeve tamamlamak, dakikada ortalama 2 çerçevenin tamamlanması gerektiği anlamına gelir.
Meiling, "Başkalarıyla konuştuğunuzda birkaç kutu para kaybedersiniz" dedi.
Veri etiketleme parkında, denizaşırı öğrenciler için dağınık teknoloji araştırma enstitüleri ve girişimcilik üsleri de bulunmaktadır. Meng Ran'ın görüşüne göre, bu "üst düzey" pozisyonlar ondan çok uzakta.
Üniversiteye girmeden önce memleketi Linfen'den hiç ayrılmadı, üniversiteden mezun olduktan sonra ailesi eyaleti terk etmeyeceğini umuyordu. Üsse iki kilometre uzaklıkta Foxconn Taiyuan Bilim ve Teknoloji Endüstri Parkı var. Bu fabrika alanı, en aktif yerel işçileri barındırıyordu.Zirvedeyken, fabrika alanının montaj hattında yaklaşık 60.000 kişi çalışıyordu.
Ne kadar uğraşırsa uğraşsın, üniversite öğrencisi Meng Ran'ın iş arama yarıçapı asla 5 kilometreyi geçmedi. Bir keresinde veri etiketleme tabanının ikinci aşamasından üçüncü aşamaya geçti; resmen bir veri etiketleyicisi olmadan önce, yan taraftaki Foxconn gençliğini yaktığı yerdi.
Foxconn parkının kaynağı, veri etiketleme üssünden 2 kilometreden daha kısa bir mesafede: Fotoğraf: Times Finance
Meng Ran bir keresinde para kazanmak için arka arkaya iki tatil için fabrikaya girdi ve her seferinde birkaç bin yuan maaş aldıktan sonra aceleyle ayrıldı.
Her kış ve yaz tatilinde, Foxconn kampüsünün girişi, büyük çantalar ve küçük çantalarla üniversite öğrencileriyle doludur ve herkesin hedefi, tüm yıl boyunca en yüksek indirimi ve saatlik ücreti almaktır. "Herkes buraya çabuk para kazanmak için geliyor ve yoğun sezon biter bitmez toplanıp gidiyorlar. Fabrika çalışamayacak kadar meşgul ve uzun süre ona bağlı kalmak zor."
Meng Ran, Foxconn'daki çalışma atmosferini beğenmedi. Atölyeye girmeden önce elektronik ekipmanların teslim edilmesi gerekiyor ve her gün yüz yüze kalınan tek şey, birbirine benzer kıyafetler içinde koşuşturan işçi kalabalığı ve kasvetli ve soğuk fabrika binası. Huysuz bir ekip lideriyle tanıştığınızda, her gün sözlü tacize uğramanız olağandır.
Üretim hattının gürültüsünün başlamasıyla birlikte, işçilerin sürekli olarak belirli bir parçayı takması gerekir ve bu tür işlemler genellikle 10 saatten fazla sürer. Tamamen kapalı bir alanda trans bile bir lükstür. Meng Ran, ustabaşı yönetimini biraz rahatlatana kadar etrafındaki işçilerle birkaç kelime etmeye cesaret edemedi.
2018'de yakındaki veri etiketleme üssünün tamamlanmasının ardından Meng Ran'ın işi için ikinci bir seçeneği vardı. Sadece bir blok ötede, parmaklarınızın ucunda daha rahat bir iş var.
Faye Wong, eskiden Foxconn için işe alım uzmanıydı. Fabrikanın yoğun olmayan sezonu ve personel değişiklikleri, muğlak indirimler ve sık sık gelir değişiklikleriyle birleştiğinde, onu genellikle göçmen işçilerle bitmek bilmeyen çatışmalara sokar.Açıklayıcılar onun için daha iyi bir seçimdir.
"Geçtiğimiz birkaç yılda, veri etiketleme eşiği düşüktü ve birim fiyatı yüksekti. Aylık 4.000 yuan gelir elde edebiliyordum ve yaptığım projelerin tümü, nispeten güvenli olan büyük fabrikalarla ilgiliydi." Faye Wong birçok vasıflı işçinin başka bir iş aramak için üssü terk ettiğini gördü, ama bir daire içinde tekrar geri döndü.
Birçok yorumcunun Meng Ran ile benzer iş yörüngeleri vardır.Elektronik fabrikalarındaki iş deneyimleri özgeçmişlerinin ortak noktasıdır ve elektronik dökümhanesinden ayrıldıktan sonra sıradaki durakları veri açıklama fabrikası olmuştur.
Çok sayıda işçinin ortak özellikleri, hatırı sayılır gelir ve basit işletme, iki süper fabrikayı birbirine bağlayan adeta iki kilometrelik bir köprü kurmuştur.
Kaybolan projeler ve şirketler
Etiketçiler için, iyi zamanların sona ermek üzere olduğu sezgisel bir duygudur.
Birim fiyatı birkaç kuruş olan proje ortadan kalktı ve bir etiket kutusunun fiyatı birkaç kuruşa düşürüldü; basit düzlem çizim noktası çizim kutusu ortadan kalktı, yerini çok boyutlu etiketleme gerektiren bir nokta bulutu projesi aldı; düzenli çalışanlar kademeli olarak proje ekibinden ayrıldı ve uygun maliyetli Taller stajyerleri iş yükünün yarısından fazlasını destekledi.
Veri etiketleme şirketinin sahibi He Qing, altı aydır üsse gitmedi ve şirkete yaptığı yatırımı kademeli olarak azalttı.
Geçen yılın ikinci yarısından bu yana, ekibi hiçbir zaman yüksek müşteri siparişi olan projeleri teslim alamamış ve müşteri fatura dönemi üç aydan yarım yıla ertelenmiştir. "Yetersiz nakit akışı olan ve sermaye ilerletme yeteneği olmayan birçok küçük fabrika kapandı ve ekip üyelerimiz üçte birini kaybetti."
Üç yıl önce, Li Wei'nin coşkusu açıklama çerçevesi tarafından ateşlendi. Yavaştı ve iletişimde iyi değildi ve "seçilmiş" bir iş bulduğunu hissetti.
Li Wei, projeyi 0,25 yuan birim fiyatıyla devraldı. Verimlilik yüksek olduğunda günde 1.200 kare çizebiliyor ve ayda yaklaşık 8.000 yuan kazanabiliyordu. "Daha fazla para kazanmak için biri bir sunucu satın aldı ve çalışmaya başladı. Evde ustalaşırsan gelirin artar.”
Herkes gibi, Li Wei de belirsiz bir şekilde altına hücum döneminin bittiğini hissetti.
Firma yepyeni bir projeye imza attı.Önümüzde artık gerçek bir yol haritası değil, yeşil, mor ve mavi noktalardan oluşan binlerce maket harita sunuluyor. yüzlerce işaretli kutu ve bir dizi soru, sadece ince farklarla düzinelerce resimden oluşuyor.
Karmaşık işlem arabirimi diyagramı kaynağı: görüşülen kişi tarafından sağlanır
"Plan görünümü ile 3D arasında tekrar tekrar geçiş yapmak gerekiyor. Engellenen bazı görüntülerin beyin tarafından desteklenmesi gerekiyor ve kadrajın doğruluğunun da 0.01 metrede kontrol edilmesi gerekiyor. İşin maliyet performansı düşüyor ve daha düşük." Gerekli aralıktan sapma 1 mm daha fazla olduğu sürece, İnceleme tarafından acımasızca geri püskürtülecekler.
Veri, bilgi işlem gücü ve algoritmalar yapay zekanın üç temel taşıdır.Verilerin niceliği ve kalitesi ne kadar yüksek olursa, o kadar olgun büyük modeller eğitilebilir, bu da doğruluğunu sürekli olarak geliştiren yorumcuların çalışmalarında kendini gösterir. .
"Kurallar son birkaç gün içinde ayarlandı ve doğruluk gereksinimi %80'in üzerine çıkarıldı." Doğruluk, etiketçilerin "ölüm noktası" haline geldi ve aynı zamanda etiketlediklerinde ortaya çıkan yüksek frekanslı bir kelime dağarcığı haline geldi. şikayet etmek.
İşaretlenen bir resim, inceleme ve kalite kontrol gibi 2-3 aşamadan geçmek zorundadır, aksi halde yerleşim döngüsüne giremez.
Wu Xia bazen karmaşık bir labirentte kapana kısılmış gibi hissediyordu ve ne olursa olsun çıkamıyordu. Neredeyse bir haftadır yeni bir projeyle uğraşıyordu - soruları gönderirken sürekli geri aranıyordu, bu da onu endişeye düşürdü. "Soru çok sık döndürülürse, diğer insanlara atanacak ve önceki enerji boşa gidecek."
Meng Ran'ın kaygısı başka türdendi. Geçen yıl ağustos ayından bu yana işleri biraz daha rahatladı.Son 5 dakikada onbinlerce veri birikti ve artık yarım saat kırmızı çizgide yük olmayacak.
"Platformdaki veri miktarı azalmış olabilir veya makine incelemesinin verimliliği artmış olabilir." Meng Ran'ın güvensizlik duygusu hızla doğrulandı. İş yükünün zorunlu olarak azaltılması nedeniyle günlük geliri azaldı. bir ila iki yüz yuan'dan birkaç yüz yuan'a düştü.Onlarca dolar.
Büyük ajanslar arasında nakavt yarışı yayıldı. Meng Ran bir ekibin bir gecede dağıldığını gördü ve bir düzineden fazla maaş alacaklısı şirkete işçi bürosuna dava açtı; durum biraz daha iyi olsaydı bilgisayar ve çalışanlarla birlikte bir sonraki temsilciye transfer edileceklerdi.
"Güvenli tarafta olmak için 30'dan fazla kişiden oluşan bir takıma gidin." Bu, Meng Ran'ın yeni gelenlere tavsiyesidir.
Annotator tarih sahnesinden çıkıyor
Bir haftalık eğitim ve yarım aylık acemilik döneminden sonra, bu yılın Mayıs ayında Hunan'da bulunan Xiaoting, sonunda bir veri etiketleyici olmaya adapte oldu, ancak şirketin ölümüne kadar hızlı düşüşüne tanık oldu.
"Bir aylık çalışmadan sonra şirket hayatta kalamayacak. Patron herkese ayrılık yemeği ısmarlıyor ama maaşın birkaç ay beklemesi gerekecek." Xiaoting'in görüşüne göre, mevcut veri etiketleme endüstrisi "kara mayınları" ve risk, gelirden çok daha büyük.
İster bir veri etiketleme girişimcisi, ister onbinlerce etiketleyici olsun, manuel veri etiketlemenin büyük ölçekli modeller sahnesinde giderek önemsizleşmesinden kaçınmanın bir yolu yok.
Meiling'in okul öncesi öğretmenliği görevinden farkı, öğrencilerin öğretmenin işini bu kadar çabuk kabul etmeyecek olmasıdır. Bugün, etiketleyiciler tarafından beslenen büyük model teknolojisi, veri etiketleme sürecini hızla geri besliyor.
Tesla'yı örnek alarak, 2D manuel etiketlemeden 4D alan otomatik etiketlemeye kadar 2018'den beri otomatik etiketleme teknolojisini sürekli olarak geliştirmektedir. Teknolojinin ilerlemesi manuel etiketleme için çalışma alanını yuttu.2021'de Tesla'nın manuel etiketleme ekibi 1.000 kişiyi aşacak ve 2022'de 200'den fazla çalışanı işten çıkarılacak.
Xiaopeng Motors ve Momo Zhixing dahil olmak üzere diğer otomobil şirketleri de otomatik etiketleme araçlarını piyasaya sürdü. Momo Zhixing'in CEO'su Gu Weihao, şu anda şerit çizgilerini, trafik katılımcılarını ve trafik ışığı bilgilerini elde etmek için manuel etiketleme maliyetinin resim başına yaklaşık 5 yuan olduğunu, Momo DriveGPT'nin maliyetinin ise yalnızca 0,5 yuan olduğunu kamuoyuna açıkladı.
2019 yılında, birinci sınıf bir şehirde AI veri eğitmeni olan Wu Di, kariyerinin tavanına dair bir önseziye sahipti.Şirketi, e-ticaret platformları için akıllı müşteri hizmetleri projelerinin geliştirilmesinden sorumludur. İlerleme hayal ettiğinden daha hızlıydı.Bir yıldan kısa bir süre içinde, sorumlu olduğu 10 kişilik veri etiketleme ekibinin bağlantısı kesildi ve geriye sadece dağınık operatörler kaldı.
"Projenin olgunlaşmaya devam ettiği gün, artık bize ihtiyaç kalmadığı zamandır."
Büyük modelin evrimi, hızla akan bir nehir gibidir, her zaman belirli bir anda sürpriz bir saldırı yaparak yapay ekibi geride bırakır.
Bu yılın Mart ayında Zürih Üniversitesi tarafından yapılan bir anket raporunda, araştırmacılar gerçek ölçümler yoluyla ChatGPT'nin 15 etiketleme görevindeki işleme yeteneğinin kitle kaynak sağlayıcılardan daha yüksek olduğunu buldular.
Bu yılın Nisan ayının başında, okulda bir tıp öğrencisi olan Li Jie, tıp alanında büyük bir fabrikanın metin etiketlemesini bir ay içinde tamamladı. Bu proje akıllı teşhis ve diyalog hizmetleri sağlamak için kullanılacak. Bu da Li'yi yaptı. Jie, büyük modellerin gelişimini ilk kez hissediyor.
"Başlangıçta platformu sınıflandırılmış tıbbi terimlerle beslemeye devam ettik ve ikinci hafta sistem temel isim sınıflandırmasını otomatik olarak gerçekleştirebildi ve doğruluk oranı %90'ı aştı."
Taiyuan, Shanxi'de, üssün ustabaşı Bayan Zhou, yeni gelenleri daha zor projeleri devralmaya ikna etmeye başladı, çünkü şirketin tekrar tekrar rafa kaldırılan projelerin baskısına katlanması zordu. "Şu anda, etiketleme işi ne kadar basitse, kâr o kadar ince ve bazı projeler yarısı tamamlanırsa sarı olur ve işçilik maliyeti projenin gelirini hiç karşılayamaz."
Veri etiketleme endüstrisinden bir işe alma görevlisi Times Finance'e bu yıldan beri işe alım eşiğinin kademeli olarak ortaokul öğrencilerinden lisans öğrencilerine kaydığını söyledi. "Geçmişte, etiketçiler için temelde herhangi bir deneyim şartı yoktu. Artık birçok şirket, yeni çalışanların doğrudan projeler üzerinde çalışmaya başlayabileceğini umuyor, bu da ilk eğitim maliyetlerini azaltabilir."
Şu anda, akıllı etiketleme nesnelerin temel şeklini ve konumunu kabaca yakalayabilir, ancak doğruluk açısından hala profesyonel etiketleyicilerin gerisindedir.
Akıllı etiketlemenin ne zaman büyük bir patlamaya yol açacağını kimse bilmiyor ama Li Wei'ye her zaman bir güvensizlik duygusu eşlik ediyor. Ne zaman yeni bir proje sayfası açsa, akıllı etiketlemeyi temsil eden kırmızı kutu her zaman önce ekrana gelir ve sanki ekran başındaki insanlara sürekli şunu hatırlatır:
Bir gün onun yerini alacak.
(Bu makaledeki görüşülen kişilerin tümü takma adlardır.)
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Foxconn çalışanları yapay zeka etiketleme fabrikasına akın ediyor
Orijinal kaynak: Times Finance
Bu yılın ilk yarısında birinci sınıf şehirlerin teknoloji çemberleri yapay zeka ile harekete geçirildi.
Wenxinyiyan, Tongyiqianwen ve Light Years Away gibi büyük modeller ısı dalgasını dalga dalga yayıyor. Üst düzey kaynaklara sahip kodamanlar bu büyük etkinliğin merkezinde duruyor. Birbiri ardına kahraman yazıları gönderdiler. Büyükler için savaş- model yeteneği de masada.
AI endüstri zinciri ile yakından bağlantılı bir bağlantı olarak Pekin'e 500 kilometre uzaklıktaki Shanxi'deki Taiyuan Veri Endüstrisi Üssü sakin, binlerce yapay zeka etiketçisi burada toplandı. Konuştukları konular proje ilerlemesi, kutuyu standarda çekme oranı ve günde üç öğün yemek üzerine kaldı.
Times Finance'e konuşan bir veri etiketleyici, "Heyecan onların ve bizim elimizde yalnızca sayısız kutu var."
Veri etiketleme şirketinin sahibi He Qing'in anısına, heyecan dört ya da beş yıl önce yaşandı. Yapay zekanın bahar esintisi ilk kez bu orta batı kentine esti.Hassas işadamları, yapay zeka için sürekli bir "beslenme" akışı sağlayarak bölge oluşturmaya ve insanları işe almaya başladı. Çoğu, yapay zekanın sıradan insanları, ani büyük işgücü talebi nedeniyle, en son teknoloji ile harika bir bağları var.
"O zamanlar, birçok patron tüm aile üyelerini buraya getirdi ve sadece parmaklarını hareket ettirerek para kazanabiliyorlardı." He Qing, veri etiketleme endüstrisinde pek çok heyecan verici haber duydu - bazı insanlar üç ay içinde milyonlar kazanıyor ve diğerleri Kapanan siparişler ikinci yıla kadar kuyruğa alınabilir.
Ancak bu güzel günler yavaş yavaş kayboluyor.
Makul bir "boru hattı"
Sabah 8:45'te yoğun bir insan kalabalığı asansör girişini kapattı, insanların sadece üçte biri ilk asansöre sıkıştı ve herkesin son durağı altıncı kattı.
Asansörün kapısı yavaşça açıldı ve kalabalık dört bir yana dağılarak hiçbir farkın olmadığı ofislere girdi.Yaklaşık 100 metrekarelik alan yüzlerce bilgisayar ayağıyla doluydu.
"Ev numarasını takip edip tek tek sorduğun sürece hepsi verilerle işaretlenecek." Parkın zemin katındaki satıcı bu şekilde tarif etti.
Bine yakın kişinin ilgisini çeken bu veri etiketleme tabanı, parkın içine gizlenmiş gizli bir internet kafe gibidir.Bilgisayarların başında oturanlar ustaca klavye ve fareye tıklarlar ve yaklaşık bir metrekarelik masalar dolup taşar. devasa bilgisayarlar.
Bireyselliklerini gösterebilecek tek şey başlarına taktıkları renkli kulaklıklardır.Ortak bir kimlikleri vardır: veri etiketleyiciler.
Fare sol ve sağ düğmeleri ileri geri tıkladı ve ekrandaki resimler yakınlaştırıp uzaklaştırdı ve imleç hızla farklı boyutlarda çerçeveler çizdi... Yarım saat süren tekrarlanan eylemlerden sonra Meiling, boynunu hafifçe büktü ve omurgasındaki kemikler gıcırdayarak gıcırdadı.
Meiling, gözlerini ekrana dikmiş halde Times Finance'e verdiği demeçte, "Yeni gelenlerin ilk haftayı atlatması yeterli, alışması da çabuk oluyor" dedi. İlk haftada pes edenlerin sayısı %30'a kadar çıkıyor .
Her iki haftada bir, ustabaşı Bayan Zhou, bir düzineden fazla yeni gelenin çıraklık eğitimlerine başlamasına öncülük edecek.Böyle tekrarlayan ve sıkıcı işler birçok genci caydırdı.
Meiling, iki yıl önce bir anaokulu öğretmeninden bir veri etiketleyicisine dönüştü. Memleketi Luliang'da çok az iş var ve telefonla pazarlama en saygın yerlerden biri Şimdi, yapay zeka dalgasının etkisi altında, veri etiketleyiciler ilçedeki kadınlara başka bir seçenek sunuyor.
Altı ay önce, etiketleme üssünün değişmesi nedeniyle Meiling memleketinden eyalet başkenti Taiyuan'a taşındı. "Otomatik sürüş veya yüz tanıma, büyük ölçekli etiketleyicilerin katılımını gerektirmez." Aylık geliri 3.000 yuan'dan fazla olan bir ofiste oturan ve bilgisayar kullanan ailesinin gözünde gururlu bir görünüm sergiledi. , tedavi ilçenin çoğunu aştı.Zaten çalışıyor.
2005 yılında, bir bilgisayar görme uzmanı olan Zhu Songchun, Amerika Birleşik Devletleri'nden memleketi Ezhou, Hubei'ye döndü, Lianhuashan Araştırma Enstitüsü'nü kurdu ve Çin'deki en eski büyük veri etiketleme ekibini kurdu. Daha sonra, veri etiketleme fabrikaları yavaş yavaş ikinci ve üçüncü kademe şehirlerde kök saldı ve Hebei, Henan, Shandong, Shanxi ve diğer bölgelerde endüstriyel kümelenmeler ortaya çıktı.
Tekrarlanan etiket eğitimi sayesinde yapay zeka "uyanma" anına ulaşabilir Meiling'e göre bu, anaokulu öğretmenlerinin daha önceki çalışmalarının aynısıdır.
Yapay zeka ürünlerinin doğuşunda ilk halka olan veri etiketleme, bunu model eğitimi ve optimizasyonu, model yönetimi, akıl yürütme uygulamaları vb. takip etmektedir. Yapay zeka ürünlerini beslemek, önce "güzellerin" bilgisayarlarına akacak olan yüz milyonlarca veri gerektirir.
Ancak Meiling'in "yüksek teknoloji" hayali, mekanik farenin tekrarlayan sesiyle yavaş yavaş paramparça oldu. Günlük iş yükünün sınırının 1.500 kare olduğunu hesaplamış, bu uyarı çizgisini bir kez geçtikten sonra gözler ağrıyor.
İşten çıktıktan sonra, yüzünü TV'ye çevirdiğinde bile gördüğü şey, yakınlaştırdıktan sonra işaretlenmesi gereken bulanık resimlere benzeyen bir mozaik mozaik.
"Yan koltukta her zaman yabancı yüzler oluyor ve meslektaşlar arasında çok az iletişim var." Aynı üste çalışan Wu Xia, bir buçuk yıl çalıştıktan sonra ofisteki sessizliğe henüz alışamadı. .
Ortaokuldan mezun olduktan sonra, başlangıçta sınıf arkadaşlarıyla birlikte fabrikaya girdi, ancak proje değişiklikleri ve sınıf arkadaşlarının ayrılması nedeniyle "yalnız bir korucu" oldu. İş başlar başlamaz ofis, soğuk bir endüstriyel atmosfer ve çok az insan dokunuşu ile otomatik montaj hattının başladığı bir "atölye" haline geldi.
Veri etiketleme endüstrisinin özelliklerinden biri, bireysel parça sayımı ve ekip çalışmasına gerek olmaması, sıradan beyaz yakalılardan farklı bir yönetim yöntemidir.
Burada etiketleyicilerin sabit bir konumu olmayıp, proje değişikliklerine göre rastgele yüzlerce kişiyi akış yönüne atar. En uzun proje 2-3 ay ve kısa vadeli proje sadece 2-3 gündür.Bir düzineden fazla kişiden oluşan bir proje ekibinin, herkesin iş ilerlemesini takip edecek bir yöneticisi vardır.
Noterler enerjilerini meslektaşlar arasındaki ilişkiyi yönetmeye harcamazlar.Parça başı çalışma türü verimliliğe ve konsantrasyona önem verir ve zaman ve para bağlantılıdır.Ortalama 1.000 çerçeve tamamlamak, dakikada ortalama 2 çerçevenin tamamlanması gerektiği anlamına gelir.
Meiling, "Başkalarıyla konuştuğunuzda birkaç kutu para kaybedersiniz" dedi.
Foxconn çalışanları etiketleme fabrikasına akın ediyor
Veri etiketleme parkında, denizaşırı öğrenciler için dağınık teknoloji araştırma enstitüleri ve girişimcilik üsleri de bulunmaktadır. Meng Ran'ın görüşüne göre, bu "üst düzey" pozisyonlar ondan çok uzakta.
Üniversiteye girmeden önce memleketi Linfen'den hiç ayrılmadı, üniversiteden mezun olduktan sonra ailesi eyaleti terk etmeyeceğini umuyordu. Üsse iki kilometre uzaklıkta Foxconn Taiyuan Bilim ve Teknoloji Endüstri Parkı var. Bu fabrika alanı, en aktif yerel işçileri barındırıyordu.Zirvedeyken, fabrika alanının montaj hattında yaklaşık 60.000 kişi çalışıyordu.
Ne kadar uğraşırsa uğraşsın, üniversite öğrencisi Meng Ran'ın iş arama yarıçapı asla 5 kilometreyi geçmedi. Bir keresinde veri etiketleme tabanının ikinci aşamasından üçüncü aşamaya geçti; resmen bir veri etiketleyicisi olmadan önce, yan taraftaki Foxconn gençliğini yaktığı yerdi.
Meng Ran bir keresinde para kazanmak için arka arkaya iki tatil için fabrikaya girdi ve her seferinde birkaç bin yuan maaş aldıktan sonra aceleyle ayrıldı.
Her kış ve yaz tatilinde, Foxconn kampüsünün girişi, büyük çantalar ve küçük çantalarla üniversite öğrencileriyle doludur ve herkesin hedefi, tüm yıl boyunca en yüksek indirimi ve saatlik ücreti almaktır. "Herkes buraya çabuk para kazanmak için geliyor ve yoğun sezon biter bitmez toplanıp gidiyorlar. Fabrika çalışamayacak kadar meşgul ve uzun süre ona bağlı kalmak zor."
Meng Ran, Foxconn'daki çalışma atmosferini beğenmedi. Atölyeye girmeden önce elektronik ekipmanların teslim edilmesi gerekiyor ve her gün yüz yüze kalınan tek şey, birbirine benzer kıyafetler içinde koşuşturan işçi kalabalığı ve kasvetli ve soğuk fabrika binası. Huysuz bir ekip lideriyle tanıştığınızda, her gün sözlü tacize uğramanız olağandır.
Üretim hattının gürültüsünün başlamasıyla birlikte, işçilerin sürekli olarak belirli bir parçayı takması gerekir ve bu tür işlemler genellikle 10 saatten fazla sürer. Tamamen kapalı bir alanda trans bile bir lükstür. Meng Ran, ustabaşı yönetimini biraz rahatlatana kadar etrafındaki işçilerle birkaç kelime etmeye cesaret edemedi.
2018'de yakındaki veri etiketleme üssünün tamamlanmasının ardından Meng Ran'ın işi için ikinci bir seçeneği vardı. Sadece bir blok ötede, parmaklarınızın ucunda daha rahat bir iş var.
Faye Wong, eskiden Foxconn için işe alım uzmanıydı. Fabrikanın yoğun olmayan sezonu ve personel değişiklikleri, muğlak indirimler ve sık sık gelir değişiklikleriyle birleştiğinde, onu genellikle göçmen işçilerle bitmek bilmeyen çatışmalara sokar.Açıklayıcılar onun için daha iyi bir seçimdir.
"Geçtiğimiz birkaç yılda, veri etiketleme eşiği düşüktü ve birim fiyatı yüksekti. Aylık 4.000 yuan gelir elde edebiliyordum ve yaptığım projelerin tümü, nispeten güvenli olan büyük fabrikalarla ilgiliydi." Faye Wong birçok vasıflı işçinin başka bir iş aramak için üssü terk ettiğini gördü, ama bir daire içinde tekrar geri döndü.
Birçok yorumcunun Meng Ran ile benzer iş yörüngeleri vardır.Elektronik fabrikalarındaki iş deneyimleri özgeçmişlerinin ortak noktasıdır ve elektronik dökümhanesinden ayrıldıktan sonra sıradaki durakları veri açıklama fabrikası olmuştur.
Çok sayıda işçinin ortak özellikleri, hatırı sayılır gelir ve basit işletme, iki süper fabrikayı birbirine bağlayan adeta iki kilometrelik bir köprü kurmuştur.
Kaybolan projeler ve şirketler
Etiketçiler için, iyi zamanların sona ermek üzere olduğu sezgisel bir duygudur.
Birim fiyatı birkaç kuruş olan proje ortadan kalktı ve bir etiket kutusunun fiyatı birkaç kuruşa düşürüldü; basit düzlem çizim noktası çizim kutusu ortadan kalktı, yerini çok boyutlu etiketleme gerektiren bir nokta bulutu projesi aldı; düzenli çalışanlar kademeli olarak proje ekibinden ayrıldı ve uygun maliyetli Taller stajyerleri iş yükünün yarısından fazlasını destekledi.
Veri etiketleme şirketinin sahibi He Qing, altı aydır üsse gitmedi ve şirkete yaptığı yatırımı kademeli olarak azalttı.
Geçen yılın ikinci yarısından bu yana, ekibi hiçbir zaman yüksek müşteri siparişi olan projeleri teslim alamamış ve müşteri fatura dönemi üç aydan yarım yıla ertelenmiştir. "Yetersiz nakit akışı olan ve sermaye ilerletme yeteneği olmayan birçok küçük fabrika kapandı ve ekip üyelerimiz üçte birini kaybetti."
Üç yıl önce, Li Wei'nin coşkusu açıklama çerçevesi tarafından ateşlendi. Yavaştı ve iletişimde iyi değildi ve "seçilmiş" bir iş bulduğunu hissetti.
Li Wei, projeyi 0,25 yuan birim fiyatıyla devraldı. Verimlilik yüksek olduğunda günde 1.200 kare çizebiliyor ve ayda yaklaşık 8.000 yuan kazanabiliyordu. "Daha fazla para kazanmak için biri bir sunucu satın aldı ve çalışmaya başladı. Evde ustalaşırsan gelirin artar.”
Herkes gibi, Li Wei de belirsiz bir şekilde altına hücum döneminin bittiğini hissetti.
Firma yepyeni bir projeye imza attı.Önümüzde artık gerçek bir yol haritası değil, yeşil, mor ve mavi noktalardan oluşan binlerce maket harita sunuluyor. yüzlerce işaretli kutu ve bir dizi soru, sadece ince farklarla düzinelerce resimden oluşuyor.
"Plan görünümü ile 3D arasında tekrar tekrar geçiş yapmak gerekiyor. Engellenen bazı görüntülerin beyin tarafından desteklenmesi gerekiyor ve kadrajın doğruluğunun da 0.01 metrede kontrol edilmesi gerekiyor. İşin maliyet performansı düşüyor ve daha düşük." Gerekli aralıktan sapma 1 mm daha fazla olduğu sürece, İnceleme tarafından acımasızca geri püskürtülecekler.
Veri, bilgi işlem gücü ve algoritmalar yapay zekanın üç temel taşıdır.Verilerin niceliği ve kalitesi ne kadar yüksek olursa, o kadar olgun büyük modeller eğitilebilir, bu da doğruluğunu sürekli olarak geliştiren yorumcuların çalışmalarında kendini gösterir. .
"Kurallar son birkaç gün içinde ayarlandı ve doğruluk gereksinimi %80'in üzerine çıkarıldı." Doğruluk, etiketçilerin "ölüm noktası" haline geldi ve aynı zamanda etiketlediklerinde ortaya çıkan yüksek frekanslı bir kelime dağarcığı haline geldi. şikayet etmek.
İşaretlenen bir resim, inceleme ve kalite kontrol gibi 2-3 aşamadan geçmek zorundadır, aksi halde yerleşim döngüsüne giremez.
Wu Xia bazen karmaşık bir labirentte kapana kısılmış gibi hissediyordu ve ne olursa olsun çıkamıyordu. Neredeyse bir haftadır yeni bir projeyle uğraşıyordu - soruları gönderirken sürekli geri aranıyordu, bu da onu endişeye düşürdü. "Soru çok sık döndürülürse, diğer insanlara atanacak ve önceki enerji boşa gidecek."
Meng Ran'ın kaygısı başka türdendi. Geçen yıl ağustos ayından bu yana işleri biraz daha rahatladı.Son 5 dakikada onbinlerce veri birikti ve artık yarım saat kırmızı çizgide yük olmayacak.
"Platformdaki veri miktarı azalmış olabilir veya makine incelemesinin verimliliği artmış olabilir." Meng Ran'ın güvensizlik duygusu hızla doğrulandı. İş yükünün zorunlu olarak azaltılması nedeniyle günlük geliri azaldı. bir ila iki yüz yuan'dan birkaç yüz yuan'a düştü.Onlarca dolar.
Büyük ajanslar arasında nakavt yarışı yayıldı. Meng Ran bir ekibin bir gecede dağıldığını gördü ve bir düzineden fazla maaş alacaklısı şirkete işçi bürosuna dava açtı; durum biraz daha iyi olsaydı bilgisayar ve çalışanlarla birlikte bir sonraki temsilciye transfer edileceklerdi.
"Güvenli tarafta olmak için 30'dan fazla kişiden oluşan bir takıma gidin." Bu, Meng Ran'ın yeni gelenlere tavsiyesidir.
Annotator tarih sahnesinden çıkıyor
Bir haftalık eğitim ve yarım aylık acemilik döneminden sonra, bu yılın Mayıs ayında Hunan'da bulunan Xiaoting, sonunda bir veri etiketleyici olmaya adapte oldu, ancak şirketin ölümüne kadar hızlı düşüşüne tanık oldu.
"Bir aylık çalışmadan sonra şirket hayatta kalamayacak. Patron herkese ayrılık yemeği ısmarlıyor ama maaşın birkaç ay beklemesi gerekecek." Xiaoting'in görüşüne göre, mevcut veri etiketleme endüstrisi "kara mayınları" ve risk, gelirden çok daha büyük.
İster bir veri etiketleme girişimcisi, ister onbinlerce etiketleyici olsun, manuel veri etiketlemenin büyük ölçekli modeller sahnesinde giderek önemsizleşmesinden kaçınmanın bir yolu yok.
Meiling'in okul öncesi öğretmenliği görevinden farkı, öğrencilerin öğretmenin işini bu kadar çabuk kabul etmeyecek olmasıdır. Bugün, etiketleyiciler tarafından beslenen büyük model teknolojisi, veri etiketleme sürecini hızla geri besliyor.
Tesla'yı örnek alarak, 2D manuel etiketlemeden 4D alan otomatik etiketlemeye kadar 2018'den beri otomatik etiketleme teknolojisini sürekli olarak geliştirmektedir. Teknolojinin ilerlemesi manuel etiketleme için çalışma alanını yuttu.2021'de Tesla'nın manuel etiketleme ekibi 1.000 kişiyi aşacak ve 2022'de 200'den fazla çalışanı işten çıkarılacak.
Xiaopeng Motors ve Momo Zhixing dahil olmak üzere diğer otomobil şirketleri de otomatik etiketleme araçlarını piyasaya sürdü. Momo Zhixing'in CEO'su Gu Weihao, şu anda şerit çizgilerini, trafik katılımcılarını ve trafik ışığı bilgilerini elde etmek için manuel etiketleme maliyetinin resim başına yaklaşık 5 yuan olduğunu, Momo DriveGPT'nin maliyetinin ise yalnızca 0,5 yuan olduğunu kamuoyuna açıkladı.
2019 yılında, birinci sınıf bir şehirde AI veri eğitmeni olan Wu Di, kariyerinin tavanına dair bir önseziye sahipti.Şirketi, e-ticaret platformları için akıllı müşteri hizmetleri projelerinin geliştirilmesinden sorumludur. İlerleme hayal ettiğinden daha hızlıydı.Bir yıldan kısa bir süre içinde, sorumlu olduğu 10 kişilik veri etiketleme ekibinin bağlantısı kesildi ve geriye sadece dağınık operatörler kaldı.
"Projenin olgunlaşmaya devam ettiği gün, artık bize ihtiyaç kalmadığı zamandır."
Büyük modelin evrimi, hızla akan bir nehir gibidir, her zaman belirli bir anda sürpriz bir saldırı yaparak yapay ekibi geride bırakır.
Bu yılın Mart ayında Zürih Üniversitesi tarafından yapılan bir anket raporunda, araştırmacılar gerçek ölçümler yoluyla ChatGPT'nin 15 etiketleme görevindeki işleme yeteneğinin kitle kaynak sağlayıcılardan daha yüksek olduğunu buldular.
Bu yılın Nisan ayının başında, okulda bir tıp öğrencisi olan Li Jie, tıp alanında büyük bir fabrikanın metin etiketlemesini bir ay içinde tamamladı. Bu proje akıllı teşhis ve diyalog hizmetleri sağlamak için kullanılacak. Bu da Li'yi yaptı. Jie, büyük modellerin gelişimini ilk kez hissediyor.
"Başlangıçta platformu sınıflandırılmış tıbbi terimlerle beslemeye devam ettik ve ikinci hafta sistem temel isim sınıflandırmasını otomatik olarak gerçekleştirebildi ve doğruluk oranı %90'ı aştı."
Taiyuan, Shanxi'de, üssün ustabaşı Bayan Zhou, yeni gelenleri daha zor projeleri devralmaya ikna etmeye başladı, çünkü şirketin tekrar tekrar rafa kaldırılan projelerin baskısına katlanması zordu. "Şu anda, etiketleme işi ne kadar basitse, kâr o kadar ince ve bazı projeler yarısı tamamlanırsa sarı olur ve işçilik maliyeti projenin gelirini hiç karşılayamaz."
Veri etiketleme endüstrisinden bir işe alma görevlisi Times Finance'e bu yıldan beri işe alım eşiğinin kademeli olarak ortaokul öğrencilerinden lisans öğrencilerine kaydığını söyledi. "Geçmişte, etiketçiler için temelde herhangi bir deneyim şartı yoktu. Artık birçok şirket, yeni çalışanların doğrudan projeler üzerinde çalışmaya başlayabileceğini umuyor, bu da ilk eğitim maliyetlerini azaltabilir."
Şu anda, akıllı etiketleme nesnelerin temel şeklini ve konumunu kabaca yakalayabilir, ancak doğruluk açısından hala profesyonel etiketleyicilerin gerisindedir.
Akıllı etiketlemenin ne zaman büyük bir patlamaya yol açacağını kimse bilmiyor ama Li Wei'ye her zaman bir güvensizlik duygusu eşlik ediyor. Ne zaman yeni bir proje sayfası açsa, akıllı etiketlemeyi temsil eden kırmızı kutu her zaman önce ekrana gelir ve sanki ekran başındaki insanlara sürekli şunu hatırlatır:
Bir gün onun yerini alacak.
(Bu makaledeki görüşülen kişilerin tümü takma adlardır.)