Працівники Foxconn йдуть на фабрику маркування ШІ

Джерело: Times Finance

Кредит зображення: створено Unbounded AI‌

У першій половині цього року технологічні кола міст першого рівня були активізовані штучним інтелектом.

Масштабні моделі, такі як Wenxin Yiyan, Tongyi Qianwen і Light Years Away, викликають хвилі ентузіазму. Великі особи з ресурсами найвищого рівня стоять у центрі цієї грандіозної події. Вони один за одним розсилають героїчні дописи. битва за талант великої моделі також на столі.

Будучи ланкою, тісно пов’язаною з ланцюгом індустрії штучного інтелекту, база даних Тайюань у Шаньсі, за 500 кілометрів від Пекіна, спокійна.Туди зібралися тисячі людей, які займаються етикетками штучного інтелекту. Теми, про які говорили, стосувалися прогресу проекту, темпів наведення коробки на стандарт і триразового харчування.

«Хвилювання належить їм, а у нас є лише незліченна кількість коробок», — сказав Times Finance представник етикеток.

У пам'яті Хе Ціна, власника компанії з маркування даних, ажіотаж стався чотири чи п'ять років тому. Вперше в це місто на середньому заході подув весняний вітерець штучного інтелекту, делікатні бізнесмени почали оформляти території та вербувати людей, забезпечуючи постійний потік «харчування» для штучного інтелекту. Більшість із них є фанатами штучного інтелекту, оскільки через раптовий величезний попит на робочу силу вони мають чудовий зв’язок із передовими технологіями.

«У той час багато босів приводили сюди всіх членів своєї родини, і вони могли заробляти гроші, просто поворухнувши пальцями». Хе Цін почув багато цікавих новин у галузі маркування даних — деякі люди заробляють мільйони протягом трьох місяців, а інші. Зібрані замовлення можна поставити в чергу на другий рік.

Але такі гарні дні поступово відходять у минуле.

Пристойний "конвеєр"

О 8:45 ранку щільний натовп людей заблокував вхід до ліфта, до першого ліфта протиснулася лише третина людей, а кінцевий пункт усіх був на шостому поверсі.

Двері ліфта повільно відчинилися, і натовп розбігся в усіх напрямках і зайшов до офісів, де не було різниці.Простір площею близько 100 квадратних метрів був заповнений сотнями комп'ютерів.футів.

«Поки ви йдете за номером будинку і запитуєте по одному, все буде позначено даними», — так описав це продавець на першому поверсі парку.

Ця база маркування даних, яка залучила майже тисячу людей, схожа на приховане інтернет-кафе, сховане в парку.Люди, які сидять перед комп’ютерами, майстерно клацають по клавіатурі та миші, а столи площею близько одного квадратного метра займають величезні комп'ютери.

Джерело даних для етикетки в роботі: фото Times Finance

Єдине, що може продемонструвати їхню індивідуальність, — це кольорові навушники на головах.У них спільна ідентичність: етикетки даних.

Миша клацала вперед-назад по лівій і правій кнопках, і картинки на екрані збільшувалися і зменшувалися, а курсор швидко малював рамки різного розміру... Після повторних дій, які тривали півгодини, Мейлінг скрутила шию. злегка, і кістки в її хребті скрипнули скрипучим звуком.

«Новачкам достатньо, щоб пройти перший тиждень, і вони швидко до цього звикають», — сказав Мейлінг Times Finance, не дивлячись на екран. Кількість людей, які здаються в перший тиждень, досягає 30% .

Кожні два тижні пані Чжоу, бригадир, буде вести більше десятка новачків, щоб розпочати навчання. Така повторювана та нудна робота відмовила багатьох молодих людей.

Два роки тому Мейлінг перетворилася з вихователя в дитячому садку на етикетувальника даних. У її рідному місті Лулян мало роботи, а телемаркетинг є одним із найреспектабельніших напрямків.Тепер під впливом хвилі штучного інтелекту маркувальники даних пропонують жінкам у окрузі інший вибір.

Півроку тому через зміну бази маркування Мейлін переїхала зі свого рідного міста до столиці провінції Тайюань. «Автоматичне керування автомобілем або розпізнавання обличчя не потребує участі великомасштабних виробників етикеток», — вона показала гордий вигляд. В очах своєї сім’ї, сидячи в офісі та керуючи комп’ютером, з місячним доходом понад 3000 юанів , лікування перевищив більшу частину округу.Вже працює.

У 2005 році Чжу Сончунь, фахівець з комп’ютерного зору, повернувся до свого рідного міста Ечжоу, Хубей зі Сполучених Штатів, заснував дослідницький інститут Ляньхуашань і сформував першу в Китаї групу маркування великих даних. Згодом фабрики маркування даних поступово прижилися в містах другого та третього рівня, а промислові кластери з’явилися в Хебеї, Хенані, Шаньдуні, Шаньсі та інших регіонах.

Шляхом повторного навчання міток штучний інтелект може досягти моменту «пробудження», на думку Мейлінг, це те саме, що й попередня робота вихователів дитячих садків.

Позначення даних є першою ланкою в народженні продуктів штучного інтелекту, за якими йдуть навчання та оптимізація моделей, керування моделями, додатки для міркування тощо. Для живлення продуктів штучного інтелекту потрібні сотні мільйонів даних, які спочатку надійдуть на комп’ютери «красунь».

Проте фантазія Мейлінга про «високі технології» потроху була розбита повторюваним звуком механічної миші. Вона підрахувала, що 1500 кадрів — це межа щоденного навантаження, коли ця попереджувальна межа буде перетинана, очні яблука болітимуть.

Після роботи, навіть коли вона стоїть перед телевізором, вона бачить мозаїчну мозаїку, яка виглядає як розмиті картинки, які потрібно позначити після збільшення.

«На сусідньому місці завжди незнайомі обличчя, а між колегами мало спілкування». Пропрацювавши півтора року, Ву Ся, який працює в тій же базі, ще не звик до тиші в офісі .

Після закінчення молодшого коледжу вона спочатку пішла на фабрику разом зі своїми однокласниками, але через зміни в проекті та від’їзд однокласників стала «самотнім рейнджером». Як тільки робота почалася, офіс став «майстернею», де стартувала автоматизована конвеєрна лінія, з холодною індустріальною атмосферою та мало людського дотику.

Однією з особливостей індустрії маркування даних є індивідуальний підрахунок штук і відсутність командної роботи, що формує метод управління, відмінний від методу звичайних білих комірців.

Тут етикетки не мають фіксованої позиції, а випадковим чином призначають сотні людей до напрямку потоку відповідно до змін проекту. Найдовший проект — 2-3 місяці, а короткостроковий — всього 2-3 дні, команда проекту з понад десятка людей має адміністратора, який стежить за ходом роботи кожного.

Анотатори не будуть витрачати свою енергію на управління стосунками між колегами. Відрядний тип приділяє увагу ефективності та концентрації, а час і гроші пов’язані. Для виконання середнього стандарту в 1000 кадрів означає, що в середньому потрібно виконати 2 кадри за хвилину .

«Коли ви розмовляєте з іншими, ви втратите кілька ящиків грошей», — сказав Мейлінг.

Працівники Foxconn йдуть на фабрику етикеток

У парку маркування даних також є розкидані технологічні дослідницькі інститути та підприємницькі бази для іноземних студентів. На думку Мен Рана, ці «висококласні» позиції далекі від нього.

До вступу в університет він ніколи не покидав рідне місто Ліньфен, а після закінчення університету його родина сподівалася, що він не покине провінцію. За два кілометри від бази розташований науково-технологічний індустріальний парк Foxconn Taiyuan. Ця територія фабрики поглинула найактивніших місцевих робітників.На піку свого розвитку на конвеєрі фабрики працювало близько 60 000 людей.

Як би він не намагався, радіус пошуку роботи студентом коледжу Мен Раном ніколи не перевищував 5 кілометрів. Одного разу він перейшов із другої фази бази маркування даних до третьої фази; перш ніж офіційно стати маркуванням даних, Foxconn по сусідству був місцем, де він спалив свою молодість.

Джерело парку Foxconn менш ніж за 2 кілометри від бази маркування даних: фото Times Finance

Одного разу Мен Ран прийшов на фабрику на дві відпустки поспіль, щоб заробити гроші, і щоразу поспішно залишав її, отримавши зарплату в кілька тисяч юанів.

Кожні зимові та літні канікули вхід до кампусу Foxconn заповнений студентами з великими та маленькими сумками, і мета кожного — отримати найвищу знижку та погодинну оплату за цілий рік. «Усі приїжджають сюди, щоб швидко заробити гроші, і вони збирають речі та їдуть, щойно закінчується пік сезону. Фабрика занадто зайнята, щоб працювати, і важко втримуватися на ній тривалий час».

Менг Ран не сподобалася робоча атмосфера у Foxconn. Перш ніж увійти в майстерню, електронне обладнання потрібно здати, і єдине, з чим щодня залишається стикатися, це натовп поспішаючих робітників у схожому одязі та похмура і холодна будівля фабрики. Коли ви зустрічаєте сварливого керівника команди, це звичайно для вас щодня словесні образи.

З гуркотом запуску лінії робітникам необхідно безперервно встановлювати певну деталь, і часто такі дії тривають більше 10 годин. У повністю замкнутому просторі навіть транс – це розкіш. Мен Ран не наважувався перекинутися кількома словами з робітниками навколо нього, доки бригадир трохи не розслабив керівництво.

У 2018 році, після завершення будівництва сусідньої бази маркування даних, Мен Ран мав інший вибір для своєї роботи. Усього за один квартал від вас є більш зручна робота під рукою.

Фей Вонг колись була рекрутером для Foxconn. Міжсезоння на фабриці та кадрові зміни в поєднанні з неоднозначними скидками та частими змінами доходів змушують її часто впадати в нескінченні конфлікти з трудовими мігрантами.Анотатори для неї кращий вибір.

«Останні кілька років поріг маркування даних був низьким, а ціна за одиницю продукції — високою. Я міг підтримувати місячний дохід у 4000 юанів, і всі проекти, які я робив, були пов’язані з великими заводами, що було відносно безпечно», — Фей Вонг. бачив, як багато кваліфікованих робітників залишають базу, щоб шукати іншу роботу Зі шляху, але знову повертаються по колу.

Багато анотаторів мають подібні траєкторії роботи, як Мен Ран. Досвід роботи на фабриках електроніки є спільним пунктом їхніх резюме, а фабрика анотації даних стала їхньою наступною зупинкою після виходу з ливарного виробництва електроніки.

Загальні риси великої кількості робітників, значного доходу та простоти експлуатації дозволили побудувати фактично двокілометровий міст, який з’єднує дві суперфабрики разом.

Зниклі проекти та компанії

Для етикетників інтуїтивне відчуття полягає в тому, що хороші часи добігають кінця.

Проект із ціною за одиницю в кілька центів зник, а ціна коробки для етикеток була знижена до кількох центів; коробка для малювання простих площинних точок зникла, замінена проектом хмари точок, який вимагав багатовимірного маркування; звичайні співробітники поступово залишив проектну команду, і економічно ефективні стажери Taller виконували більше половини робочого навантаження.

Хе Цін, власниця компанії з маркування даних, не була на базі півроку, і вона поступово скорочувала свої інвестиції в компанію.

Починаючи з другої половини минулого року, її команда жодного разу не могла отримати проекти з великими замовленнями клієнтів, а період виставлення рахунків клієнтам затягнувся з трьох місяців до півроку. «Багато невеликих заводів із недостатнім грошовим потоком і нездатністю авансувати капітал закрилися, а члени нашої команди втратили одну третину».

Три роки тому ентузіазм Лі Вей викликав рамку з виносками. Вона була повільною та поганою у спілкуванні, і вона відчувала, що знайшла «обрану» роботу.

Лі Вей взяла на себе проект із ціною одиниці 0,25 юаня. Коли ефективність була високою, вона могла малювати 1200 кадрів на день і заробляти майже 8000 юанів на місяць. «Щоб заробити більше грошей, хтось купив хост і почав працювати Якщо ви станете досвідченим, ваш дохід зросте».

Як і всі інші, Лі Вей смутно відчував, що ера золотої лихоманки закінчилася.

Компанія запустила абсолютно новий проект. Перед нами вже не реальна дорожня карта, а типова карта, що складається з тисяч зелених, фіолетових і синіх точок. Завершене зображення включає в себе майже сотня позначених полів, а набір запитань складається з десятків малюнків лише з незначними відмінностями.

Джерело діаграми складного операційного інтерфейсу: надано респондентом

«Потрібно неодноразово перемикатися між виглядом у плані та 3D. Деякі заблоковані зображення потрібно доповнювати мозком, а також потрібно контролювати точність кадру на 0,01 метра. Ефективність роботи стає нижчою та Поки відхилення від необхідного діапазону більше на 1 мм, вони будуть безжально відбиті оглядом.

Дані, обчислювальна потужність і алгоритми є трьома наріжними каменями штучного інтелекту. Чим більша кількість і вища якість даних, тим більш зрілі великі моделі можна навчити, що проявляється в роботі анотаторів, які постійно вдосконалюють свою точність. .

«Правила було скориговано за останні кілька днів, і вимоги до точності збільшено до понад 80%.» Точність стала «мертвою плямою» етикетників, і це також високочастотний словник, який з’являється, коли вони скаржитися.

Позначене зображення має пройти 2-3 етапи, такі як перевірка та перевірка якості, інакше воно не може увійти в цикл розрахунку.

Іноді Ву Ся відчувала, що потрапила в складний лабіринт і не могла звідти вибратися, незважаючи ні на що. Майже тиждень її мучив новий проект — під час надсилання питань їй постійно передзвонювали, через що вона впадала в тривогу. «Якщо питання повертатися занадто часто, воно буде призначено іншим людям, і попередня енергія буде марною».

Тривога Мен Ран була іншого роду. З серпня минулого року його робота стала спокійнішою, за останні 5 хвилин накопичилося десятки тисяч даних, і тепер червоної лінії навантаження не буде півгодини.

«Можливо, кількість даних на платформі зменшилася, а може бути, що ефективність машинного перегляду зросла». Почуття незахищеності Мен Рана швидко підтвердилося. Через вимушене скорочення його робочого навантаження його щоденний дохід впав з однієї-двох сотень юанів до кількох сотень юанів, десятки доларів.

Серед великих агентств поширилася гонка нокаутів. Менг Ран бачила, як одну ніч розпустила команду, а більше десятка співробітників, яким заборгували зарплату, подали позов на компанію до бюро праці; якби ситуація була трохи кращою, їх би передали до наступного агента разом із комп’ютером і працівниками.

«Щоб бути в безпеці, перейдіть до команди, яка складається з понад 30 людей», — така порада Мен Ран новачкам.

Анотатор виходить зі сцени історії

У травні цього року після тижня навчання та півмісячного періоду новачка Сяотін, який перебував у Хунані, нарешті адаптувався до роботи етикетувальника даних, але став свідком швидкого занепаду компанії аж до її закриття.

«Після одного місяця роботи компанія не зможе вижити. Бос пригощає всіх розривною їжею, але зарплати доведеться чекати кілька місяців». «міни», а ризик набагато більший за дохід.

Незалежно від того, чи йдеться про підприємця, що займається маркуванням даних, чи про десятки тисяч етикетників, неможливо уникнути того факту, що ручне маркування даних поступово стає незначним на сцені великомасштабних моделей.

Що відрізняється від роботи вихователя дошкільної освіти Мейлінг, так це те, що учні не так швидко займатимуть роботу вчителя. Сьогодні технологія великих моделей, яку розвивають етикетувальники, швидко повертає назад процес маркування даних.

Як приклад Tesla, вона постійно розвиває технологію автоматичного маркування з 2018 року, від 2D ручного маркування до 4D космічного автоматичного маркування. Розвиток технологій знищив робочий простір для ручного маркування. У 2021 році команда Tesla з ручного маркування перевищить 1000 осіб, а в 2022 році більше 200 співробітників будуть звільнені.

Інші автомобільні компанії, в тому числі Xiaopeng Motors і Momo Zhixing, також запустили інструменти автоматичного маркування. Гу Вейхао, генеральний директор Momo Zhixing, публічно заявив, що зараз для отримання інформації про смуги руху, учасників руху та світлофори вартість ручного маркування становить близько 5 юанів за зображення, тоді як вартість Momo DriveGPT становить лише 0,5 юаня.

У 2019 році Ву Ді, інструктор з обробки даних зі штучного інтелекту в місті першого рівня, передчував стелю своєї кар’єри. Його компанія відповідає за розробку інтелектуальних проектів обслуговування клієнтів для платформ електронної комерції. Прогрес був швидшим, ніж він собі уявляв. Менш ніж за рік команду з 10 осіб із маркування даних, якою він керував, було ліквідовано, і залишилися лише спорадичні оператори.

«Того дня, коли проект продовжує розвиватися, ми більше не потрібні».

Еволюція великої моделі схожа на бурхливу річку, яка завжди раптово атакує в певний момент, залишаючи штучну команду позаду.

У звіті про опитування Цюрихського університету в березні цього року дослідники за допомогою фактичних вимірювань виявили, що здатність ChatGPT до обробки 15 завдань маркування була вищою, ніж у краудсорсерів.

На початку квітня цього року Лі Цзе, студент-медик у школі, завершив текстове маркування великої медичної фабрики протягом одного місяця. Цей проект використовуватиметься для надання послуг інтелектуальної діагностики та діалогу. Це також зробило Лі Jie вперше відчув еволюцію великих моделей.

«Спочатку ми продовжували заповнювати платформу секретними медичними термінами, а на другому тижні система змогла автоматично реалізувати основну класифікацію іменників, і рівень точності перевищив 90%».

У Тайюані, Шаньсі, пані Чжоу, бригадир бази, почала переконувати новачків взятися за складніші проекти, тому що компанії було важко витримувати тиск проектів, які знову і знову відкладалися. «Зараз чим простіше бізнес з маркування, тим менший прибуток, і деякі проекти будуть жовтими, якщо вони будуть завершені наполовину, а витрати на оплату праці взагалі не зможуть покрити доходи від проекту».

Рекрутер в індустрії маркування даних розповів Times Finance, що з цього року поріг набору поступово змістився від студентів молодших коледжів до студентів бакалаврату. «У минулому практично не було жодних вимог щодо досвіду для етикетувальників. Зараз багато компаній сподіваються, що нові співробітники зможуть безпосередньо почати працювати над проектами, що може зменшити початкові витрати на навчання».

На даний момент інтелектуальне маркування може приблизно фіксувати основну форму та положення об’єктів, але з точки зору точності воно все ще відстає від професійних етикетників.

Ніхто не знає, коли розумне маркування призведе до великого вибуху, але Лі Вей завжди супроводжується почуттям незахищеності. Кожного разу, коли вона відкриває нову сторінку проекту, червоне поле, що представляє розумні мітки, завжди спливає першим, ніби нагадуючи людям, які весь час перебувають перед екраном:

Одного разу воно займе її місце.

(Всі респонденти в цій статті є псевдонімами.)

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити