В первой половине этого года искусственный интеллект активизировал технологические кружки городов первого уровня.
Масштабные модели, такие как Wenxin Yiyan, Tongyi Qianwen и Light Years Away, вызывают волну энтузиазма.Важнейшие шишки с высокоуровневыми ресурсами стоят в центре этого грандиозного события.Они рассылают героические посты один за другим. битва за таланты больших моделей также на столе.
Являясь звеном, тесно связанным с цепочкой индустрии искусственного интеллекта, Тайюаньская база данных индустрии данных в Шаньси, в 500 километрах от Пекина, спокойна.Здесь собрались тысячи специалистов по маркировке искусственного интеллекта. Темы, о которых они говорили, остались о ходе проекта, скорости отрисовки коробки до стандарта и трехразовом питании.
«Они волнуются, а у нас только бесчисленное количество коробок», — сказал Times Finance специалист по маркировке данных.
В памяти Хэ Цина, владельца компании по маркировке данных, волнение произошло четыре или пять лет назад. Впервые в этот город на Среднем Западе подул весенний ветерок искусственного интеллекта, чуткие бизнесмены начали осваивать территорию и вербовать людей, обеспечивая стабильный поток «питания» для искусственного интеллекта. Большинство из них — профаны искусственного интеллекта, из-за внезапно возникшего огромного спроса на рабочую силу у них прекрасная связь с передовыми технологиями.
«В то время многие боссы приводили сюда всех членов своей семьи, и они могли зарабатывать деньги, просто шевеля пальцами». другие Заказы, которые были захвачены, могут быть поставлены в очередь на второй год.
Но такие хорошие дни постепенно уходят.
Достойный "конвейер"
В 8:45 утра плотная толпа людей заблокировала вход в лифт, только треть людей протиснулась в первый лифт, и конечная цель всех была на шестом этаже.
Дверь лифта медленно открылась, и толпа растеклась во все стороны, и прошла в офисы, где не было никакой разницы.Пространство около 100 квадратных метров было заполнено сотнями компьютеров.
«Пока вы следите за номером дома и спрашиваете один за другим, все это будет помечено данными», — так описал это продавец на первом этаже парка.
Эта база разметок данных, собравшая почти тысячу человек, похожа на тайное интернет-кафе, спрятанное в парке: люди, сидящие перед компьютерами, ловко кликают по клавиатуре и мышке, а столы площадью около одного квадратного метра заняты огромные компьютеры.
Источник данных: этикетировщик данных за работой: фото Times Finance
Единственное, что может показать их индивидуальность, это разноцветные наушники, надетые на голову, у них есть общая идентичность: маркировщики данных.
Мышь щёлкала левой и правой кнопками вперёд-назад, и картинки на экране увеличивались и уменьшались, а курсор быстро рисовал кадры разного размера… После получасовых повторных действий Мэйлин слегка свернула шею. , и кости в ее позвоночнике заскрипели со скрипом.
«Новичку достаточно пройти первую неделю, и к этому можно быстро привыкнуть, если у вас есть опыт», — сказала Мэй Линг Times Finance, все еще глядя на экран. Целых 30% людей сдались. Первая неделя.
Каждые две недели г-жа Чжоу, бригадир, будет вести более десятка новичков, чтобы они начали свое ученичество Такая монотонная и скучная работа отпугнула многих молодых людей.
Два года назад Мэйлин превратилась из воспитательницы детского сада в специалиста по маркировке данных. В ее родном городе Лулян мало работы, а телемаркетинг — одно из самых респектабельных направлений.Теперь, под влиянием волны искусственного интеллекта, маркировщики данных предоставляют женщинам округа еще один выбор.
Шесть месяцев назад в связи со сменой базы маркировки Мэйлин переехала из своего родного города в Тайюань, столицу провинции. «Автоматическое вождение или распознавание лиц не требуют участия крупных этикетировщиков», — она демонстрировала гордый вид, в глазах своей семьи, сидя в офисе и работая за компьютером, с ежемесячным доходом более 3000 юаней. , обработка превысила большую часть уезда.Уже работает.
В 2005 году Чжу Сунчунь, эксперт по компьютерному зрению, вернулся из США в свой родной город Эчжоу, провинция Хубэй, основал исследовательский институт Ляньхуашань и сформировал первую в Китае команду по маркировке больших данных. Впоследствии фабрики маркировки данных постепенно прижились в городах второго и третьего эшелона, а промышленные кластеры появились в Хэбэе, Хэнани, Шаньдуне, Шаньси и других регионах.
Благодаря многократному обучению меткам искусственный интеллект может достичь момента «пробуждения», что, по мнению Мэйлин, аналогично предыдущей работе воспитателей детских садов.
Маркировка данных является первым звеном в рождении продуктов искусственного интеллекта, за которыми следуют обучение и оптимизация моделей, управление моделями, приложения для рассуждений и т. д. Для кормления продуктов искусственного интеллекта требуются сотни миллионов данных, которые сначала поступят на компьютеры «красавцев».
Однако фантазия Мэйлин о «высоких технологиях» мало-помалу была разрушена повторяющимся звуком механической мыши. Она подсчитала, что 1500 кадров — это предел дневной нагрузки, после пересечения этой черты начинают болеть глаза.
После работы, даже стоя лицом к телевизору, она видит мозаичную мозаику, которая выглядит как нечеткие картинки, которые нужно размечать после увеличения.
«В соседнем кресле всегда незнакомые лица, а общения между коллегами мало.» Проработав полтора года, У Ся, работающая на той же базе, еще не привыкла к тишине в офисе .
После окончания младшего колледжа она сначала поступила на фабрику со своими одноклассниками, но из-за изменений в проекте и ухода одноклассников она стала «одиноким рейнджером». Как только работа началась, офис превратился в «мастерскую», где заработала автоматизированная сборочная линия, с холодной промышленной атмосферой и небольшим количеством человеческого прикосновения.
Одной из характеристик индустрии маркировки данных является индивидуальный подсчет и отсутствие необходимости в командной работе, что формирует метод управления, отличный от того, что используют обычные белые воротнички.
Здесь маркировщики не имеют фиксированной позиции, а случайным образом назначают сотни людей по направлению потока в соответствии с изменениями проекта. Самый длинный проект 2-3 месяца, а краткосрочный всего 2-3 дня.В команде проекта более десятка человек есть администратор, который следит за ходом работы каждого.
Аннотаторы не будут тратить свою энергию на управление отношениями между коллегами.Сдельный тип уделяет внимание эффективности и концентрации, а время и деньги связаны.Для выполнения среднего стандарта в 1000 кадров означает, что в среднем необходимо выполнить 2 кадра в минуту .
«Когда вы разговариваете с другими, вы теряете несколько коробок с деньгами», — сказала Мэйлин.
Рабочие Foxconn направляются на этикетировочную фабрику
В парке маркировки данных также есть разрозненные технологические исследовательские институты и предпринимательские базы для иностранных студентов. По мнению Мэн Рана, эти «высокие» должности далеки от него.
До поступления в университет он никогда не покидал свой родной город Линьфэнь, после окончания университета его семья надеялась, что он не покинет провинцию. В двух километрах от базы находится промышленный парк Foxconn Taiyuan Science and Technology. Эта фабричная территория вобрала в себя самых активных местных рабочих, на пике своего развития на сборочном конвейере фабричной территории работало около 60 000 человек.
Как бы он ни старался, радиус поиска работы студента колледжа Мэн Рана никогда не превышал 5 километров. Однажды он перешел от второй фазы базы маркировки данных к третьей фазе; прежде чем официально стать маркировщиком данных, Foxconn по соседству был местом, где он сжег свою юность.
Источник парка Foxconn менее чем в 2 километрах от базы разметки данных: Фото Times Finance
Мэн Ран однажды приехал на фабрику на два отпуска подряд, чтобы заработать денег, и каждый раз уходил в спешке, получив зарплату в несколько тысяч юаней.
Каждые зимние и летние каникулы у входа в кампус Foxconn полно студентов колледжа с большими и маленькими сумками, цель каждого — получить максимальную скидку и почасовую оплату за весь год. «Все приезжают сюда, чтобы быстро заработать, и они собирают вещи и уезжают, как только заканчивается пиковый сезон. Фабрика слишком занята, чтобы работать, и трудно удержаться на ней долгое время».
Мэн Рану не нравилась рабочая атмосфера в Foxconn. Перед входом в цех нужно сдать электронное оборудование, и единственное, с чем каждый день приходится сталкиваться, — это толпа спешащих рабочих в одинаковой одежде и унылое и холодное здание завода. Когда вы встречаете сварливого лидера команды, вы часто подвергаетесь словесным оскорблениям каждый день.
При запуске производственной линии рабочим необходимо непрерывно устанавливать определенную деталь, и такие действия часто длятся более 10 часов. В полностью закрытом помещении даже транс — роскошь. Мэн Ран не осмеливался перекинуться парой слов с окружающими его рабочими, пока бригадир немного не расслабил свое управление.
В 2018 году, после завершения строительства ближайшей базы маркировки данных, у Мэн Рана появился второй выбор для работы. Всего в квартале от вас есть более удобная работа.
Фэй Вонг работала рекрутером в Foxconn. Низкий сезон на фабрике и кадровые перестановки вкупе с неоднозначными скидками и частыми изменениями в доходах заставляют ее часто впадать в бесконечные конфликты с гастарбайтерами.
"В последние несколько лет порог маркировки данных был низким, а цена за единицу была высокой. Я могла поддерживать ежемесячный доход в размере 4000 юаней, а все проекты, которые я выполняла, были связаны с крупными фабриками, что было относительно безопасно", — Фэй Вонг. видел, как многие квалифицированные рабочие уходили с базы в поисках другой работы, но возвращались по кругу.
Многие аннотаторы имеют те же траектории работы, что и Мэн Ран.Опыт работы на заводах по производству электроники является общим пунктом в их резюме, а фабрика по аннотированию данных стала их следующей остановкой после ухода с завода по производству электроники.
Общие черты большого количества рабочих, значительных доходов и простоты эксплуатации фактически построили двухкилометровый мост, соединивший два суперзавода вместе.
Исчезнувшие проекты и компании
Наклейки интуитивно чувствуют, что хорошие времена подходят к концу.
Исчез проект с ценой за единицу в несколько центов, а цена коробки с этикеткой была снижена до нескольких центов; простая коробка рисования точек плоскости исчезла, замененная проектом облака точек, который требовал многомерной маркировки; штатные сотрудники постепенно покидали команду проекта, а рентабельные стажеры Taller поддерживали более половины рабочей нагрузки.
Хе Цин, владелица компании по маркировке данных, не появлялась на базе полгода, и она постепенно сокращала свои инвестиции в компанию.
Со второй половины прошлого года ее команде ни разу не удавалось получить проекты с большим количеством заказов клиентов, а период выставления счетов клиентам был задержан с трех месяцев до полугода. «Многие небольшие фабрики с недостаточным денежным потоком и отсутствием возможности авансировать капитал закрылись, и члены нашей команды потеряли одну треть».
Три года назад энтузиазм Ли Вэй воспламенился выноской, она была медлительна и плохо общалась, и ей казалось, что она нашла «выбранную» работу.
Ли Вэй взяла на себя проект с ценой за единицу 0,25 юаня. Когда эффективность была высокой, она могла рисовать 1200 кадров в день и зарабатывать почти 8000 юаней в месяц. «Чтобы заработать больше денег, кто-то купил хост и начал работу. дома. Если вы станете опытным, ваш доход увеличится».
Как и все остальные, Ли Вэй смутно чувствовал, что эпоха золотой лихорадки закончилась.
Компания запустила совершенно новый проект.Перед нами предстает уже не реальная дорожная карта, а карта-модель, состоящая из тысяч зеленых, фиолетовых и синих точек.Завершенная картина включает в себя почти сотни отмеченных полей, а набор вопросов состоит из десятков картинок с небольшими отличиями.
Источник схемы сложного операционного интерфейса: предоставлено интервьюируемым.
«Необходимо многократно переключаться между видом сверху и 3D. Некоторые заблокированные изображения приходится дополнять мозгом, а также требуется контролировать точность кадра на уровне 0,01 метра. Себестоимость выполнения работ становится все ниже и ниже." Пока отклонение от требуемой дальности будет больше на 1 мм, они будут безжалостно отбиты обзором.
Данные, вычислительная мощность и алгоритмы — три краеугольных камня искусственного интеллекта.Чем больше количество и выше качество данных, тем более зрелые большие модели можно обучить, что проявляется в работе аннотаторов, которые постоянно повышают свою точность .
«Правила были скорректированы за последние несколько дней, а требования к точности были повышены до более чем 80%». жаловаться.
Отмеченное изображение должно пройти 2-3 этапа, таких как просмотр и проверка качества, иначе оно не может попасть в расчетный цикл.
Иногда У Ся казалось, что она попала в запутанный лабиринт и не может выбраться, несмотря ни на что. Почти неделю она была занята новым проектом — пока задавала вопросы, ей постоянно перезванивали, из-за чего она впадала в тревогу. «Если вопрос будет возвращаться слишком часто, он будет передан другим людям, и предыдущая энергия будет напрасной».
Беспокойство Мэн Ран было другого рода. С августа прошлого года его работа стала более спокойной, за последние 5 минут накопились десятки тысяч данных, и теперь красная полоса не будет загружаться в течение получаса.
"Возможно, объем данных на платформе уменьшился, а может быть, повысилась эффективность машинного обзора. Чувство неуверенности Мэн Рана быстро подтвердилось. Из-за вынужденного сокращения его рабочей нагрузки его ежедневный доход упал с одной до двухсот юаней до нескольких сотен юаней, десятков долларов.
Гонка на выбывание распространилась среди крупных агентств. Мэн Ран видел, как в одночасье расформировали команду, и более дюжины сотрудников, которым причиталась заработная плата, подали в суд на компанию в бюро по трудоустройству; если бы ситуация была немного лучше, они были бы переданы следующему агенту вместе с компьютером и сотрудниками.
«На всякий случай отправляйтесь в команду из более чем 30 человек», — советует Мэн Ран новичкам.
Аннотатор покидает сцену истории
После недели обучения и полумесячного периода новичка, в мае этого года Сяотин, находившийся в провинции Хунань, наконец приспособился к работе маркировщиком данных, но стал свидетелем быстрого упадка компании вплоть до ее закрытия.
"После одного месяца работы компания не сможет выжить. Босс угощает всех обедом в честь расставания, но зарплату придется подождать несколько месяцев". "мины", и риск намного больше, чем доход.
Будь то предприниматель по маркировке данных или десятки тысяч маркировщиков, нет способа избежать того факта, что ручная маркировка данных постепенно становится незначительной на этапе крупномасштабных моделей.
Что отличается от работы учителя дошкольных учреждений Мэйлин, так это то, что ученики не берутся за работу учителя так быстро. Сегодня технология больших моделей, разработанная разработчиками этикеток, быстро восстанавливает процесс маркировки данных.
Взяв, к примеру, Tesla, с 2018 года компания постоянно совершенствует технологию автоматической маркировки, от ручной 2D-маркировки до автоматической 4D-космической маркировки. Развитие технологий поглотило рабочее пространство для ручной маркировки: в 2021 году команда Tesla по ручной маркировке превысит 1000 человек, а в 2022 году более 200 сотрудников будут уволены.
Другие автомобильные компании, в том числе Xiaopeng Motors и Momo Zhixing, также внедрили инструменты автоматической маркировки. Гу Вейхао, генеральный директор Momo Zhixing, публично заявил, что в настоящее время для получения информации о линиях движения, участниках движения и светофорах стоимость ручной маркировки составляет около 5 юаней за изображение, а стоимость Momo DriveGPT составляет всего 0,5 юаня.
В 2019 году Ву Ди, ИИ-тренер из крупного города, предчувствовал потолок своей карьеры: его компания отвечает за разработку проекта умного обслуживания клиентов платформы электронной коммерции. Прогресс шел быстрее, чем он предполагал: менее чем через год команда по маркировке данных из 10 человек, за которую он отвечал, была уволена, и остались лишь отдельные операторы.
«День, когда проект продолжит развиваться, наступит, когда мы больше не будем нужны».
Эволюция большой модели подобна стремительной реке, всегда совершающей внезапную атаку в определенный момент, оставляя искусственную команду позади.
В отчете об исследовании, проведенном Цюрихским университетом в марте этого года, исследователи на основе фактических измерений обнаружили, что способность обработки ChatGPT в 15 задачах маркировки была выше, чем у краудсорсеров.
В начале апреля этого года Ли Цзе, студент-медик в школе, в течение одного месяца завершил текстовую маркировку крупной фабрики в области медицины.Этот проект будет использоваться для предоставления услуг интеллектуального диалога диагностики, что также сделало Ли Цзе впервые почувствуйте эволюцию больших моделей скорость.
«Вначале мы продолжали загружать платформу классифицированными медицинскими терминами, а на второй неделе система смогла автоматически реализовать базовую классификацию существительных, и уровень точности превысил 90%».
В Тайюане, Шаньси, г-жа Чжоу, мастер базы, начала убеждать новичков браться за более сложные проекты, потому что компании было трудно выдерживать давление отложенных проектов снова и снова. «В настоящее время чем проще этикетировочный бизнес, тем меньше прибыль, и некоторые проекты будут желтыми, если они будут завершены наполовину, а стоимость рабочей силы вообще не может покрыть доход от проекта».
Рекрутер из индустрии маркировки данных сообщил Times Finance, что с этого года порог приема на работу постепенно сместился со студентов младших курсов колледжей на студентов бакалавриата. «Раньше для этикетировщиков практически не требовался опыт работы. Теперь многие компании надеются, что новые сотрудники смогут сразу приступить к работе над проектами, что может снизить первоначальные затраты на обучение».
В настоящее время интеллектуальная маркировка может приблизительно фиксировать основную форму и положение объектов, но с точки зрения точности она все еще отстает от профессиональных этикетировщиков.
Никто не знает, когда умная маркировка приведет к большому взрыву, но Ли Вэй всегда сопровождается чувством незащищенности. Всякий раз, когда она открывает новую страницу проекта, сначала всегда появляется красный прямоугольник, представляющий умную маркировку, как будто постоянно напоминая людям, находящимся перед экраном:
Однажды она займет ее место.
(Все интервьюируемые в этой статье являются псевдонимами.)
Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Рабочие Foxconn переезжают на фабрику по производству этикеток с искусственным интеллектом
Первоисточник: Таймс Финанс
В первой половине этого года искусственный интеллект активизировал технологические кружки городов первого уровня.
Масштабные модели, такие как Wenxin Yiyan, Tongyi Qianwen и Light Years Away, вызывают волну энтузиазма.Важнейшие шишки с высокоуровневыми ресурсами стоят в центре этого грандиозного события.Они рассылают героические посты один за другим. битва за таланты больших моделей также на столе.
Являясь звеном, тесно связанным с цепочкой индустрии искусственного интеллекта, Тайюаньская база данных индустрии данных в Шаньси, в 500 километрах от Пекина, спокойна.Здесь собрались тысячи специалистов по маркировке искусственного интеллекта. Темы, о которых они говорили, остались о ходе проекта, скорости отрисовки коробки до стандарта и трехразовом питании.
«Они волнуются, а у нас только бесчисленное количество коробок», — сказал Times Finance специалист по маркировке данных.
В памяти Хэ Цина, владельца компании по маркировке данных, волнение произошло четыре или пять лет назад. Впервые в этот город на Среднем Западе подул весенний ветерок искусственного интеллекта, чуткие бизнесмены начали осваивать территорию и вербовать людей, обеспечивая стабильный поток «питания» для искусственного интеллекта. Большинство из них — профаны искусственного интеллекта, из-за внезапно возникшего огромного спроса на рабочую силу у них прекрасная связь с передовыми технологиями.
«В то время многие боссы приводили сюда всех членов своей семьи, и они могли зарабатывать деньги, просто шевеля пальцами». другие Заказы, которые были захвачены, могут быть поставлены в очередь на второй год.
Но такие хорошие дни постепенно уходят.
Достойный "конвейер"
В 8:45 утра плотная толпа людей заблокировала вход в лифт, только треть людей протиснулась в первый лифт, и конечная цель всех была на шестом этаже.
Дверь лифта медленно открылась, и толпа растеклась во все стороны, и прошла в офисы, где не было никакой разницы.Пространство около 100 квадратных метров было заполнено сотнями компьютеров.
«Пока вы следите за номером дома и спрашиваете один за другим, все это будет помечено данными», — так описал это продавец на первом этаже парка.
Эта база разметок данных, собравшая почти тысячу человек, похожа на тайное интернет-кафе, спрятанное в парке: люди, сидящие перед компьютерами, ловко кликают по клавиатуре и мышке, а столы площадью около одного квадратного метра заняты огромные компьютеры.
Единственное, что может показать их индивидуальность, это разноцветные наушники, надетые на голову, у них есть общая идентичность: маркировщики данных.
Мышь щёлкала левой и правой кнопками вперёд-назад, и картинки на экране увеличивались и уменьшались, а курсор быстро рисовал кадры разного размера… После получасовых повторных действий Мэйлин слегка свернула шею. , и кости в ее позвоночнике заскрипели со скрипом.
«Новичку достаточно пройти первую неделю, и к этому можно быстро привыкнуть, если у вас есть опыт», — сказала Мэй Линг Times Finance, все еще глядя на экран. Целых 30% людей сдались. Первая неделя.
Каждые две недели г-жа Чжоу, бригадир, будет вести более десятка новичков, чтобы они начали свое ученичество Такая монотонная и скучная работа отпугнула многих молодых людей.
Два года назад Мэйлин превратилась из воспитательницы детского сада в специалиста по маркировке данных. В ее родном городе Лулян мало работы, а телемаркетинг — одно из самых респектабельных направлений.Теперь, под влиянием волны искусственного интеллекта, маркировщики данных предоставляют женщинам округа еще один выбор.
Шесть месяцев назад в связи со сменой базы маркировки Мэйлин переехала из своего родного города в Тайюань, столицу провинции. «Автоматическое вождение или распознавание лиц не требуют участия крупных этикетировщиков», — она демонстрировала гордый вид, в глазах своей семьи, сидя в офисе и работая за компьютером, с ежемесячным доходом более 3000 юаней. , обработка превысила большую часть уезда.Уже работает.
В 2005 году Чжу Сунчунь, эксперт по компьютерному зрению, вернулся из США в свой родной город Эчжоу, провинция Хубэй, основал исследовательский институт Ляньхуашань и сформировал первую в Китае команду по маркировке больших данных. Впоследствии фабрики маркировки данных постепенно прижились в городах второго и третьего эшелона, а промышленные кластеры появились в Хэбэе, Хэнани, Шаньдуне, Шаньси и других регионах.
Благодаря многократному обучению меткам искусственный интеллект может достичь момента «пробуждения», что, по мнению Мэйлин, аналогично предыдущей работе воспитателей детских садов.
Маркировка данных является первым звеном в рождении продуктов искусственного интеллекта, за которыми следуют обучение и оптимизация моделей, управление моделями, приложения для рассуждений и т. д. Для кормления продуктов искусственного интеллекта требуются сотни миллионов данных, которые сначала поступят на компьютеры «красавцев».
Однако фантазия Мэйлин о «высоких технологиях» мало-помалу была разрушена повторяющимся звуком механической мыши. Она подсчитала, что 1500 кадров — это предел дневной нагрузки, после пересечения этой черты начинают болеть глаза.
После работы, даже стоя лицом к телевизору, она видит мозаичную мозаику, которая выглядит как нечеткие картинки, которые нужно размечать после увеличения.
«В соседнем кресле всегда незнакомые лица, а общения между коллегами мало.» Проработав полтора года, У Ся, работающая на той же базе, еще не привыкла к тишине в офисе .
После окончания младшего колледжа она сначала поступила на фабрику со своими одноклассниками, но из-за изменений в проекте и ухода одноклассников она стала «одиноким рейнджером». Как только работа началась, офис превратился в «мастерскую», где заработала автоматизированная сборочная линия, с холодной промышленной атмосферой и небольшим количеством человеческого прикосновения.
Одной из характеристик индустрии маркировки данных является индивидуальный подсчет и отсутствие необходимости в командной работе, что формирует метод управления, отличный от того, что используют обычные белые воротнички.
Здесь маркировщики не имеют фиксированной позиции, а случайным образом назначают сотни людей по направлению потока в соответствии с изменениями проекта. Самый длинный проект 2-3 месяца, а краткосрочный всего 2-3 дня.В команде проекта более десятка человек есть администратор, который следит за ходом работы каждого.
Аннотаторы не будут тратить свою энергию на управление отношениями между коллегами.Сдельный тип уделяет внимание эффективности и концентрации, а время и деньги связаны.Для выполнения среднего стандарта в 1000 кадров означает, что в среднем необходимо выполнить 2 кадра в минуту .
«Когда вы разговариваете с другими, вы теряете несколько коробок с деньгами», — сказала Мэйлин.
Рабочие Foxconn направляются на этикетировочную фабрику
В парке маркировки данных также есть разрозненные технологические исследовательские институты и предпринимательские базы для иностранных студентов. По мнению Мэн Рана, эти «высокие» должности далеки от него.
До поступления в университет он никогда не покидал свой родной город Линьфэнь, после окончания университета его семья надеялась, что он не покинет провинцию. В двух километрах от базы находится промышленный парк Foxconn Taiyuan Science and Technology. Эта фабричная территория вобрала в себя самых активных местных рабочих, на пике своего развития на сборочном конвейере фабричной территории работало около 60 000 человек.
Как бы он ни старался, радиус поиска работы студента колледжа Мэн Рана никогда не превышал 5 километров. Однажды он перешел от второй фазы базы маркировки данных к третьей фазе; прежде чем официально стать маркировщиком данных, Foxconn по соседству был местом, где он сжег свою юность.
Мэн Ран однажды приехал на фабрику на два отпуска подряд, чтобы заработать денег, и каждый раз уходил в спешке, получив зарплату в несколько тысяч юаней.
Каждые зимние и летние каникулы у входа в кампус Foxconn полно студентов колледжа с большими и маленькими сумками, цель каждого — получить максимальную скидку и почасовую оплату за весь год. «Все приезжают сюда, чтобы быстро заработать, и они собирают вещи и уезжают, как только заканчивается пиковый сезон. Фабрика слишком занята, чтобы работать, и трудно удержаться на ней долгое время».
Мэн Рану не нравилась рабочая атмосфера в Foxconn. Перед входом в цех нужно сдать электронное оборудование, и единственное, с чем каждый день приходится сталкиваться, — это толпа спешащих рабочих в одинаковой одежде и унылое и холодное здание завода. Когда вы встречаете сварливого лидера команды, вы часто подвергаетесь словесным оскорблениям каждый день.
При запуске производственной линии рабочим необходимо непрерывно устанавливать определенную деталь, и такие действия часто длятся более 10 часов. В полностью закрытом помещении даже транс — роскошь. Мэн Ран не осмеливался перекинуться парой слов с окружающими его рабочими, пока бригадир немного не расслабил свое управление.
В 2018 году, после завершения строительства ближайшей базы маркировки данных, у Мэн Рана появился второй выбор для работы. Всего в квартале от вас есть более удобная работа.
Фэй Вонг работала рекрутером в Foxconn. Низкий сезон на фабрике и кадровые перестановки вкупе с неоднозначными скидками и частыми изменениями в доходах заставляют ее часто впадать в бесконечные конфликты с гастарбайтерами.
"В последние несколько лет порог маркировки данных был низким, а цена за единицу была высокой. Я могла поддерживать ежемесячный доход в размере 4000 юаней, а все проекты, которые я выполняла, были связаны с крупными фабриками, что было относительно безопасно", — Фэй Вонг. видел, как многие квалифицированные рабочие уходили с базы в поисках другой работы, но возвращались по кругу.
Многие аннотаторы имеют те же траектории работы, что и Мэн Ран.Опыт работы на заводах по производству электроники является общим пунктом в их резюме, а фабрика по аннотированию данных стала их следующей остановкой после ухода с завода по производству электроники.
Общие черты большого количества рабочих, значительных доходов и простоты эксплуатации фактически построили двухкилометровый мост, соединивший два суперзавода вместе.
Исчезнувшие проекты и компании
Наклейки интуитивно чувствуют, что хорошие времена подходят к концу.
Исчез проект с ценой за единицу в несколько центов, а цена коробки с этикеткой была снижена до нескольких центов; простая коробка рисования точек плоскости исчезла, замененная проектом облака точек, который требовал многомерной маркировки; штатные сотрудники постепенно покидали команду проекта, а рентабельные стажеры Taller поддерживали более половины рабочей нагрузки.
Хе Цин, владелица компании по маркировке данных, не появлялась на базе полгода, и она постепенно сокращала свои инвестиции в компанию.
Со второй половины прошлого года ее команде ни разу не удавалось получить проекты с большим количеством заказов клиентов, а период выставления счетов клиентам был задержан с трех месяцев до полугода. «Многие небольшие фабрики с недостаточным денежным потоком и отсутствием возможности авансировать капитал закрылись, и члены нашей команды потеряли одну треть».
Три года назад энтузиазм Ли Вэй воспламенился выноской, она была медлительна и плохо общалась, и ей казалось, что она нашла «выбранную» работу.
Ли Вэй взяла на себя проект с ценой за единицу 0,25 юаня. Когда эффективность была высокой, она могла рисовать 1200 кадров в день и зарабатывать почти 8000 юаней в месяц. «Чтобы заработать больше денег, кто-то купил хост и начал работу. дома. Если вы станете опытным, ваш доход увеличится».
Как и все остальные, Ли Вэй смутно чувствовал, что эпоха золотой лихорадки закончилась.
Компания запустила совершенно новый проект.Перед нами предстает уже не реальная дорожная карта, а карта-модель, состоящая из тысяч зеленых, фиолетовых и синих точек.Завершенная картина включает в себя почти сотни отмеченных полей, а набор вопросов состоит из десятков картинок с небольшими отличиями.
«Необходимо многократно переключаться между видом сверху и 3D. Некоторые заблокированные изображения приходится дополнять мозгом, а также требуется контролировать точность кадра на уровне 0,01 метра. Себестоимость выполнения работ становится все ниже и ниже." Пока отклонение от требуемой дальности будет больше на 1 мм, они будут безжалостно отбиты обзором.
Данные, вычислительная мощность и алгоритмы — три краеугольных камня искусственного интеллекта.Чем больше количество и выше качество данных, тем более зрелые большие модели можно обучить, что проявляется в работе аннотаторов, которые постоянно повышают свою точность .
«Правила были скорректированы за последние несколько дней, а требования к точности были повышены до более чем 80%». жаловаться.
Отмеченное изображение должно пройти 2-3 этапа, таких как просмотр и проверка качества, иначе оно не может попасть в расчетный цикл.
Иногда У Ся казалось, что она попала в запутанный лабиринт и не может выбраться, несмотря ни на что. Почти неделю она была занята новым проектом — пока задавала вопросы, ей постоянно перезванивали, из-за чего она впадала в тревогу. «Если вопрос будет возвращаться слишком часто, он будет передан другим людям, и предыдущая энергия будет напрасной».
Беспокойство Мэн Ран было другого рода. С августа прошлого года его работа стала более спокойной, за последние 5 минут накопились десятки тысяч данных, и теперь красная полоса не будет загружаться в течение получаса.
"Возможно, объем данных на платформе уменьшился, а может быть, повысилась эффективность машинного обзора. Чувство неуверенности Мэн Рана быстро подтвердилось. Из-за вынужденного сокращения его рабочей нагрузки его ежедневный доход упал с одной до двухсот юаней до нескольких сотен юаней, десятков долларов.
Гонка на выбывание распространилась среди крупных агентств. Мэн Ран видел, как в одночасье расформировали команду, и более дюжины сотрудников, которым причиталась заработная плата, подали в суд на компанию в бюро по трудоустройству; если бы ситуация была немного лучше, они были бы переданы следующему агенту вместе с компьютером и сотрудниками.
«На всякий случай отправляйтесь в команду из более чем 30 человек», — советует Мэн Ран новичкам.
Аннотатор покидает сцену истории
После недели обучения и полумесячного периода новичка, в мае этого года Сяотин, находившийся в провинции Хунань, наконец приспособился к работе маркировщиком данных, но стал свидетелем быстрого упадка компании вплоть до ее закрытия.
"После одного месяца работы компания не сможет выжить. Босс угощает всех обедом в честь расставания, но зарплату придется подождать несколько месяцев". "мины", и риск намного больше, чем доход.
Будь то предприниматель по маркировке данных или десятки тысяч маркировщиков, нет способа избежать того факта, что ручная маркировка данных постепенно становится незначительной на этапе крупномасштабных моделей.
Что отличается от работы учителя дошкольных учреждений Мэйлин, так это то, что ученики не берутся за работу учителя так быстро. Сегодня технология больших моделей, разработанная разработчиками этикеток, быстро восстанавливает процесс маркировки данных.
Взяв, к примеру, Tesla, с 2018 года компания постоянно совершенствует технологию автоматической маркировки, от ручной 2D-маркировки до автоматической 4D-космической маркировки. Развитие технологий поглотило рабочее пространство для ручной маркировки: в 2021 году команда Tesla по ручной маркировке превысит 1000 человек, а в 2022 году более 200 сотрудников будут уволены.
Другие автомобильные компании, в том числе Xiaopeng Motors и Momo Zhixing, также внедрили инструменты автоматической маркировки. Гу Вейхао, генеральный директор Momo Zhixing, публично заявил, что в настоящее время для получения информации о линиях движения, участниках движения и светофорах стоимость ручной маркировки составляет около 5 юаней за изображение, а стоимость Momo DriveGPT составляет всего 0,5 юаня.
В 2019 году Ву Ди, ИИ-тренер из крупного города, предчувствовал потолок своей карьеры: его компания отвечает за разработку проекта умного обслуживания клиентов платформы электронной коммерции. Прогресс шел быстрее, чем он предполагал: менее чем через год команда по маркировке данных из 10 человек, за которую он отвечал, была уволена, и остались лишь отдельные операторы.
«День, когда проект продолжит развиваться, наступит, когда мы больше не будем нужны».
Эволюция большой модели подобна стремительной реке, всегда совершающей внезапную атаку в определенный момент, оставляя искусственную команду позади.
В отчете об исследовании, проведенном Цюрихским университетом в марте этого года, исследователи на основе фактических измерений обнаружили, что способность обработки ChatGPT в 15 задачах маркировки была выше, чем у краудсорсеров.
В начале апреля этого года Ли Цзе, студент-медик в школе, в течение одного месяца завершил текстовую маркировку крупной фабрики в области медицины.Этот проект будет использоваться для предоставления услуг интеллектуального диалога диагностики, что также сделало Ли Цзе впервые почувствуйте эволюцию больших моделей скорость.
«Вначале мы продолжали загружать платформу классифицированными медицинскими терминами, а на второй неделе система смогла автоматически реализовать базовую классификацию существительных, и уровень точности превысил 90%».
В Тайюане, Шаньси, г-жа Чжоу, мастер базы, начала убеждать новичков браться за более сложные проекты, потому что компании было трудно выдерживать давление отложенных проектов снова и снова. «В настоящее время чем проще этикетировочный бизнес, тем меньше прибыль, и некоторые проекты будут желтыми, если они будут завершены наполовину, а стоимость рабочей силы вообще не может покрыть доход от проекта».
Рекрутер из индустрии маркировки данных сообщил Times Finance, что с этого года порог приема на работу постепенно сместился со студентов младших курсов колледжей на студентов бакалавриата. «Раньше для этикетировщиков практически не требовался опыт работы. Теперь многие компании надеются, что новые сотрудники смогут сразу приступить к работе над проектами, что может снизить первоначальные затраты на обучение».
В настоящее время интеллектуальная маркировка может приблизительно фиксировать основную форму и положение объектов, но с точки зрения точности она все еще отстает от профессиональных этикетировщиков.
Никто не знает, когда умная маркировка приведет к большому взрыву, но Ли Вэй всегда сопровождается чувством незащищенности. Всякий раз, когда она открывает новую страницу проекта, сначала всегда появляется красный прямоугольник, представляющий умную маркировку, как будто постоянно напоминая людям, находящимся перед экраном:
Однажды она займет ее место.
(Все интервьюируемые в этой статье являются псевдонимами.)