No primeiro semestre deste ano, os círculos tecnológicos das cidades de primeira linha foram ativados pela inteligência artificial.
Grandes modelos como Wenxinyiyan, Tongyiqianwen e Light Years Away estão espalhando onda de calor após onda. Figurões com recursos de alto nível estão no centro deste grande evento. Eles enviaram postagens de heróis um após o outro. A batalha por grandes- o talento modelo também está na mesa.
Como um elo intimamente ligado à cadeia da indústria de IA, a Taiyuan Data Industry Base em Shanxi, a 500 quilômetros de Pequim, é calma, com milhares de rotulados de inteligência artificial reunidos aqui. Os temas de que falaram giraram em torno do andamento do projeto, do ritmo de retirada da caixa para o padrão e das três refeições diárias.
“A empolgação é deles e só temos inúmeras caixas.” Um rotulador de dados disse ao Times Finance.
Na memória de He Qing, dono da empresa de rotulagem de dados, a emoção aconteceu há quatro ou cinco anos. Pela primeira vez, a brisa da primavera da inteligência artificial soprou nesta cidade do meio-oeste. Empresários sensíveis começaram a traçar território e recrutar pessoas, fornecendo um fluxo constante de "nutrição" para a inteligência artificial. A maioria deles são leigos em inteligência artificial, por causa da repentina grande demanda de mão de obra, eles têm uma conexão maravilhosa com tecnologia de ponta.
"Naquela época, muitos chefes traziam todos os membros de sua família para cá e podiam ganhar dinheiro apenas movendo os dedos." He Qing ouviu muitas notícias empolgantes na indústria de rotulagem de dados - algumas pessoas ganham milhões em três meses e outros As ordens que são agarradas podem ser enfileiradas ao segundo ano.
Mas esses dias bons estão gradualmente desaparecendo.
"Pipeline" decente
Às 8h45 da manhã, uma densa multidão de pessoas bloqueou a entrada do elevador, apenas um terço das pessoas se espremeu no primeiro elevador, e o destino final de todos era o sexto andar.
A porta do elevador se abriu lentamente e a multidão se espalhou em todas as direções e entrou em escritórios onde não havia diferença. O espaço de cerca de 100 metros quadrados estava cheio de centenas de computadores. pés.
“Contanto que você siga o número da casa e pergunte um por um, tudo será marcado com dados.” O vendedor no andar térreo do parque assim o descreveu.
Essa base de rotulagem de dados, que atraiu quase mil pessoas, é como um cibercafé escondido no parque. As pessoas sentadas em frente aos computadores clicam habilmente no teclado e no mouse, e as mesas de cerca de um metro quadrado são ocupadas por computadores enormes.
Fonte do rotulador de dados no trabalho: Foto do Times Finance
A única coisa que pode mostrar sua individualidade são os fones de ouvido coloridos que usam na cabeça.Eles têm uma identidade comum: data labelers.
O mouse clicou nos botões esquerdo e direito para frente e para trás, e as imagens na tela aumentaram e diminuíram o zoom, e o cursor rapidamente desenhou quadros de tamanhos diferentes... Depois que as ações repetidas duraram meia hora, Meiling torceu levemente o pescoço , e os ossos em sua coluna rangeram.
"É o suficiente para os recém-chegados passarem a primeira semana, e é rápido se acostumar com isso." Meiling disse ao Times Finance enquanto ainda olhava para a tela. O número de pessoas que desistem na primeira semana chega a 30%. .
A cada duas semanas, Zhou, a capataz, leva mais de uma dúzia de recém-chegados a iniciar seus aprendizados.Tal trabalho repetitivo e enfadonho dissuadiu muitos jovens.
Há dois anos, Meiling deixou de ser professora de jardim de infância para se tornar uma rotuladora de dados. Em sua cidade natal, Luliang, há poucos empregos, e o telemarketing é um dos destinos mais respeitáveis.Agora, sob a influência da onda de inteligência artificial, os rotuladores de dados oferecem outra opção para as mulheres do condado.
Seis meses atrás, devido à mudança da base da marca, Meiling mudou-se de sua cidade natal para Taiyuan, a capital da província. "A direção automática ou o reconhecimento facial não requer a participação de rotuladoras em larga escala." Ela mostrou um olhar orgulhoso. Aos olhos de sua família, sentada em um escritório e operando um computador, com uma renda mensal de mais de 3.000 yuans , o tratamento já ultrapassou a maior parte do concelho. Já está a funcionar.
Em 2005, Zhu Songchun, um especialista em visão computacional, voltou para sua cidade natal de Ezhou, Hubei, dos Estados Unidos, fundou o Lianhuashan Research Institute e formou a primeira equipe de rotulagem de big data na China. Posteriormente, fábricas de rotulagem de dados gradualmente se enraizaram em cidades de segundo e terceiro níveis, e clusters industriais apareceram em Hebei, Henan, Shandong, Shanxi e outras regiões.
Por meio do treinamento repetido de rótulos, a inteligência artificial pode chegar ao momento do "despertar".Na visão de Meiling, isso é o mesmo que o trabalho anterior de professores de jardim de infância.
A rotulagem de dados é o primeiro elo no nascimento de produtos de inteligência artificial, seguido pelo treinamento e otimização de modelos, gerenciamento de modelos, aplicativos de raciocínio, etc. A alimentação de produtos de inteligência artificial requer centenas de milhões de dados, que primeiro fluirão para os computadores das "belezas".
No entanto, a fantasia de "alta tecnologia" de Meiling foi destruída aos poucos pelo som repetitivo do mouse mecânico. Ela calculou que 1.500 quadros é o limite da carga de trabalho diária. Assim que essa linha de alerta for ultrapassada, os globos oculares ficarão doloridos.
Depois de sair do trabalho, mesmo de frente para a TV, o que ela vê é um mosaico em mosaico, que se parece com imagens difusas que precisam ser marcadas após o zoom.
“Sempre há rostos desconhecidos no assento ao lado e há pouca comunicação entre os colegas.” Depois de trabalhar por um ano e meio, Wu Xia, que trabalha na mesma base, ainda não se acostumou com o silêncio do escritório. .
Depois de se formar na faculdade, ela originalmente entrou na fábrica com seus colegas de classe, mas por causa das mudanças no projeto e da saída dos colegas, ela se tornou uma "guarda solitária". Assim que a obra começou, o escritório virou uma “oficina” onde começou a linha de montagem automatizada, com clima industrial frio e pouco humano.
Uma das características da indústria de rotulagem de dados é a contagem individual de peças e a não necessidade de trabalho em equipe, o que forma um método de gerenciamento diferente daquele dos trabalhadores de colarinho branco comuns.
Aqui, os rotuladores não têm uma posição fixa, mas atribuem aleatoriamente centenas de pessoas à direção do fluxo de acordo com as alterações do projeto. O projeto mais longo é de 2 a 3 meses, e o projeto de curto prazo é de apenas 2 a 3 dias.Uma equipe de projeto de mais de uma dúzia de pessoas tem um administrador para acompanhar o andamento do trabalho de todos.
Os anotadores não gastarão sua energia gerenciando o relacionamento entre colegas. O tipo de trabalho por tarefa presta atenção à eficiência e concentração, e tempo e dinheiro estão ligados. Para completar o padrão médio de 1.000 quadros significa que uma média de 2 quadros deve ser concluída por minuto .
"Quando você fala com outras pessoas, perde algumas caixas de dinheiro", disse Meiling.
Trabalhadores da Foxconn seguem para a fábrica de etiquetas
No parque de rotulagem de dados, também existem institutos de pesquisa de tecnologia espalhados e bases empresariais para estudantes estrangeiros. Na opinião de Meng Ran, essas posições de "alto nível" estão longe dele.
Antes de entrar na universidade, ele nunca deixou sua cidade natal, Linfen.Depois de se formar na universidade, sua família esperava que ele não deixasse a província. A dois quilômetros da base está o Parque Industrial de Ciência e Tecnologia Foxconn Taiyuan. Esta área fabril absorveu os trabalhadores locais mais ativos.No seu auge, cerca de 60.000 pessoas estavam ativas na linha de montagem da área fabril.
Não importa o quanto ele tentasse, o raio de procura de emprego do estudante universitário Meng Ran nunca excedia 5 quilômetros. Certa vez, ele passou da segunda fase da base de rotulagem de dados para a terceira fase; antes de se tornar oficialmente um rotulador de dados, a Foxconn vizinha foi o lugar onde ele queimou sua juventude.
A fonte do parque Foxconn fica a menos de 2 quilômetros da base de rotulagem de dados: Foto do Times Finance
Meng Ran uma vez entrou na fábrica por duas férias consecutivas para ganhar dinheiro, e todas as vezes ele saiu com pressa depois de receber um salário de vários milhares de yuans.
A cada inverno e verão, a entrada do campus da Foxconn fica cheia de estudantes universitários com sacolas grandes e pequenas, e o objetivo de todos é obter o maior desconto e taxa por hora em todo o ano. "Todo mundo vem aqui para ganhar dinheiro rápido e faz as malas e vai embora assim que termina a alta temporada. A fábrica está muito ocupada para trabalhar e é difícil mantê-la por muito tempo."
Meng Ran não gostou do ambiente de trabalho na Foxconn. Antes de entrar na oficina, o equipamento eletrônico deve ser entregue, e a única coisa que resta para enfrentar todos os dias é a multidão de trabalhadores apressados com roupas semelhantes e o prédio sombrio e frio da fábrica. Quando você encontra um líder de equipe mal-humorado, é comum que você seja agredido verbalmente todos os dias.
Com o barulho da linha de produção iniciando, os trabalhadores precisam instalar uma determinada peça continuamente, e essas ações geralmente duram mais de 10 horas. Em um espaço completamente fechado, até o transe é um luxo. Meng Ran não se atreveu a trocar algumas palavras com os trabalhadores ao seu redor até que o capataz relaxasse um pouco sua gestão.
Em 2018, após a conclusão da base de rotulagem de dados próxima, Meng Ran teve uma segunda escolha para seu trabalho. A apenas um quarteirão de distância, há um trabalho mais confortável ao seu alcance.
Faye Wong costumava ser recrutadora da Foxconn. A baixa temporada da fábrica e as mudanças de pessoal, juntamente com descontos ambíguos e mudanças frequentes na renda, fazem com que ela frequentemente entre em conflitos intermináveis com trabalhadores migrantes. Os anotadores são uma escolha melhor para ela.
"Nos últimos anos, o limite de rotulagem de dados era baixo e o preço unitário era alto. Eu conseguia manter uma renda mensal de 4.000 yuans, e os projetos que eu fazia eram todos relacionados a grandes fábricas, o que era relativamente seguro." Faye Wong viu muitos trabalhadores qualificados deixarem a base para procurar outro emprego Fora do caminho, mas de volta em um círculo.
Muitos anotadores têm trajetórias de trabalho semelhantes às de Meng Ran. A experiência de trabalho em fábricas de eletrônicos é o ponto comum de seus currículos, e a fábrica de anotações de dados se tornou sua próxima parada depois de deixar a fundição de eletrônicos.
As características comuns de grande número de trabalhadores, renda considerável e operação simples construíram uma ponte de dois quilômetros virtualmente, conectando as duas superfábricas.
Projetos e empresas desaparecidas
Para os rotuladores, um sentimento intuitivo é que os bons tempos estão chegando ao fim.
O projeto com um preço unitário de alguns centavos desapareceu e o preço de uma caixa de etiqueta foi reduzido para alguns centavos; a caixa de desenho de ponto de desenho plano simples desapareceu, substituída por um projeto de nuvem de pontos que exigia rotulagem multidimensional; funcionários regulares deixou gradualmente a equipe do projeto, e os estagiários do Taller, com boa relação custo-benefício, suportaram mais da metade da carga de trabalho.
He Qing, proprietária da empresa de rotulagem de dados, não vai à base há meio ano e reduziu gradualmente seu investimento na empresa.
Desde o segundo semestre do ano passado, sua equipe nunca mais conseguiu receber projetos com muitos pedidos de clientes, e o período de cobrança do cliente atrasou de três meses para meio ano. "Muitas pequenas fábricas com fluxo de caixa insuficiente e sem capacidade de adiantar capital fecharam e os membros de nossa equipe perderam um terço."
Três anos atrás, o entusiasmo de Li Wei foi inflamado pelo quadro explicativo. Ela era lenta e não era boa em comunicação, e sentiu que havia encontrado um emprego "escolhido".
Li Wei assumiu o projeto com um preço unitário de 0,25 yuan. Quando a eficiência era alta, ela podia desenhar 1.200 quadros por dia e ganhar quase 8.000 yuans por mês. "Para ganhar mais dinheiro, alguém comprou um host e começou a trabalhar em casa. Se você se tornar proficiente, sua renda aumentará.
Como todo mundo, Li Wei sentiu vagamente que a era da corrida do ouro havia acabado.
A empresa lançou um projeto totalmente novo. O que está diante de nós não é mais um roteiro do mundo real, mas um mapa modelo composto por milhares de pontos verdes, roxos e azuis. Uma imagem completa inclui quase uma centena de caixas marcadas e um conjunto de perguntas é composto por dezenas de imagens com apenas diferenças sutis.
Fonte do diagrama de interface de operação complicada: fornecida pelo entrevistado
"É necessário alternar repetidamente entre a visão plana e 3D. Algumas imagens bloqueadas precisam ser complementadas pelo cérebro, e a precisão do quadro também deve ser controlada em 0,01 metros. O desempenho de custo do trabalho está diminuindo e mais baixo." Contanto que o desvio do intervalo necessário seja 1 mm a mais, eles serão impiedosamente derrotados pela revisão.
Dados, poder de computação e algoritmos são os três pilares da inteligência artificial. Quanto maior a quantidade e a qualidade dos dados, mais maduros grandes modelos podem ser treinados, o que se manifesta no trabalho de anotadores que estão constantemente melhorando sua precisão .
"As regras foram ajustadas nos últimos dias e o requisito de precisão foi aumentado para mais de 80%." A precisão tornou-se o "ponto mortal" dos rotuladores e também é um vocabulário de alta frequência que aparece reclamar.
Uma imagem marcada deve passar por 2-3 etapas, como revisão e inspeção de qualidade, caso contrário, não poderá entrar no ciclo de liquidação.
Às vezes, Wu Xia sentia como se estivesse presa em um labirinto complicado e não conseguia sair de jeito nenhum. Ela estava ocupada com um novo projeto há quase uma semana - enquanto enviava as perguntas, era constantemente chamada de volta, o que a fazia ficar ansiosa. "Se a pergunta for devolvida com muita frequência, ela será atribuída a outras pessoas e a energia anterior será em vão."
A ansiedade de Meng Ran era de outro tipo. Desde agosto do ano passado, seu trabalho ficou mais relaxado.Nos últimos 5 minutos, dezenas de milhares de dados foram acumulados e agora não haverá linha vermelha sem carga por meia hora.
"Pode ser que a quantidade de dados na plataforma tenha diminuído, ou pode ser que a eficiência da revisão da máquina tenha aumentado." A sensação de insegurança de Meng Ran foi rapidamente confirmada. Devido à redução forçada em sua carga de trabalho, sua renda diária caiu de um para duzentos yuans para algumas centenas de yuans, dezenas de dólares.
Uma corrida eliminatória se espalhou entre as grandes agências. Meng Ran viu uma equipe ser dissolvida da noite para o dia e mais de uma dúzia de funcionários com salários devidos processaram a empresa no departamento de trabalho; se a situação fosse um pouco melhor, eles seriam transferidos para o próximo agente junto com o computador e os funcionários.
“Para estar no lado seguro, vá para uma equipe com mais de 30 pessoas.” Este é o conselho de Meng Ran para os recém-chegados.
Anotador está saindo do palco da história
Após uma semana de treinamento e meio mês de iniciante, em maio deste ano, Xiaoting, que estava em Hunan, finalmente se adaptou a ser um rotulador de dados, mas testemunhou o rápido declínio da empresa até seu fim.
"Depois de um mês de emprego, a empresa não conseguirá sobreviver. O chefe oferece a todos uma refeição de despedida, mas o salário terá que esperar alguns meses." Na visão de Xiaoting, a atual indústria de rotulagem de dados está cheia de "minas terrestres", e o risco é muito maior do que a renda.
Seja um empresário de rotulagem de dados ou dezenas de milhares de rotuladoras, não há como evitar o fato de que a rotulagem manual de dados está gradualmente se tornando insignificante no palco de modelos em grande escala.
O que é diferente do trabalho do professor de pré-escola de Meiling é que os alunos não aceitarão o trabalho do professor tão rapidamente. Hoje, a tecnologia de modelo grande alimentada por rotuladoras está alimentando rapidamente o processo de rotulagem de dados.
Tomando a Tesla como exemplo, ela desenvolveu continuamente a tecnologia de rotulagem automática desde 2018, desde a rotulagem manual 2D até a rotulagem automática espacial 4D. O avanço da tecnologia devorou o espaço operacional para rotulagem manual. Em 2021, a equipe de rotulagem manual da Tesla ultrapassará 1.000 pessoas e, em 2022, mais de 200 funcionários serão demitidos.
Outras montadoras, incluindo Xiaopeng Motors e Momo Zhixing, também lançaram ferramentas de etiquetagem automática. Gu Weihao, CEO da Momo Zhixing, declarou publicamente que atualmente, para obter linhas de pista, participantes do tráfego e informações de semáforos, o custo da rotulagem manual é de cerca de 5 yuans por imagem, enquanto o custo do Momo DriveGPT é de apenas 0,5 yuan.
Em 2019, Wu Di, um instrutor de dados de IA em uma cidade de primeira linha, teve uma premonição do teto de sua carreira. Sua empresa é responsável por desenvolver o projeto de atendimento inteligente da plataforma de e-commerce. O progresso foi mais rápido do que ele imaginava: em menos de um ano, a equipe de rotulagem de dados de 10 pessoas que ele comandava foi cortada, restando apenas operadores esporádicos.
"O dia em que o projeto continua a amadurecer é quando não somos mais necessários."
A evolução do modelo grande é como um rio caudaloso, sempre fazendo um ataque surpresa em determinado momento, deixando para trás o time artificial.
Em um relatório de pesquisa da Universidade de Zurique em março deste ano, os pesquisadores descobriram, por meio de medições reais, que a capacidade de processamento do ChatGPT em 15 tarefas de rotulagem era maior do que a dos crowdsourcers.
No início de abril deste ano, Li Jie, um estudante de medicina da escola, concluiu em um mês a rotulagem de texto de uma grande fábrica na área médica. Este projeto será usado para fornecer serviços de diálogo de diagnóstico inteligente, o que também tornou Li Jie sinta pela primeira vez a evolução de grandes modelos.velocidade.
"No início, continuamos alimentando a plataforma com termos médicos classificados e, na segunda semana, o sistema conseguiu realizar automaticamente a classificação básica de substantivos e a taxa de precisão ultrapassou 90%."
Em Taiyuan, Shanxi, a Sra. Zhou, a capataz da base, começou a persuadir os recém-chegados a assumir projetos mais difíceis, porque era difícil para a empresa suportar a pressão de projetos sendo arquivados repetidamente. "Atualmente, quanto mais simples o negócio de rotulagem, menor o lucro, e alguns projetos ficarão amarelos se forem concluídos pela metade, e o custo da mão de obra não poderá cobrir a receita do projeto."
Um recrutador da indústria de rotulagem de dados disse ao Times Finance que, desde este ano, o limite de recrutamento mudou gradualmente de estudantes universitários para estudantes de graduação. "No passado, basicamente não havia exigência de experiência para rotuladoras. Agora, muitas empresas esperam que os novos funcionários possam começar a trabalhar diretamente em projetos, o que pode reduzir os custos iniciais de treinamento."
No momento, a rotulagem inteligente pode capturar aproximadamente a forma básica e a posição dos objetos, mas em termos de precisão, ela ainda fica atrás dos rotuladores profissionais.
Ninguém sabe quando a rotulagem inteligente dará início a uma grande explosão, mas Li Wei está sempre acompanhado por uma sensação de insegurança. Sempre que ela abre uma nova página de projeto, a caixa vermelha que representa a rotulagem inteligente sempre aparece primeiro, como se lembrasse as pessoas na frente da tela o tempo todo:
Um dia, ele tomará o lugar dela.
(Os entrevistados neste artigo são todos pseudônimos.)
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Funcionários da Foxconn vão para a fábrica de rotulagem de IA
Fonte original: Times Finance
No primeiro semestre deste ano, os círculos tecnológicos das cidades de primeira linha foram ativados pela inteligência artificial.
Grandes modelos como Wenxinyiyan, Tongyiqianwen e Light Years Away estão espalhando onda de calor após onda. Figurões com recursos de alto nível estão no centro deste grande evento. Eles enviaram postagens de heróis um após o outro. A batalha por grandes- o talento modelo também está na mesa.
Como um elo intimamente ligado à cadeia da indústria de IA, a Taiyuan Data Industry Base em Shanxi, a 500 quilômetros de Pequim, é calma, com milhares de rotulados de inteligência artificial reunidos aqui. Os temas de que falaram giraram em torno do andamento do projeto, do ritmo de retirada da caixa para o padrão e das três refeições diárias.
“A empolgação é deles e só temos inúmeras caixas.” Um rotulador de dados disse ao Times Finance.
Na memória de He Qing, dono da empresa de rotulagem de dados, a emoção aconteceu há quatro ou cinco anos. Pela primeira vez, a brisa da primavera da inteligência artificial soprou nesta cidade do meio-oeste. Empresários sensíveis começaram a traçar território e recrutar pessoas, fornecendo um fluxo constante de "nutrição" para a inteligência artificial. A maioria deles são leigos em inteligência artificial, por causa da repentina grande demanda de mão de obra, eles têm uma conexão maravilhosa com tecnologia de ponta.
"Naquela época, muitos chefes traziam todos os membros de sua família para cá e podiam ganhar dinheiro apenas movendo os dedos." He Qing ouviu muitas notícias empolgantes na indústria de rotulagem de dados - algumas pessoas ganham milhões em três meses e outros As ordens que são agarradas podem ser enfileiradas ao segundo ano.
Mas esses dias bons estão gradualmente desaparecendo.
"Pipeline" decente
Às 8h45 da manhã, uma densa multidão de pessoas bloqueou a entrada do elevador, apenas um terço das pessoas se espremeu no primeiro elevador, e o destino final de todos era o sexto andar.
A porta do elevador se abriu lentamente e a multidão se espalhou em todas as direções e entrou em escritórios onde não havia diferença. O espaço de cerca de 100 metros quadrados estava cheio de centenas de computadores. pés.
“Contanto que você siga o número da casa e pergunte um por um, tudo será marcado com dados.” O vendedor no andar térreo do parque assim o descreveu.
Essa base de rotulagem de dados, que atraiu quase mil pessoas, é como um cibercafé escondido no parque. As pessoas sentadas em frente aos computadores clicam habilmente no teclado e no mouse, e as mesas de cerca de um metro quadrado são ocupadas por computadores enormes.
A única coisa que pode mostrar sua individualidade são os fones de ouvido coloridos que usam na cabeça.Eles têm uma identidade comum: data labelers.
O mouse clicou nos botões esquerdo e direito para frente e para trás, e as imagens na tela aumentaram e diminuíram o zoom, e o cursor rapidamente desenhou quadros de tamanhos diferentes... Depois que as ações repetidas duraram meia hora, Meiling torceu levemente o pescoço , e os ossos em sua coluna rangeram.
"É o suficiente para os recém-chegados passarem a primeira semana, e é rápido se acostumar com isso." Meiling disse ao Times Finance enquanto ainda olhava para a tela. O número de pessoas que desistem na primeira semana chega a 30%. .
A cada duas semanas, Zhou, a capataz, leva mais de uma dúzia de recém-chegados a iniciar seus aprendizados.Tal trabalho repetitivo e enfadonho dissuadiu muitos jovens.
Há dois anos, Meiling deixou de ser professora de jardim de infância para se tornar uma rotuladora de dados. Em sua cidade natal, Luliang, há poucos empregos, e o telemarketing é um dos destinos mais respeitáveis.Agora, sob a influência da onda de inteligência artificial, os rotuladores de dados oferecem outra opção para as mulheres do condado.
Seis meses atrás, devido à mudança da base da marca, Meiling mudou-se de sua cidade natal para Taiyuan, a capital da província. "A direção automática ou o reconhecimento facial não requer a participação de rotuladoras em larga escala." Ela mostrou um olhar orgulhoso. Aos olhos de sua família, sentada em um escritório e operando um computador, com uma renda mensal de mais de 3.000 yuans , o tratamento já ultrapassou a maior parte do concelho. Já está a funcionar.
Em 2005, Zhu Songchun, um especialista em visão computacional, voltou para sua cidade natal de Ezhou, Hubei, dos Estados Unidos, fundou o Lianhuashan Research Institute e formou a primeira equipe de rotulagem de big data na China. Posteriormente, fábricas de rotulagem de dados gradualmente se enraizaram em cidades de segundo e terceiro níveis, e clusters industriais apareceram em Hebei, Henan, Shandong, Shanxi e outras regiões.
Por meio do treinamento repetido de rótulos, a inteligência artificial pode chegar ao momento do "despertar".Na visão de Meiling, isso é o mesmo que o trabalho anterior de professores de jardim de infância.
A rotulagem de dados é o primeiro elo no nascimento de produtos de inteligência artificial, seguido pelo treinamento e otimização de modelos, gerenciamento de modelos, aplicativos de raciocínio, etc. A alimentação de produtos de inteligência artificial requer centenas de milhões de dados, que primeiro fluirão para os computadores das "belezas".
No entanto, a fantasia de "alta tecnologia" de Meiling foi destruída aos poucos pelo som repetitivo do mouse mecânico. Ela calculou que 1.500 quadros é o limite da carga de trabalho diária. Assim que essa linha de alerta for ultrapassada, os globos oculares ficarão doloridos.
Depois de sair do trabalho, mesmo de frente para a TV, o que ela vê é um mosaico em mosaico, que se parece com imagens difusas que precisam ser marcadas após o zoom.
“Sempre há rostos desconhecidos no assento ao lado e há pouca comunicação entre os colegas.” Depois de trabalhar por um ano e meio, Wu Xia, que trabalha na mesma base, ainda não se acostumou com o silêncio do escritório. .
Depois de se formar na faculdade, ela originalmente entrou na fábrica com seus colegas de classe, mas por causa das mudanças no projeto e da saída dos colegas, ela se tornou uma "guarda solitária". Assim que a obra começou, o escritório virou uma “oficina” onde começou a linha de montagem automatizada, com clima industrial frio e pouco humano.
Uma das características da indústria de rotulagem de dados é a contagem individual de peças e a não necessidade de trabalho em equipe, o que forma um método de gerenciamento diferente daquele dos trabalhadores de colarinho branco comuns.
Aqui, os rotuladores não têm uma posição fixa, mas atribuem aleatoriamente centenas de pessoas à direção do fluxo de acordo com as alterações do projeto. O projeto mais longo é de 2 a 3 meses, e o projeto de curto prazo é de apenas 2 a 3 dias.Uma equipe de projeto de mais de uma dúzia de pessoas tem um administrador para acompanhar o andamento do trabalho de todos.
Os anotadores não gastarão sua energia gerenciando o relacionamento entre colegas. O tipo de trabalho por tarefa presta atenção à eficiência e concentração, e tempo e dinheiro estão ligados. Para completar o padrão médio de 1.000 quadros significa que uma média de 2 quadros deve ser concluída por minuto .
"Quando você fala com outras pessoas, perde algumas caixas de dinheiro", disse Meiling.
Trabalhadores da Foxconn seguem para a fábrica de etiquetas
No parque de rotulagem de dados, também existem institutos de pesquisa de tecnologia espalhados e bases empresariais para estudantes estrangeiros. Na opinião de Meng Ran, essas posições de "alto nível" estão longe dele.
Antes de entrar na universidade, ele nunca deixou sua cidade natal, Linfen.Depois de se formar na universidade, sua família esperava que ele não deixasse a província. A dois quilômetros da base está o Parque Industrial de Ciência e Tecnologia Foxconn Taiyuan. Esta área fabril absorveu os trabalhadores locais mais ativos.No seu auge, cerca de 60.000 pessoas estavam ativas na linha de montagem da área fabril.
Não importa o quanto ele tentasse, o raio de procura de emprego do estudante universitário Meng Ran nunca excedia 5 quilômetros. Certa vez, ele passou da segunda fase da base de rotulagem de dados para a terceira fase; antes de se tornar oficialmente um rotulador de dados, a Foxconn vizinha foi o lugar onde ele queimou sua juventude.
Meng Ran uma vez entrou na fábrica por duas férias consecutivas para ganhar dinheiro, e todas as vezes ele saiu com pressa depois de receber um salário de vários milhares de yuans.
A cada inverno e verão, a entrada do campus da Foxconn fica cheia de estudantes universitários com sacolas grandes e pequenas, e o objetivo de todos é obter o maior desconto e taxa por hora em todo o ano. "Todo mundo vem aqui para ganhar dinheiro rápido e faz as malas e vai embora assim que termina a alta temporada. A fábrica está muito ocupada para trabalhar e é difícil mantê-la por muito tempo."
Meng Ran não gostou do ambiente de trabalho na Foxconn. Antes de entrar na oficina, o equipamento eletrônico deve ser entregue, e a única coisa que resta para enfrentar todos os dias é a multidão de trabalhadores apressados com roupas semelhantes e o prédio sombrio e frio da fábrica. Quando você encontra um líder de equipe mal-humorado, é comum que você seja agredido verbalmente todos os dias.
Com o barulho da linha de produção iniciando, os trabalhadores precisam instalar uma determinada peça continuamente, e essas ações geralmente duram mais de 10 horas. Em um espaço completamente fechado, até o transe é um luxo. Meng Ran não se atreveu a trocar algumas palavras com os trabalhadores ao seu redor até que o capataz relaxasse um pouco sua gestão.
Em 2018, após a conclusão da base de rotulagem de dados próxima, Meng Ran teve uma segunda escolha para seu trabalho. A apenas um quarteirão de distância, há um trabalho mais confortável ao seu alcance.
Faye Wong costumava ser recrutadora da Foxconn. A baixa temporada da fábrica e as mudanças de pessoal, juntamente com descontos ambíguos e mudanças frequentes na renda, fazem com que ela frequentemente entre em conflitos intermináveis com trabalhadores migrantes. Os anotadores são uma escolha melhor para ela.
"Nos últimos anos, o limite de rotulagem de dados era baixo e o preço unitário era alto. Eu conseguia manter uma renda mensal de 4.000 yuans, e os projetos que eu fazia eram todos relacionados a grandes fábricas, o que era relativamente seguro." Faye Wong viu muitos trabalhadores qualificados deixarem a base para procurar outro emprego Fora do caminho, mas de volta em um círculo.
Muitos anotadores têm trajetórias de trabalho semelhantes às de Meng Ran. A experiência de trabalho em fábricas de eletrônicos é o ponto comum de seus currículos, e a fábrica de anotações de dados se tornou sua próxima parada depois de deixar a fundição de eletrônicos.
As características comuns de grande número de trabalhadores, renda considerável e operação simples construíram uma ponte de dois quilômetros virtualmente, conectando as duas superfábricas.
Projetos e empresas desaparecidas
Para os rotuladores, um sentimento intuitivo é que os bons tempos estão chegando ao fim.
O projeto com um preço unitário de alguns centavos desapareceu e o preço de uma caixa de etiqueta foi reduzido para alguns centavos; a caixa de desenho de ponto de desenho plano simples desapareceu, substituída por um projeto de nuvem de pontos que exigia rotulagem multidimensional; funcionários regulares deixou gradualmente a equipe do projeto, e os estagiários do Taller, com boa relação custo-benefício, suportaram mais da metade da carga de trabalho.
He Qing, proprietária da empresa de rotulagem de dados, não vai à base há meio ano e reduziu gradualmente seu investimento na empresa.
Desde o segundo semestre do ano passado, sua equipe nunca mais conseguiu receber projetos com muitos pedidos de clientes, e o período de cobrança do cliente atrasou de três meses para meio ano. "Muitas pequenas fábricas com fluxo de caixa insuficiente e sem capacidade de adiantar capital fecharam e os membros de nossa equipe perderam um terço."
Três anos atrás, o entusiasmo de Li Wei foi inflamado pelo quadro explicativo. Ela era lenta e não era boa em comunicação, e sentiu que havia encontrado um emprego "escolhido".
Li Wei assumiu o projeto com um preço unitário de 0,25 yuan. Quando a eficiência era alta, ela podia desenhar 1.200 quadros por dia e ganhar quase 8.000 yuans por mês. "Para ganhar mais dinheiro, alguém comprou um host e começou a trabalhar em casa. Se você se tornar proficiente, sua renda aumentará.
Como todo mundo, Li Wei sentiu vagamente que a era da corrida do ouro havia acabado.
A empresa lançou um projeto totalmente novo. O que está diante de nós não é mais um roteiro do mundo real, mas um mapa modelo composto por milhares de pontos verdes, roxos e azuis. Uma imagem completa inclui quase uma centena de caixas marcadas e um conjunto de perguntas é composto por dezenas de imagens com apenas diferenças sutis.
"É necessário alternar repetidamente entre a visão plana e 3D. Algumas imagens bloqueadas precisam ser complementadas pelo cérebro, e a precisão do quadro também deve ser controlada em 0,01 metros. O desempenho de custo do trabalho está diminuindo e mais baixo." Contanto que o desvio do intervalo necessário seja 1 mm a mais, eles serão impiedosamente derrotados pela revisão.
Dados, poder de computação e algoritmos são os três pilares da inteligência artificial. Quanto maior a quantidade e a qualidade dos dados, mais maduros grandes modelos podem ser treinados, o que se manifesta no trabalho de anotadores que estão constantemente melhorando sua precisão .
"As regras foram ajustadas nos últimos dias e o requisito de precisão foi aumentado para mais de 80%." A precisão tornou-se o "ponto mortal" dos rotuladores e também é um vocabulário de alta frequência que aparece reclamar.
Uma imagem marcada deve passar por 2-3 etapas, como revisão e inspeção de qualidade, caso contrário, não poderá entrar no ciclo de liquidação.
Às vezes, Wu Xia sentia como se estivesse presa em um labirinto complicado e não conseguia sair de jeito nenhum. Ela estava ocupada com um novo projeto há quase uma semana - enquanto enviava as perguntas, era constantemente chamada de volta, o que a fazia ficar ansiosa. "Se a pergunta for devolvida com muita frequência, ela será atribuída a outras pessoas e a energia anterior será em vão."
A ansiedade de Meng Ran era de outro tipo. Desde agosto do ano passado, seu trabalho ficou mais relaxado.Nos últimos 5 minutos, dezenas de milhares de dados foram acumulados e agora não haverá linha vermelha sem carga por meia hora.
"Pode ser que a quantidade de dados na plataforma tenha diminuído, ou pode ser que a eficiência da revisão da máquina tenha aumentado." A sensação de insegurança de Meng Ran foi rapidamente confirmada. Devido à redução forçada em sua carga de trabalho, sua renda diária caiu de um para duzentos yuans para algumas centenas de yuans, dezenas de dólares.
Uma corrida eliminatória se espalhou entre as grandes agências. Meng Ran viu uma equipe ser dissolvida da noite para o dia e mais de uma dúzia de funcionários com salários devidos processaram a empresa no departamento de trabalho; se a situação fosse um pouco melhor, eles seriam transferidos para o próximo agente junto com o computador e os funcionários.
“Para estar no lado seguro, vá para uma equipe com mais de 30 pessoas.” Este é o conselho de Meng Ran para os recém-chegados.
Anotador está saindo do palco da história
Após uma semana de treinamento e meio mês de iniciante, em maio deste ano, Xiaoting, que estava em Hunan, finalmente se adaptou a ser um rotulador de dados, mas testemunhou o rápido declínio da empresa até seu fim.
"Depois de um mês de emprego, a empresa não conseguirá sobreviver. O chefe oferece a todos uma refeição de despedida, mas o salário terá que esperar alguns meses." Na visão de Xiaoting, a atual indústria de rotulagem de dados está cheia de "minas terrestres", e o risco é muito maior do que a renda.
Seja um empresário de rotulagem de dados ou dezenas de milhares de rotuladoras, não há como evitar o fato de que a rotulagem manual de dados está gradualmente se tornando insignificante no palco de modelos em grande escala.
O que é diferente do trabalho do professor de pré-escola de Meiling é que os alunos não aceitarão o trabalho do professor tão rapidamente. Hoje, a tecnologia de modelo grande alimentada por rotuladoras está alimentando rapidamente o processo de rotulagem de dados.
Tomando a Tesla como exemplo, ela desenvolveu continuamente a tecnologia de rotulagem automática desde 2018, desde a rotulagem manual 2D até a rotulagem automática espacial 4D. O avanço da tecnologia devorou o espaço operacional para rotulagem manual. Em 2021, a equipe de rotulagem manual da Tesla ultrapassará 1.000 pessoas e, em 2022, mais de 200 funcionários serão demitidos.
Outras montadoras, incluindo Xiaopeng Motors e Momo Zhixing, também lançaram ferramentas de etiquetagem automática. Gu Weihao, CEO da Momo Zhixing, declarou publicamente que atualmente, para obter linhas de pista, participantes do tráfego e informações de semáforos, o custo da rotulagem manual é de cerca de 5 yuans por imagem, enquanto o custo do Momo DriveGPT é de apenas 0,5 yuan.
Em 2019, Wu Di, um instrutor de dados de IA em uma cidade de primeira linha, teve uma premonição do teto de sua carreira. Sua empresa é responsável por desenvolver o projeto de atendimento inteligente da plataforma de e-commerce. O progresso foi mais rápido do que ele imaginava: em menos de um ano, a equipe de rotulagem de dados de 10 pessoas que ele comandava foi cortada, restando apenas operadores esporádicos.
"O dia em que o projeto continua a amadurecer é quando não somos mais necessários."
A evolução do modelo grande é como um rio caudaloso, sempre fazendo um ataque surpresa em determinado momento, deixando para trás o time artificial.
Em um relatório de pesquisa da Universidade de Zurique em março deste ano, os pesquisadores descobriram, por meio de medições reais, que a capacidade de processamento do ChatGPT em 15 tarefas de rotulagem era maior do que a dos crowdsourcers.
No início de abril deste ano, Li Jie, um estudante de medicina da escola, concluiu em um mês a rotulagem de texto de uma grande fábrica na área médica. Este projeto será usado para fornecer serviços de diálogo de diagnóstico inteligente, o que também tornou Li Jie sinta pela primeira vez a evolução de grandes modelos.velocidade.
"No início, continuamos alimentando a plataforma com termos médicos classificados e, na segunda semana, o sistema conseguiu realizar automaticamente a classificação básica de substantivos e a taxa de precisão ultrapassou 90%."
Em Taiyuan, Shanxi, a Sra. Zhou, a capataz da base, começou a persuadir os recém-chegados a assumir projetos mais difíceis, porque era difícil para a empresa suportar a pressão de projetos sendo arquivados repetidamente. "Atualmente, quanto mais simples o negócio de rotulagem, menor o lucro, e alguns projetos ficarão amarelos se forem concluídos pela metade, e o custo da mão de obra não poderá cobrir a receita do projeto."
Um recrutador da indústria de rotulagem de dados disse ao Times Finance que, desde este ano, o limite de recrutamento mudou gradualmente de estudantes universitários para estudantes de graduação. "No passado, basicamente não havia exigência de experiência para rotuladoras. Agora, muitas empresas esperam que os novos funcionários possam começar a trabalhar diretamente em projetos, o que pode reduzir os custos iniciais de treinamento."
No momento, a rotulagem inteligente pode capturar aproximadamente a forma básica e a posição dos objetos, mas em termos de precisão, ela ainda fica atrás dos rotuladores profissionais.
Ninguém sabe quando a rotulagem inteligente dará início a uma grande explosão, mas Li Wei está sempre acompanhado por uma sensação de insegurança. Sempre que ela abre uma nova página de projeto, a caixa vermelha que representa a rotulagem inteligente sempre aparece primeiro, como se lembrasse as pessoas na frente da tela o tempo todo:
Um dia, ele tomará o lugar dela.
(Os entrevistados neste artigo são todos pseudônimos.)