En la primera mitad de este año, los círculos tecnológicos de las ciudades de primer nivel fueron activados por la inteligencia artificial.
Modelos a gran escala como Wenxin Yiyan, Tongyi Qianwen y Light Years Away están enviando oleadas de entusiasmo. Los peces gordos con recursos de alto nivel están en el centro de este gran evento. Han enviado mensajes de héroe uno tras otro. El La batalla por el talento de las grandes modelos también está sobre la mesa.
Como eslabón estrechamente relacionado con la cadena de la industria de la IA, la Base de la Industria de Datos de Taiyuan en Shanxi, a 500 kilómetros de Beijing, está tranquila, donde se han reunido miles de etiquetadores de inteligencia artificial. Los temas que trataron se quedaron en el avance del proyecto, el ritmo de elaboración de la caja al estándar, y las tres comidas al día.
"La emoción es de ellos, y solo tenemos innumerables cajas", dijo un etiquetador de datos a Times Finance.
En memoria de He Qing, el dueño de la empresa de etiquetado de datos, la emoción sucedió hace cuatro o cinco años. Por primera vez, la brisa primaveral de la inteligencia artificial sopló en esta ciudad del medio oeste. Los empresarios sensibles comenzaron a trazar territorio y reclutar personas, proporcionando un flujo constante de "nutrición" para la inteligencia artificial. La mayoría de ellos son laicos de la inteligencia artificial, debido a la repentina gran demanda laboral, tienen una maravillosa conexión con la tecnología de punta.
"En ese momento, muchos jefes trajeron a todos los miembros de su familia aquí y podían ganar dinero con solo mover los dedos". He Qing ha escuchado muchas noticias emocionantes en la industria del etiquetado de datos: algunas personas ganan millones en tres meses y otros Los pedidos que se agarran se pueden poner en cola para el segundo año.
Pero esos buenos días se están desvaneciendo gradualmente.
"Canalización" decente
A las 8:45 de la mañana, una densa multitud de personas bloqueó la entrada del ascensor. Solo un tercio de las personas se apretujaron en el primer ascensor, y el destino final de todos estaba en el sexto piso.
La puerta del ascensor se abrió lentamente, y la multitud se esparció en todas direcciones, y entró en las oficinas donde no había diferencia.El espacio de unos 100 metros cuadrados estaba lleno de cientos de pies de computadora.
“Mientras sigas el número de la casa y preguntes uno por uno, todo estará marcado con datos.” El vendedor en la planta baja del parque lo describió de esta manera.
Esta base de etiquetado de datos, que ha atraído a casi mil personas, es como un cibercafé escondido en el parque. Las personas sentadas frente a las computadoras hacen clic hábilmente en el teclado y el mouse, y los escritorios de aproximadamente un metro cuadrado están ocupados por ordenadores enormes.
Fuente del etiquetador de datos en el trabajo: Foto de Times Finance
Lo único que puede mostrar su individualidad son los coloridos auriculares que llevan en la cabeza.Tienen una identidad común: los etiquetadores de datos.
El mouse hizo clic en los botones izquierdo y derecho de un lado a otro, y las imágenes en la pantalla se acercaron y alejaron, y el cursor dibujó rápidamente marcos de diferentes tamaños... Después de que las acciones repetidas duraron media hora, Meiling torció el cuello ligeramente. , y los huesos de su columna crujieron con un crujido.
"Es suficiente para un recién llegado pasar la primera semana, y es rápido acostumbrarse si eres competente", dijo Mei Ling a Times Finance mientras aún miraba la pantalla. Hasta el 30% de las personas se rindieron en La primera semana.
Cada dos semanas, la Sra. Zhou, la capataz, guiará a más de una docena de recién llegados para que comiencen su aprendizaje. Tal trabajo repetitivo y aburrido ha disuadido a muchos jóvenes.
Hace dos años, Meiling pasó de ser una maestra de jardín de infantes a una etiquetadora de datos. En su ciudad natal, Luliang, hay pocos trabajos y el telemercadeo es uno de los destinos más respetables Ahora, bajo la influencia de la ola de inteligencia artificial, los etiquetadores de datos ofrecen otra opción para las mujeres del condado.
Hace seis meses, debido al cambio de la base de etiquetado, Meiling se mudó de su ciudad natal a Taiyuan, la capital provincial. "La conducción automática o el reconocimiento facial no requieren la participación de etiquetadores a gran escala". Mostró una mirada orgullosa. A los ojos de su familia, sentada en una oficina y operando una computadora, con un ingreso mensual de más de 3.000 yuanes. , el tratamiento ha superado a la mayor parte del condado.Ya funciona.
En 2005, Zhu Songchun, un experto en visión por computadora, regresó a su ciudad natal de Ezhou, Hubei desde los Estados Unidos, fundó el Instituto de Investigación Lianhuashan y formó el primer equipo de etiquetado de big data en China. Posteriormente, las fábricas de etiquetado de datos se arraigaron gradualmente en ciudades de segundo y tercer nivel, y aparecieron grupos industriales en Hebei, Henan, Shandong, Shanxi y otras regiones.
A través del entrenamiento de etiquetas repetidas, la inteligencia artificial puede llegar al momento del "despertar". En opinión de Meiling, esto es lo mismo que el trabajo anterior de los maestros de jardín de infantes.
El etiquetado de datos es el primer eslabón en el nacimiento de los productos de inteligencia artificial, seguido del entrenamiento y optimización de modelos, gestión de modelos, aplicaciones de razonamiento, etc. Alimentar productos de inteligencia artificial requiere cientos de millones de datos, que primero fluirán a las computadoras de las "bellezas".
Sin embargo, la fantasía de Meiling de la "alta tecnología" se hizo añicos poco a poco por el sonido repetitivo del ratón mecánico. Ha calculado que 1.500 fotogramas es el límite de la carga de trabajo diaria. Una vez que se cruza esta línea de advertencia, los globos oculares estarán doloridos.
Después de salir del trabajo, incluso frente al televisor, lo que ve es un mosaico, que parece imágenes borrosas que deben marcarse después de acercar el zoom.
"Siempre hay caras desconocidas en el asiento de al lado y hay poca comunicación entre colegas". Después de trabajar durante un año y medio, Wu Xia, que trabaja en la misma base, aún no se ha acostumbrado al silencio en la oficina. .
Después de graduarse de la universidad, originalmente ingresó a la fábrica con sus compañeros de clase, pero debido a los cambios de proyecto y la partida de los compañeros de clase, se convirtió en una "llanera solitaria". Nada más empezar la obra, la oficina se convirtió en un “taller” donde arrancaba la línea de montaje automatizada, con un ambiente industrial frío y poco humano.
Una de las características de la industria del etiquetado de datos es el conteo de piezas individuales y la no necesidad de trabajo en equipo, lo que configura un método de gestión diferente al de los trabajadores administrativos comunes.
Aquí, los etiquetadores no tienen una posición fija, sino que asignan aleatoriamente a cientos de personas a la dirección del flujo según los cambios del proyecto. El proyecto más largo es de 2 a 3 meses, y el proyecto a corto plazo es de solo 2 a 3 días. Un equipo de proyecto de más de una docena de personas tiene un administrador para vigilar el progreso del trabajo de todos.
Los anotadores no gastarán su energía en administrar la relación entre colegas. El tipo de trabajo a destajo presta atención a la eficiencia y la concentración, y el tiempo y el dinero están vinculados. Para completar un promedio de 1,000 cuadros, significa que se debe completar un promedio de 2 cuadros por minuto.
"Cuando hables con otros, perderás algunas cajas de dinero", dijo Meiling.
Los trabajadores de Foxconn van a la fábrica de etiquetado
En el parque de etiquetado de datos, también hay institutos de investigación tecnológica dispersos y bases empresariales para estudiantes extranjeros. En opinión de Meng Ran, estas posiciones de "alto nivel" están muy lejos de él.
Antes de ingresar a la universidad, nunca abandonó su ciudad natal, Linfen.Después de graduarse de la universidad, su familia esperaba que no abandonara la provincia. A dos kilómetros de la base se encuentra el Parque Industrial de Ciencia y Tecnología Foxconn Taiyuan. Esta zona fabril absorbió a los trabajadores locales más activos.En su apogeo, cerca de 60.000 personas estaban activas en la línea de montaje de la zona fabril.
No importa cuánto lo intentara, el radio de búsqueda de trabajo del estudiante universitario Meng Ran nunca superó los 5 kilómetros. Una vez pasó de la segunda fase de la base de etiquetado de datos a la tercera fase; antes de convertirse oficialmente en etiquetador de datos, Foxconn, al lado, fue el lugar donde quemó su juventud.
La fuente del parque Foxconn a menos de 2 kilómetros de la base de etiquetado de datos: Foto de Times Finance
Meng Ran una vez ingresó a la fábrica durante dos vacaciones consecutivas para ganar dinero, y cada vez que se fue a toda prisa después de recibir un salario de varios miles de yuanes.
Cada vacaciones de invierno y verano, la entrada del campus de Foxconn está llena de estudiantes universitarios con bolsas grandes y bolsas pequeñas, y el objetivo de todos es obtener el reembolso y la tarifa por hora más altos de todo el año. "Todo el mundo viene aquí para ganar dinero rápido, empacan y se van tan pronto como termina la temporada alta. La fábrica está demasiado ocupada para trabajar y es difícil mantenerla durante mucho tiempo".
A Meng Ran no le gustaba el ambiente de trabajo en Foxconn. Antes de ingresar al taller, se debe entregar el equipo electrónico, y lo único que queda por enfrentar todos los días es la multitud de trabajadores apresurados con ropa similar y el edificio de la fábrica desolado y frío. Cuando te encuentras con un líder de equipo gruñón, es común que te insulten todos los días.
Con el inicio del rugido de la línea de producción, los trabajadores necesitan instalar una determinada pieza de forma continua, y tales acciones suelen durar más de 10 horas. En un espacio completamente cerrado, incluso el trance es un lujo. Meng Ran no se atrevió a hablar con los trabajadores que lo rodeaban hasta que el capataz relajó un poco su gestión.
En 2018, después de completar la base de datos de etiquetado cercana, Meng Ran tuvo una segunda opción para su trabajo. A solo una cuadra de distancia, hay un trabajo más cómodo al alcance de su mano.
Faye Wong solía ser reclutadora de Foxconn. La temporada baja de la fábrica y los cambios de personal, junto con los descuentos ambiguos y los cambios frecuentes en los ingresos, hacen que a menudo caiga en interminables conflictos con los trabajadores inmigrantes. Los anotadores son una mejor opción para ella.
"En los últimos años, el umbral de etiquetado de datos era bajo y el precio unitario era alto. Podía mantener un ingreso mensual de 4000 yuanes, y todos los proyectos que hice estaban relacionados con grandes fábricas, lo cual era relativamente seguro". Faye Wong Ha visto a muchos trabajadores calificados dejar la base para buscar otro trabajo. Fuera del camino, pero de regreso en un círculo.
Muchos anotadores tienen trayectorias laborales similares a las de Meng Ran. La experiencia laboral en fábricas de electrónica es el punto común de sus currículos, y la fábrica de anotación de datos se ha convertido en su próxima parada después de dejar la fundición de electrónica.
Las características comunes de gran número de trabajadores, ingresos considerables y operación simple han construido un puente de dos kilómetros virtualmente, conectando las dos súper fábricas.
Proyectos y empresas desaparecidas
Para los etiquetadores, un sentimiento intuitivo es que los buenos tiempos están llegando a su fin.
Desapareció el proyecto con un precio unitario de unos pocos centavos, y el precio de una caja de etiquetas se redujo a unos pocos centavos; desapareció la caja de dibujo de puntos de dibujo plano simple, reemplazada por un proyecto de nube de puntos que requería etiquetado multidimensional; empleados regulares gradualmente dejó el equipo del proyecto, y los pasantes rentables de Taller apoyaron más de la mitad de la carga de trabajo.
He Qing, propietaria de la empresa de etiquetado de datos, no ha estado en la base durante medio año y ha reducido gradualmente su inversión en la empresa.
Desde la segunda mitad del año pasado, su equipo nunca ha podido recibir proyectos con muchos pedidos de clientes, y el período de facturación de los clientes se ha retrasado de tres meses a medio año. "Muchas fábricas pequeñas con un flujo de efectivo insuficiente y sin capacidad para adelantar capital han cerrado, y los miembros de nuestro equipo han perdido un tercio".
Hace tres años, el marco de llamada encendió el entusiasmo de Li Wei. Era lenta y no se comunicaba bien, y sintió que había encontrado un trabajo "elegido".
Li Wei se hizo cargo del proyecto con un precio unitario de 0,25 yuanes. Cuando la eficiencia era alta, podía dibujar 1200 fotogramas al día y ganar casi 8000 yuanes al mes. "Para ganar más dinero, alguien compró un host y comenzó a trabajar. en casa Si te vuelves competente, tus ingresos aumentarán ".
Como todos los demás, Li Wei sintió vagamente que la era de la fiebre del oro había terminado.
La compañía ha lanzado un proyecto completamente nuevo. Lo que se presenta frente a nosotros ya no es un mapa de carreteras del mundo real, sino un mapa modelo compuesto por miles de puntos verdes, morados y azules. Una imagen completa incluye Hay casi cien casillas marcadas y un conjunto de preguntas se compone de docenas de imágenes con solo diferencias sutiles.
Diagrama de interfaz de operación complicada fuente: proporcionado por el entrevistado
"Es necesario cambiar repetidamente entre la vista en planta y 3D. Algunas imágenes bloqueadas deben complementarse con el cerebro, y también se requiere controlar la precisión del cuadro a 0,01 metros. El costo de rendimiento del trabajo es cada vez más bajo y menor." Mientras la desviación del rango requerido sea 1 mm más, la revisión los rechazará despiadadamente.
Los datos, la potencia informática y los algoritmos son los tres pilares de la inteligencia artificial. Cuanto mayor sea la cantidad y la calidad de los datos, más maduros se podrán entrenar modelos grandes, lo que se manifiesta en el trabajo de los anotadores que mejoran constantemente su precisión. .
"Las reglas se han ajustado en los últimos días y el requisito de precisión se ha incrementado a más del 80 %". La precisión se ha convertido en el "punto de muerte" de los etiquetadores, y también es un vocabulario de alta frecuencia que aparece cuando quejarse.
Una imagen marcada debe pasar por 2 o 3 pasos, como revisión e inspección de calidad; de lo contrario, no puede ingresar al ciclo de liquidación.
A veces, Wu Xia sentía que estaba atrapada en un laberinto complicado y no podía salir sin importar nada. Había estado atormentada por un nuevo proyecto durante casi una semana: mientras enviaba las preguntas, la llamaban constantemente, lo que la hizo caer en la ansiedad. "Si la pregunta se devuelve con demasiada frecuencia, se asignará a otras personas y la energía anterior será en vano".
La ansiedad de Meng Ran era de otro tipo. Desde agosto del año pasado, su trabajo se ha vuelto más relajado. En los últimos 5 minutos, se han acumulado decenas de miles de datos, y ahora no habrá línea roja de carga durante media hora.
"Puede ser que la cantidad de datos en la plataforma haya disminuido, o puede ser que la eficiencia de la revisión de la máquina haya aumentado". La sensación de inseguridad de Meng Ran se confirmó rápidamente. Debido a la reducción forzada de su carga de trabajo, su ingreso diario cayó de uno a doscientos yuanes a unos pocos cientos de yuanes, decenas de dólares.
Una carrera eliminatoria se extendió entre las principales agencias. Meng Ran vio cómo un equipo se disolvía de la noche a la mañana y más de una docena de empleados a los que se les debían salarios demandaron a la empresa ante la oficina laboral; si la situación fuera un poco mejor, serían transferidos al siguiente agente junto con la computadora y los empleados.
"Para estar seguro, ve a un equipo con más de 30 personas", este es el consejo de Meng Ran para los recién llegados.
El anotador está saliendo de la etapa de la historia
Después de una semana de capacitación y un período de principiante de medio mes, en mayo de este año, Xiaoting, que estaba en Hunan, finalmente se adaptó a ser un etiquetador de datos, pero fue testigo del rápido declive de la empresa hasta su desaparición.
"Después de un mes de empleo, la empresa no puede sobrevivir. El jefe invita a todos a una comida de ruptura, pero el salario tendrá que esperar unos meses". En opinión de Xiaoting, la industria actual del etiquetado de datos está llena de " minas terrestres", y el riesgo es mucho mayor que los ingresos.
Ya se trate de un empresario de etiquetado de datos o de decenas de miles de etiquetadores, no hay forma de evitar el hecho de que el etiquetado manual de datos se está volviendo poco a poco insignificante en el escenario de los modelos a gran escala.
Lo que es diferente del trabajo de maestra de preescolar de Meiling es que los estudiantes no tomarán el trabajo de maestra tan rápido. Hoy en día, la tecnología de modelos grandes fomentada por las etiquetadoras está retroalimentando rápidamente el proceso de etiquetado de datos.
Tomando a Tesla como ejemplo, ha desarrollado continuamente la tecnología de etiquetado automático desde 2018, desde el etiquetado manual 2D hasta el etiquetado automático espacial 4D. El avance de la tecnología ha devorado el espacio operativo para el etiquetado manual. En 2021, el equipo de etiquetado manual de Tesla superará las 1000 personas, y en 2022, más de 200 empleados serán despedidos.
Otras compañías automotrices, incluidas Xiaopeng Motors y Momo Zhixing, también han lanzado herramientas de etiquetado automático. Gu Weihao, CEO de Momo Zhixing, declaró públicamente que actualmente, para obtener líneas de carril, participantes del tráfico e información de semáforos, el costo del etiquetado manual es de aproximadamente 5 yuanes por imagen, mientras que el costo de Momo DriveGPT es de solo 0,5 yuanes.
En 2019, Wu Di, formador de datos de IA en una ciudad de primer nivel, tuvo el presentimiento del techo de su carrera, su empresa es la encargada de desarrollar el proyecto de atención al cliente inteligente de la plataforma de comercio electrónico. El progreso fue más rápido de lo que había imaginado, en menos de un año, el equipo de etiquetado de datos de 10 personas que estaba a cargo se cortó y solo quedaron operadores esporádicos.
"El día que el proyecto siga madurando es cuando ya no se nos necesite".
La evolución del modelo grande es como un río caudaloso, siempre atacando por sorpresa en un momento determinado, dejando atrás al equipo artificial.
En un informe de encuesta realizado por la Universidad de Zúrich en marzo de este año, los investigadores descubrieron a través de mediciones reales que la capacidad de procesamiento de ChatGPT en 15 tareas de etiquetado era mayor que la de los crowdsourcers.
A principios de abril de este año, Li Jie, un estudiante de medicina en la escuela, completó el etiquetado de texto de una gran fábrica en el campo de la medicina dentro de un mes. Este proyecto se utilizará para proporcionar diagnóstico inteligente y servicios de diálogo. Esto también hizo que Li Siente por primera vez la evolución de los modelos grandes.velocidad.
"Al principio, seguimos alimentando la plataforma con términos médicos clasificados y, en la segunda semana, el sistema pudo realizar automáticamente la clasificación básica de los sustantivos y la tasa de precisión superó el 90 %".
En Taiyuan, Shanxi, la Sra. Zhou, la capataz de la base, comenzó a persuadir a los recién llegados para que asumieran proyectos más difíciles, porque era difícil para la empresa soportar la presión de los proyectos que se archivaban una y otra vez. "En la actualidad, cuanto más simple es el negocio de etiquetado, menor es la ganancia, y algunos proyectos serán amarillos si se completan a la mitad, y el costo de la mano de obra no puede cubrir los ingresos del proyecto en absoluto".
Un reclutador de la industria del etiquetado de datos le dijo a Times Finance que, desde este año, el umbral de reclutamiento ha cambiado gradualmente de estudiantes universitarios a estudiantes universitarios. "En el pasado, básicamente no había requisitos de experiencia para los etiquetadores. Ahora, muchas empresas esperan que los nuevos empleados puedan comenzar a trabajar en proyectos directamente, lo que puede reducir los costos de capacitación inicial".
En la actualidad, el etiquetado inteligente puede capturar de manera aproximada la forma y la posición básicas de los objetos, pero en términos de precisión, aún está por detrás de los etiquetadores profesionales.
Nadie sabe cuándo el etiquetado inteligente marcará el comienzo de una gran explosión, pero Li Wei siempre va acompañado de una sensación de inseguridad. Cada vez que abre una nueva página de proyecto, el cuadro rojo que representa el etiquetado inteligente siempre aparece primero, como si recordara a las personas frente a la pantalla todo el tiempo:
Un día, ocupará su lugar.
(Los entrevistados en este artículo son todos seudónimos).
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Los trabajadores de Foxconn llegan a la fábrica de etiquetado de IA
Fuente original: Times Finance
En la primera mitad de este año, los círculos tecnológicos de las ciudades de primer nivel fueron activados por la inteligencia artificial.
Modelos a gran escala como Wenxin Yiyan, Tongyi Qianwen y Light Years Away están enviando oleadas de entusiasmo. Los peces gordos con recursos de alto nivel están en el centro de este gran evento. Han enviado mensajes de héroe uno tras otro. El La batalla por el talento de las grandes modelos también está sobre la mesa.
Como eslabón estrechamente relacionado con la cadena de la industria de la IA, la Base de la Industria de Datos de Taiyuan en Shanxi, a 500 kilómetros de Beijing, está tranquila, donde se han reunido miles de etiquetadores de inteligencia artificial. Los temas que trataron se quedaron en el avance del proyecto, el ritmo de elaboración de la caja al estándar, y las tres comidas al día.
"La emoción es de ellos, y solo tenemos innumerables cajas", dijo un etiquetador de datos a Times Finance.
En memoria de He Qing, el dueño de la empresa de etiquetado de datos, la emoción sucedió hace cuatro o cinco años. Por primera vez, la brisa primaveral de la inteligencia artificial sopló en esta ciudad del medio oeste. Los empresarios sensibles comenzaron a trazar territorio y reclutar personas, proporcionando un flujo constante de "nutrición" para la inteligencia artificial. La mayoría de ellos son laicos de la inteligencia artificial, debido a la repentina gran demanda laboral, tienen una maravillosa conexión con la tecnología de punta.
"En ese momento, muchos jefes trajeron a todos los miembros de su familia aquí y podían ganar dinero con solo mover los dedos". He Qing ha escuchado muchas noticias emocionantes en la industria del etiquetado de datos: algunas personas ganan millones en tres meses y otros Los pedidos que se agarran se pueden poner en cola para el segundo año.
Pero esos buenos días se están desvaneciendo gradualmente.
"Canalización" decente
A las 8:45 de la mañana, una densa multitud de personas bloqueó la entrada del ascensor. Solo un tercio de las personas se apretujaron en el primer ascensor, y el destino final de todos estaba en el sexto piso.
La puerta del ascensor se abrió lentamente, y la multitud se esparció en todas direcciones, y entró en las oficinas donde no había diferencia.El espacio de unos 100 metros cuadrados estaba lleno de cientos de pies de computadora.
“Mientras sigas el número de la casa y preguntes uno por uno, todo estará marcado con datos.” El vendedor en la planta baja del parque lo describió de esta manera.
Esta base de etiquetado de datos, que ha atraído a casi mil personas, es como un cibercafé escondido en el parque. Las personas sentadas frente a las computadoras hacen clic hábilmente en el teclado y el mouse, y los escritorios de aproximadamente un metro cuadrado están ocupados por ordenadores enormes.
Lo único que puede mostrar su individualidad son los coloridos auriculares que llevan en la cabeza.Tienen una identidad común: los etiquetadores de datos.
El mouse hizo clic en los botones izquierdo y derecho de un lado a otro, y las imágenes en la pantalla se acercaron y alejaron, y el cursor dibujó rápidamente marcos de diferentes tamaños... Después de que las acciones repetidas duraron media hora, Meiling torció el cuello ligeramente. , y los huesos de su columna crujieron con un crujido.
"Es suficiente para un recién llegado pasar la primera semana, y es rápido acostumbrarse si eres competente", dijo Mei Ling a Times Finance mientras aún miraba la pantalla. Hasta el 30% de las personas se rindieron en La primera semana.
Cada dos semanas, la Sra. Zhou, la capataz, guiará a más de una docena de recién llegados para que comiencen su aprendizaje. Tal trabajo repetitivo y aburrido ha disuadido a muchos jóvenes.
Hace dos años, Meiling pasó de ser una maestra de jardín de infantes a una etiquetadora de datos. En su ciudad natal, Luliang, hay pocos trabajos y el telemercadeo es uno de los destinos más respetables Ahora, bajo la influencia de la ola de inteligencia artificial, los etiquetadores de datos ofrecen otra opción para las mujeres del condado.
Hace seis meses, debido al cambio de la base de etiquetado, Meiling se mudó de su ciudad natal a Taiyuan, la capital provincial. "La conducción automática o el reconocimiento facial no requieren la participación de etiquetadores a gran escala". Mostró una mirada orgullosa. A los ojos de su familia, sentada en una oficina y operando una computadora, con un ingreso mensual de más de 3.000 yuanes. , el tratamiento ha superado a la mayor parte del condado.Ya funciona.
En 2005, Zhu Songchun, un experto en visión por computadora, regresó a su ciudad natal de Ezhou, Hubei desde los Estados Unidos, fundó el Instituto de Investigación Lianhuashan y formó el primer equipo de etiquetado de big data en China. Posteriormente, las fábricas de etiquetado de datos se arraigaron gradualmente en ciudades de segundo y tercer nivel, y aparecieron grupos industriales en Hebei, Henan, Shandong, Shanxi y otras regiones.
A través del entrenamiento de etiquetas repetidas, la inteligencia artificial puede llegar al momento del "despertar". En opinión de Meiling, esto es lo mismo que el trabajo anterior de los maestros de jardín de infantes.
El etiquetado de datos es el primer eslabón en el nacimiento de los productos de inteligencia artificial, seguido del entrenamiento y optimización de modelos, gestión de modelos, aplicaciones de razonamiento, etc. Alimentar productos de inteligencia artificial requiere cientos de millones de datos, que primero fluirán a las computadoras de las "bellezas".
Sin embargo, la fantasía de Meiling de la "alta tecnología" se hizo añicos poco a poco por el sonido repetitivo del ratón mecánico. Ha calculado que 1.500 fotogramas es el límite de la carga de trabajo diaria. Una vez que se cruza esta línea de advertencia, los globos oculares estarán doloridos.
Después de salir del trabajo, incluso frente al televisor, lo que ve es un mosaico, que parece imágenes borrosas que deben marcarse después de acercar el zoom.
"Siempre hay caras desconocidas en el asiento de al lado y hay poca comunicación entre colegas". Después de trabajar durante un año y medio, Wu Xia, que trabaja en la misma base, aún no se ha acostumbrado al silencio en la oficina. .
Después de graduarse de la universidad, originalmente ingresó a la fábrica con sus compañeros de clase, pero debido a los cambios de proyecto y la partida de los compañeros de clase, se convirtió en una "llanera solitaria". Nada más empezar la obra, la oficina se convirtió en un “taller” donde arrancaba la línea de montaje automatizada, con un ambiente industrial frío y poco humano.
Una de las características de la industria del etiquetado de datos es el conteo de piezas individuales y la no necesidad de trabajo en equipo, lo que configura un método de gestión diferente al de los trabajadores administrativos comunes.
Aquí, los etiquetadores no tienen una posición fija, sino que asignan aleatoriamente a cientos de personas a la dirección del flujo según los cambios del proyecto. El proyecto más largo es de 2 a 3 meses, y el proyecto a corto plazo es de solo 2 a 3 días. Un equipo de proyecto de más de una docena de personas tiene un administrador para vigilar el progreso del trabajo de todos.
Los anotadores no gastarán su energía en administrar la relación entre colegas. El tipo de trabajo a destajo presta atención a la eficiencia y la concentración, y el tiempo y el dinero están vinculados. Para completar un promedio de 1,000 cuadros, significa que se debe completar un promedio de 2 cuadros por minuto.
"Cuando hables con otros, perderás algunas cajas de dinero", dijo Meiling.
Los trabajadores de Foxconn van a la fábrica de etiquetado
En el parque de etiquetado de datos, también hay institutos de investigación tecnológica dispersos y bases empresariales para estudiantes extranjeros. En opinión de Meng Ran, estas posiciones de "alto nivel" están muy lejos de él.
Antes de ingresar a la universidad, nunca abandonó su ciudad natal, Linfen.Después de graduarse de la universidad, su familia esperaba que no abandonara la provincia. A dos kilómetros de la base se encuentra el Parque Industrial de Ciencia y Tecnología Foxconn Taiyuan. Esta zona fabril absorbió a los trabajadores locales más activos.En su apogeo, cerca de 60.000 personas estaban activas en la línea de montaje de la zona fabril.
No importa cuánto lo intentara, el radio de búsqueda de trabajo del estudiante universitario Meng Ran nunca superó los 5 kilómetros. Una vez pasó de la segunda fase de la base de etiquetado de datos a la tercera fase; antes de convertirse oficialmente en etiquetador de datos, Foxconn, al lado, fue el lugar donde quemó su juventud.
Meng Ran una vez ingresó a la fábrica durante dos vacaciones consecutivas para ganar dinero, y cada vez que se fue a toda prisa después de recibir un salario de varios miles de yuanes.
Cada vacaciones de invierno y verano, la entrada del campus de Foxconn está llena de estudiantes universitarios con bolsas grandes y bolsas pequeñas, y el objetivo de todos es obtener el reembolso y la tarifa por hora más altos de todo el año. "Todo el mundo viene aquí para ganar dinero rápido, empacan y se van tan pronto como termina la temporada alta. La fábrica está demasiado ocupada para trabajar y es difícil mantenerla durante mucho tiempo".
A Meng Ran no le gustaba el ambiente de trabajo en Foxconn. Antes de ingresar al taller, se debe entregar el equipo electrónico, y lo único que queda por enfrentar todos los días es la multitud de trabajadores apresurados con ropa similar y el edificio de la fábrica desolado y frío. Cuando te encuentras con un líder de equipo gruñón, es común que te insulten todos los días.
Con el inicio del rugido de la línea de producción, los trabajadores necesitan instalar una determinada pieza de forma continua, y tales acciones suelen durar más de 10 horas. En un espacio completamente cerrado, incluso el trance es un lujo. Meng Ran no se atrevió a hablar con los trabajadores que lo rodeaban hasta que el capataz relajó un poco su gestión.
En 2018, después de completar la base de datos de etiquetado cercana, Meng Ran tuvo una segunda opción para su trabajo. A solo una cuadra de distancia, hay un trabajo más cómodo al alcance de su mano.
Faye Wong solía ser reclutadora de Foxconn. La temporada baja de la fábrica y los cambios de personal, junto con los descuentos ambiguos y los cambios frecuentes en los ingresos, hacen que a menudo caiga en interminables conflictos con los trabajadores inmigrantes. Los anotadores son una mejor opción para ella.
"En los últimos años, el umbral de etiquetado de datos era bajo y el precio unitario era alto. Podía mantener un ingreso mensual de 4000 yuanes, y todos los proyectos que hice estaban relacionados con grandes fábricas, lo cual era relativamente seguro". Faye Wong Ha visto a muchos trabajadores calificados dejar la base para buscar otro trabajo. Fuera del camino, pero de regreso en un círculo.
Muchos anotadores tienen trayectorias laborales similares a las de Meng Ran. La experiencia laboral en fábricas de electrónica es el punto común de sus currículos, y la fábrica de anotación de datos se ha convertido en su próxima parada después de dejar la fundición de electrónica.
Las características comunes de gran número de trabajadores, ingresos considerables y operación simple han construido un puente de dos kilómetros virtualmente, conectando las dos súper fábricas.
Proyectos y empresas desaparecidas
Para los etiquetadores, un sentimiento intuitivo es que los buenos tiempos están llegando a su fin.
Desapareció el proyecto con un precio unitario de unos pocos centavos, y el precio de una caja de etiquetas se redujo a unos pocos centavos; desapareció la caja de dibujo de puntos de dibujo plano simple, reemplazada por un proyecto de nube de puntos que requería etiquetado multidimensional; empleados regulares gradualmente dejó el equipo del proyecto, y los pasantes rentables de Taller apoyaron más de la mitad de la carga de trabajo.
He Qing, propietaria de la empresa de etiquetado de datos, no ha estado en la base durante medio año y ha reducido gradualmente su inversión en la empresa.
Desde la segunda mitad del año pasado, su equipo nunca ha podido recibir proyectos con muchos pedidos de clientes, y el período de facturación de los clientes se ha retrasado de tres meses a medio año. "Muchas fábricas pequeñas con un flujo de efectivo insuficiente y sin capacidad para adelantar capital han cerrado, y los miembros de nuestro equipo han perdido un tercio".
Hace tres años, el marco de llamada encendió el entusiasmo de Li Wei. Era lenta y no se comunicaba bien, y sintió que había encontrado un trabajo "elegido".
Li Wei se hizo cargo del proyecto con un precio unitario de 0,25 yuanes. Cuando la eficiencia era alta, podía dibujar 1200 fotogramas al día y ganar casi 8000 yuanes al mes. "Para ganar más dinero, alguien compró un host y comenzó a trabajar. en casa Si te vuelves competente, tus ingresos aumentarán ".
Como todos los demás, Li Wei sintió vagamente que la era de la fiebre del oro había terminado.
La compañía ha lanzado un proyecto completamente nuevo. Lo que se presenta frente a nosotros ya no es un mapa de carreteras del mundo real, sino un mapa modelo compuesto por miles de puntos verdes, morados y azules. Una imagen completa incluye Hay casi cien casillas marcadas y un conjunto de preguntas se compone de docenas de imágenes con solo diferencias sutiles.
"Es necesario cambiar repetidamente entre la vista en planta y 3D. Algunas imágenes bloqueadas deben complementarse con el cerebro, y también se requiere controlar la precisión del cuadro a 0,01 metros. El costo de rendimiento del trabajo es cada vez más bajo y menor." Mientras la desviación del rango requerido sea 1 mm más, la revisión los rechazará despiadadamente.
Los datos, la potencia informática y los algoritmos son los tres pilares de la inteligencia artificial. Cuanto mayor sea la cantidad y la calidad de los datos, más maduros se podrán entrenar modelos grandes, lo que se manifiesta en el trabajo de los anotadores que mejoran constantemente su precisión. .
"Las reglas se han ajustado en los últimos días y el requisito de precisión se ha incrementado a más del 80 %". La precisión se ha convertido en el "punto de muerte" de los etiquetadores, y también es un vocabulario de alta frecuencia que aparece cuando quejarse.
Una imagen marcada debe pasar por 2 o 3 pasos, como revisión e inspección de calidad; de lo contrario, no puede ingresar al ciclo de liquidación.
A veces, Wu Xia sentía que estaba atrapada en un laberinto complicado y no podía salir sin importar nada. Había estado atormentada por un nuevo proyecto durante casi una semana: mientras enviaba las preguntas, la llamaban constantemente, lo que la hizo caer en la ansiedad. "Si la pregunta se devuelve con demasiada frecuencia, se asignará a otras personas y la energía anterior será en vano".
La ansiedad de Meng Ran era de otro tipo. Desde agosto del año pasado, su trabajo se ha vuelto más relajado. En los últimos 5 minutos, se han acumulado decenas de miles de datos, y ahora no habrá línea roja de carga durante media hora.
"Puede ser que la cantidad de datos en la plataforma haya disminuido, o puede ser que la eficiencia de la revisión de la máquina haya aumentado". La sensación de inseguridad de Meng Ran se confirmó rápidamente. Debido a la reducción forzada de su carga de trabajo, su ingreso diario cayó de uno a doscientos yuanes a unos pocos cientos de yuanes, decenas de dólares.
Una carrera eliminatoria se extendió entre las principales agencias. Meng Ran vio cómo un equipo se disolvía de la noche a la mañana y más de una docena de empleados a los que se les debían salarios demandaron a la empresa ante la oficina laboral; si la situación fuera un poco mejor, serían transferidos al siguiente agente junto con la computadora y los empleados.
"Para estar seguro, ve a un equipo con más de 30 personas", este es el consejo de Meng Ran para los recién llegados.
El anotador está saliendo de la etapa de la historia
Después de una semana de capacitación y un período de principiante de medio mes, en mayo de este año, Xiaoting, que estaba en Hunan, finalmente se adaptó a ser un etiquetador de datos, pero fue testigo del rápido declive de la empresa hasta su desaparición.
"Después de un mes de empleo, la empresa no puede sobrevivir. El jefe invita a todos a una comida de ruptura, pero el salario tendrá que esperar unos meses". En opinión de Xiaoting, la industria actual del etiquetado de datos está llena de " minas terrestres", y el riesgo es mucho mayor que los ingresos.
Ya se trate de un empresario de etiquetado de datos o de decenas de miles de etiquetadores, no hay forma de evitar el hecho de que el etiquetado manual de datos se está volviendo poco a poco insignificante en el escenario de los modelos a gran escala.
Lo que es diferente del trabajo de maestra de preescolar de Meiling es que los estudiantes no tomarán el trabajo de maestra tan rápido. Hoy en día, la tecnología de modelos grandes fomentada por las etiquetadoras está retroalimentando rápidamente el proceso de etiquetado de datos.
Tomando a Tesla como ejemplo, ha desarrollado continuamente la tecnología de etiquetado automático desde 2018, desde el etiquetado manual 2D hasta el etiquetado automático espacial 4D. El avance de la tecnología ha devorado el espacio operativo para el etiquetado manual. En 2021, el equipo de etiquetado manual de Tesla superará las 1000 personas, y en 2022, más de 200 empleados serán despedidos.
Otras compañías automotrices, incluidas Xiaopeng Motors y Momo Zhixing, también han lanzado herramientas de etiquetado automático. Gu Weihao, CEO de Momo Zhixing, declaró públicamente que actualmente, para obtener líneas de carril, participantes del tráfico e información de semáforos, el costo del etiquetado manual es de aproximadamente 5 yuanes por imagen, mientras que el costo de Momo DriveGPT es de solo 0,5 yuanes.
En 2019, Wu Di, formador de datos de IA en una ciudad de primer nivel, tuvo el presentimiento del techo de su carrera, su empresa es la encargada de desarrollar el proyecto de atención al cliente inteligente de la plataforma de comercio electrónico. El progreso fue más rápido de lo que había imaginado, en menos de un año, el equipo de etiquetado de datos de 10 personas que estaba a cargo se cortó y solo quedaron operadores esporádicos.
"El día que el proyecto siga madurando es cuando ya no se nos necesite".
La evolución del modelo grande es como un río caudaloso, siempre atacando por sorpresa en un momento determinado, dejando atrás al equipo artificial.
En un informe de encuesta realizado por la Universidad de Zúrich en marzo de este año, los investigadores descubrieron a través de mediciones reales que la capacidad de procesamiento de ChatGPT en 15 tareas de etiquetado era mayor que la de los crowdsourcers.
A principios de abril de este año, Li Jie, un estudiante de medicina en la escuela, completó el etiquetado de texto de una gran fábrica en el campo de la medicina dentro de un mes. Este proyecto se utilizará para proporcionar diagnóstico inteligente y servicios de diálogo. Esto también hizo que Li Siente por primera vez la evolución de los modelos grandes.velocidad.
"Al principio, seguimos alimentando la plataforma con términos médicos clasificados y, en la segunda semana, el sistema pudo realizar automáticamente la clasificación básica de los sustantivos y la tasa de precisión superó el 90 %".
En Taiyuan, Shanxi, la Sra. Zhou, la capataz de la base, comenzó a persuadir a los recién llegados para que asumieran proyectos más difíciles, porque era difícil para la empresa soportar la presión de los proyectos que se archivaban una y otra vez. "En la actualidad, cuanto más simple es el negocio de etiquetado, menor es la ganancia, y algunos proyectos serán amarillos si se completan a la mitad, y el costo de la mano de obra no puede cubrir los ingresos del proyecto en absoluto".
Un reclutador de la industria del etiquetado de datos le dijo a Times Finance que, desde este año, el umbral de reclutamiento ha cambiado gradualmente de estudiantes universitarios a estudiantes universitarios. "En el pasado, básicamente no había requisitos de experiencia para los etiquetadores. Ahora, muchas empresas esperan que los nuevos empleados puedan comenzar a trabajar en proyectos directamente, lo que puede reducir los costos de capacitación inicial".
En la actualidad, el etiquetado inteligente puede capturar de manera aproximada la forma y la posición básicas de los objetos, pero en términos de precisión, aún está por detrás de los etiquetadores profesionales.
Nadie sabe cuándo el etiquetado inteligente marcará el comienzo de una gran explosión, pero Li Wei siempre va acompañado de una sensación de inseguridad. Cada vez que abre una nueva página de proyecto, el cuadro rojo que representa el etiquetado inteligente siempre aparece primero, como si recordara a las personas frente a la pantalla todo el tiempo:
Un día, ocupará su lugar.
(Los entrevistados en este artículo son todos seudónimos).