Palabras de Mark Wen Xin, 4.000 yuanes al mes

2023-08-29 02:16:25

Fuente: Pinwan

Autor: vinagre

"Tanta inteligencia como inteligencia artificial hay".

Los chistes se esconden detrás de la inteligencia artificial y, hasta ahora, siguen siendo ciertos. Ding Yang, que acaba de graduarse de la universidad, tiene temporalmente su futuro en la segunda mitad de la sentencia.

Ding Yang estudió ingeniería química ligera cuando estaba en la universidad. Después de graduarse, la mayoría de los estudiantes del departamento fueron a las fábricas de papel en tres turnos. Él no quería ir a la fábrica. Después de graduarse en junio de este año, Ding Yang regresó a Haikou, tomó una versión electrónica del banco de preguntas de capacitación a principios de agosto y dos días después, se convirtió en un etiquetador de datos "novato" de Wenxin Yiyan.

El edificio de comerciantes de China en el distrito de Xiuying, ciudad de Haikou, suele ser llamado la "base" por los etiquetadores de datos de Wen Xinyi. De esta base entraban y salían más de doscientas personas, distribuidas en los tres pisos de este edificio de oficinas, debían firmar un acuerdo de confidencialidad antes de ingresar al puesto de trabajo y debían escanear sus rostros al entrar por la puerta. Tenía una computadora El jefe alquiló y envió muchas computadoras desde Shanxi, porque No hay muchos conocidos que alquilen estos equipos localmente.

"Comprar esta computadora no cuesta 500 yuanes. Una vez llevé el host a buscar en Xianyu; valía 60 yuanes. Puedo instalar uno mucho mejor por 500 yuanes".

Ding Yang solicitó ciencias de la computación durante el examen de ingreso a la universidad y luego fue transferido a ingeniería química ligera, pero no estaba interesado en esto, sino que leyó mucha ingeniería de computación y software en la universidad, lo que le hizo enterarse rápidamente. a finales del año pasado, la aparición de ChatGPT.

En diciembre, registró una cuenta ChatGPT y luego "la capacidad está más allá de mis predicciones", dijo.

Fuente: Pinwan

Cuando me encontré con Ding Yang en la estación de trabajo de la base, la pregunta en la pantalla de la computadora frente a él era: "¿Cuál es el estándar de una persona exitosa?"

Esta puede ser una pregunta real de un usuario de Wenxin Yiyan, o puede ser una pregunta de prueba generada de la nada, pero se coloca frente a la pantalla y debe marcarse.

Etiquetar no es fácil.

Para una de esas preguntas, Wen Xin Yiyan dará cinco respuestas diferentes. El etiquetador de datos tiene que leerlos y luego descubrir todos los defectos en cada respuesta.

Por ejemplo, hay errores tipográficos en las respuestas o el uso incorrecto de palabras lógicas como "porque" y "entonces", pero la mayoría de las respuestas son irrelevantes para la pregunta, o existen las llamadas "ilusiones" que no tienen fundamento fáctico. base en un determinado párrafo.

A estas cinco respuestas les dará una puntuación según la calidad de la respuesta, con una puntuación total de 5 puntos, un total de cinco niveles y un mínimo de 1 punto. Para respuestas con 3 puntos o menos, Ding Yang necesita dividir cada error en diferentes tipos de error proporcionados por el sistema de etiquetado.

Este complejo proceso de corrección de errores consiste en entrenar y generar un modelo de recompensa RM (modelo de recompensa, también llamado modelo de preferencia) adecuado, y las acciones de puntuación y clasificación alinearán aún más el modelo con las preferencias humanas.

Esta es también la clave del éxito de ChatGPT. El artículo de OpenAI describe el proceso de alinear la inteligencia artificial con las ideas humanas durante el proceso de ajuste de instrucciones.

Antes del trabajo de los etiquetadores de datos, se necesita más personal profesional para convertir el corpus divergente en pares específicos de preguntas y respuestas y luego alimentarlos al modelo grande como preguntas de ejemplo, después de que este último se optimice después de una gran cantidad de preguntas y respuestas. entrenamiento de datos, comienza Responder preguntas.

En esta etapa, el etiquetador de datos evalúa la calidad de las respuestas generadas por el modelo grande desde las perspectivas de seguridad, precisión y relevancia. Estos datos de evaluación entrenan aún más un modelo de recompensa. Al final, este modelo de recompensa sustituirá el trabajo de etiquetado manual.

Detrás de la valoración de OpenAI de más de 30 mil millones de dólares, hay una gran cantidad de datos kenianos que etiquetan a los trabajadores cuyos salarios por hora son inferiores a 2 dólares estadounidenses; de lo contrario, no habrían estado frente a Ding Yang en diciembre del año pasado.

Pero Ding Yang no conocía la definición de RM o SFT y dijo que no había tal contenido teórico en la capacitación antes de comenzar y que algunas personas aquí ni siquiera sabían para qué estaba trabajando Wen Xinyiyan. Pero eso no importa, lo que importa es hacer las cosas.

El salario básico de este trabajo, que es de nueve a seis de la mañana y seis días libres, es de 1.800 yuanes. Después de un mes, si puedes corregir 40 preguntas por día en promedio, obtendrás el salario básico. El salario base se calcula según la tasa de finalización y la comisión también debe tener en cuenta la tasa correcta. El "veterano" que lleva un tiempo aquí tiene una carga de trabajo estable de 7 u 80 al día, y los problemas que encuentra son más difíciles. En promedio, puedes ganar 4.000 yuanes al mes. Si trabajas más duro, por ejemplo, si marcas unas 100 preguntas cada día, puedes ganar 7.000 yuanes al mes.

Para un recién graduado como Ding Yang, 4.000 yuanes se consideran un trabajo con un comienzo decente. El salario mensual promedio de la gente de Haikou es sólo un poco más de 3.000 yuanes, e incluso 6 de cada 10 personas no pueden ganar 3.000 yuanes al mes. El famoso polvo Hou'an local cuesta 11 yuanes y los etiquetadores de ChatGPT pueden comprar un cuenco por una hora. En comparación, el polvo es caro. Según él, la gente de Haikou no gana mucho dinero, pero está dispuesta a gastar en comida.

Fuente: Pinwan

"Las acciones son las más difíciles, o los automóviles", dijo Ding Yang. Pueden ser necesarios 20 minutos para encontrar un problema en esta área.

"Por ejemplo, alguien preguntará si comprar un BMW Serie 3 o un Mercedes-Benz Serie C." En ese momento, el modelo grande enumerará más de 80 parámetros sobre los dos coches para que el usuario los compare, y éste tendrá que Síguelo uno por uno y verifica la autenticidad de cada parámetro.

Después de medio mes de trabajo, se han marcado cientos de preguntas, pero dijo que, en su impresión, obtener una puntuación de 3 ya es bueno y que es raro obtener una puntuación de 4.

Recordó una pregunta que obtuvo 4 puntos, el título era "¿Por qué Lin Daiyu luchó contra el Demonio de Hueso?"

Wen Xin no siguió el poste con una palabra y se dio cuenta de que Lin Daiyu no fue quien venció a Bone Demon, y luego presentó los antecedentes de Lin Daiyu y Bone Demon. Desde todos los aspectos de la calidad de las respuestas, esto es casi impecable.

Le planteé esta pregunta a Claude 2 y decía: "El Demonio de Hueso se convirtió en Wang Xifeng y humilló a Lin Daiyu muchas veces, y Lin Daiyu estaba enojado por el asesinato del Demonio de Hueso". ——La alucinación es de hecho bastante problemática.

Fuente: Pinwan

A principios de 2020, el "entrenador de inteligencia artificial" se convirtió oficialmente en una profesión y se incluyó en el directorio nacional de clasificación ocupacional, dos años después, la ola de grandes modelos abrió repentinamente un agujero mayor en este directorio.

Ver a la inteligencia artificial quitarle viejos trabajos a los humanos y luego esperar que cree otros nuevos. Al igual que el carruaje fue reemplazado por el automóvil, la nueva industria le dará al conductor del carruaje una metáfora general de un nuevo mundo laboral para enriquecerse. Muchos inversores que buscan objetivos con dinero compran esta afirmación, y algunas personas no No lo creo. Por ejemplo, han sentado las bases para el aprendizaje profundo. Ahora el inglés Geoffrey Hinton está preocupado.

Pero la creación más directa en este momento es el etiquetador de datos de grandes modelos como Ding Yang.

Antes de 2022, la frontera de la inteligencia artificial todavía está definida por los coches autónomos que no pueden controlarse a sí mismos. Existe una fría metáfora para los etiquetadores de datos:

"Si piensas en la IA como un animal, el trabajo de un etiquetador de datos es más o menos equivalente a preparar alimento".

El trabajo es barato, repetitivo, ni siquiera lo suficientemente parecido como para ser un alimentador.

Un etiquetador de datos tradicional, el trabajo diario es solo observar cuidadosamente cada imagen recibida, rodear el contorno de un automóvil o un perro, etiquetarlo, arrastrarlo y soltarlo en diferentes carpetas; o usar matriz de puntos La herramienta marca los obstáculos en cada cuadro de un vídeo de conducción, dejando un "área de conducción" completa.

Un etiquetador de datos puede realizar una acción de este tipo 2.000 veces al día.

La inteligencia artificial sólo puede aprender datos etiquetados. Un proveedor de datos de conducción autónoma afirmó una vez que el grado de automatización del etiquetado de datos sigue siendo solo del 5% desde el desarrollo del etiquetado de datos, y que el otro 95% del trabajo de etiquetado todavía se realiza manualmente.

Después de la llegada del modelo grande, el tipo de etiquetado de datos comenzó a cambiar. No solo dibujar cuadros, dibujar puntos o dibujar líneas en la pantalla, el trabajo principal del etiquetador de datos de modelos grandes se convierte en la evaluación, clasificación y puntuación del contenido generado. Si implica múltiples rondas de diálogo o generación de contenido multimodal, la dificultad Otro fuerte aumento.

Si se dice que la anotación de modelos en la era tradicional de CV y PNL tiende a actuar de acuerdo con reglas objetivas, las reglas de anotación de los modelos grandes son más subjetivas y también prueban la calidad del personal de anotación. Debido a esto, los grandes equipos de etiquetado de modelos de Baidu en Haikou y Shanxi son todos estudiantes universitarios o superiores.

Los etiquetadores comunes en la base de Haikou tienen la oportunidad de ser ascendidos a inspectores de calidad, y luego pueden ser capacitadores, luego supervisores y finalmente gerentes de proyecto. Este es un canal que se ha establecido en unos pocos meses. Un agente en Haikou que hizo anotaciones de datos para Wenxin Yiyan dijo que después del período de prueba, uno puede ser ascendido si hay un puesto interno y no hay un cronograma.

Esta es una nueva industria que se está formando rápidamente. "Cada vínculo es un recién llegado", dijo Ding Yang.

Una vez que el inspector de calidad complete la primera revisión, entregará el banco de preguntas para la segunda revisión. La segunda revisión la realizó Baidu internamente y los datos de entrenamiento estaban fuera del alcance del equipo de etiquetado de Ding Yang.

Ding Yang, que trabaja para Wen Xinyiyan, y más de 200 personas en toda la base no son empleados de Baidu.

Los etiquetadores de la base de Haikou pertenecen a cuatro agencias diferentes. Sus contratos laborales se firman con estas empresas de etiquetado de datos de terceros. Esta es la práctica de este puesto. La larga historia de Baidu en inteligencia artificial, desde la búsqueda hasta la conducción autónoma y los modelos a gran escala, está detrás de más de 600 agentes en todo el país y 200.000 etiquetadores de datos en más de 300 ciudades.

Baidu presupone que el tamaño de su equipo modelo a gran escala a tiempo completo se acerca a las 10.000 personas, y este plan se ejecutará como una nueva "base" en más de diez ciudades de todo el país en el futuro.

Hu Chi, gerente de producto de Baidu Intelligent Cloud Data Annotation Base, cree que los anotadores de datos de modelos grandes tendrán una carrera a largo plazo. Con la profundización de las capacidades de los grandes modelos en diversos escenarios, aparecerán nuevos problemas, lo que también significa que aparecerán nuevos requisitos de etiquetado. Los humanos siempre necesitarán una alineación tan diligente.

Ding Yang dijo que se iría de aquí.

Hubo más de 20 etiquetadores de datos novatos que llegaron al mismo tiempo que él, y la mayoría de ellos se fueron pronto; la mayoría se fueron voluntariamente. El contenido aburrido del trabajo, la forma de ganar dinero mediante salarios a destajo y el consumo de las personas, no es difícil imaginar que esta será una posición de alta fluidez. Y por mucho que la gente aplauda, la inseguridad de ser sustituido por máquinas está ahí, algo que a todo el mundo le encanta ver.

Ding Yang ve esto como una oportunidad para crecer con la industria. "Intenta ver si puedes ser supervisor", dijo, antes de encontrar un puesto más cercano a la ola de IA.

(Ding Yang es un seudónimo en el texto)

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
ETH Breaks $3600
19k Popularidad
Gate Derivatives Volume Hits New High
18k Popularidad
CPI Data Incoming
61k Popularidad
4Join Gate VIP to Win MacBook
31k Popularidad
5MicroStrategy Buys More Bitcoin
3k Popularidad
6BTC Hits New High
113k Popularidad
7My Gate Moments
28k Popularidad
8VIP Exclusive Airdrop Carnival
27k Popularidad
9Fed June Meeting Minutes
7k Popularidad
10Trump Tariff Hikes
18k Popularidad

Anclado