Plegado del modelo grande de IA: los datos indican que el ingreso mensual de los "trabajadores migrantes" no supera los 5000 y el precio unitario cae de 5 centavos a 4 centavos
Zheng Wen todavía recuerda aquella tarde de hace unos meses: ese día ganaba 20 centavos la hora. Se graduó de una universidad en Hunan y es una gran anotadora de datos de modelos. Su trabajo diario no es complicado: agregar etiquetas a los datos sin procesar (como imágenes, videos, textos, etc.) que recibe.
Sin embargo, los modelos grandes tienen requisitos muy altos en cuanto a la calidad de los datos. Ese día, una imagen fue revisada ocho veces antes de ser aprobada. Todo el proceso de revisión duró una hora. En otras palabras, sólo ganaba 2 centavos por hora, mientras que en circunstancias normales podía ganar 12 yuanes y sacar 600 cajas. "Hacer dinero no es fácil", subrayó repetidamente.
Este es el consenso de casi todos los profesionales de la anotación de datos. Un extremo de la anotación de datos lleva el salario mensual de los practicantes, que cuestan menos de 5.000 yuanes y construyen la piedra angular del modelo grande como un ejército de hormigas. En el otro extremo está el sueño de IA de las principales empresas de Internet, que esperan superar a Chat GPT 4.
La anotación de datos utiliza el sistema de pago a destajo más primitivo para calcular los salarios y no hay intrigas en el lugar de trabajo. El único problema es que este aburrido trabajo hace que a la mayoría de ellos les resulte difícil persistir durante tres meses. Y casi todo el mundo le dijo a Planet Tech que será mejor que no vayas.
Pero lo que no saben es que la mayoría de ellos podrían perder pronto sus aburridos trabajos. Porque esas simples anotaciones de datos serán reemplazadas por IA.
De 5 céntimos a 4 céntimos, el precio se desplomó
Lin Shuang ganó mucho "dinero rápido" en 2017: más de 6.000 yuanes en 15 días. Para Lin Shuang, quien se graduó de una universidad, estos ingresos son realmente considerables. En ese momento, las expectativas de la gente sobre la IA se estaban disparando. Casi nadie dudaba de su futuro. Todas las instituciones de inversión creían firmemente que aquí podrían nacer empresas de miles de millones, decenas de miles de millones o incluso cientos de miles de millones.
Detrás de casi todas las tecnologías de IA hay competencia entre algoritmos, potencia informática y cálculos. La enorme cantidad de datos es la capa inferior de la excelencia técnica. Programadores con antecedentes brillantes se sientan en oficinas en "Beijing, Shanghai y Guangzhou" y dibujan planos de IA a través de algoritmos de iteración de código, mientras estudiantes universitarios, madres, etc. procesan imágenes, texto y voces en enormes paquetes de datos en cubículos de terceros y Ciudades de cuarto nivel, espera.
ChatGPT no es una excepción. Un empleado del equipo del proyecto Baidu Wenxinyiyan dijo que el modelo grande en sí no tiene ninguna tecnología nueva ni barreras técnicas altas, y la cuestión clave es la barrera de parámetros formada por la barrera de la potencia informática.
Los anotadores de datos en la era de los modelos grandes no son particularmente diferentes de los del pasado, las pocas diferencias pueden ser un entorno de oficina más cómodo y mayores requisitos de calidad de anotación. Un profesional de anotación de datos le dijo a Tech Planet que cuando ingresan por primera vez a la industria, generalmente forman un equipo de aproximadamente 10 personas, una de las cuales es responsable de la inspección de calidad. Si el trabajo no cumple con los estándares, el empleado será enviado de regreso a Vuelvelo a hacer. La calidad de los datos determina la calidad de los modelos grandes.
A los trabajadores migrantes de datos no les importan las nuevas ramas de la tecnología de inteligencia artificial, sino más bien el precio unitario, porque aquí los salarios se calculan pieza por pieza.
"En aquella época, cuando el precio unitario era alto, un marco 2D costaba más de 1 centavo. En mi mejor momento, trabajaba más de 10 horas y ganaba más de 600 yuanes al día", recuerda Lin Shuang. Sin embargo, esto no es el más alto: un comentarista dijo que el precio de los primeros dibujos de marcos en 2D podría alcanzar hasta 50 centavos.
El dibujo del marco es una operación común en la anotación de datos: el anotador marca los objetos en la imagen, como vehículos, semáforos rojos, obstáculos, etc., de acuerdo con los requisitos. Los fotogramas se dividen en 2D y 3D, este último será más caro.
Pero esta popularidad no duró mucho. Con la afluencia de cada vez más personas y el desarrollo general de la industria de la IA no va bien, el precio unitario de anotar una imagen es cada vez más bajo. Lin Shuang dijo que el precio más bajo ahora es sólo 4 centavos.
"Si se trata de un marco de tracción, el precio unitario promedio en la industria es de alrededor de 0,15 yuanes, pero aún depende del proyecto. Si se pueden recibir pedidos, el requisito mínimo para recibir un pedido de primera mano debe ser de 100 empleados. La escala es bastante grande y el marco 3D puede costar 30 centavos por pieza, pero es raro que llegue a 50 centavos”.
Por supuesto, si tiene conocimientos profesionales en los campos médico y financiero, el precio unitario será mayor. Por ejemplo, muchos modelos médicos grandes requieren que los anotadores tengan conocimientos clínicos y experiencia relevante.
El ingreso mensual de la mayoría de los practicantes no supera los 5.000 yuanes, y también hay algunos afortunados entre ellos. Yang Shuo originalmente tenía una tienda de ropa en Sichuan, pero la epidemia afectó su negocio. Este año hizo la transición a la anotación de datos de modelos a gran escala. Ahora, tiene un ingreso de 8.000 yuanes por mes. "Firmé un contrato con la empresa y pagado La tarifa de franquicia es de 9.500 yuanes y el contrato establece que el ingreso mensual mínimo es de 7.000 yuanes ".
Quién ganó el dinero
Gigantes de Internet como Alibaba, Tencent y Byte, así como compañías automotrices como SAIC y Lynk & Co, son las fuentes de distribución comercial de anotación de datos. Si desea obtener pedidos directamente de la fuente al mejor precio, anotación de datos las empresas necesitan tener una cierta escala. .
Un empleado de una empresa de anotación de datos le dijo a Tech Planet que reciben pedidos directamente de los grandes fabricantes, pero los grandes fabricantes les exigen 500 personas, por lo que optarán por satisfacer las necesidades de personal a través de franquicias o subsidiarias.
La diferencia entre los dos es que la franquicia es adecuada para que las personas que son nuevas en la industria monten un estudio. Si desea montar una filial, generalmente sólo hay una en una región. Xiaobai Studio necesita cobrar una tarifa de franquicia, que es de 25.000 o 30.000. La filial es el agente exclusivo en una región y debe pagar una tarifa de 50.000. Y pueden garantizar pedidos suficientes en un plazo de tres años y encargarse de la formación técnica en un plazo de tres años. Estos estudios o filiales forman un gran sindicato, que oscila entre varios cientos y varios miles.
Los empleados de la empresa de anotación de datos antes mencionada dijeron que la popularidad de los modelos grandes ha vuelto a enloquecer a la industria de la anotación de datos y ahora la gente visita su empresa casi todos los días.
Pero, de hecho, dirigir una empresa de etiquetado de datos no es fácil. Lo que le dice la empresa de anotación de datos es que esta industria es difícil de hacer en los primeros 1 o 2 meses porque los empleados necesitan un período de preparación. En la etapa inicial, solo de 5 a 8 personas son suficientes, e incluso una tía en ella. Los 40 no tendrán problema.
La estabilidad es el factor más importante para una empresa o estudio de anotación de datos. Sin embargo, la mayoría de los empleados de anotación con los que Tech Planet entra en contacto a menudo dejan sus trabajos a la velocidad de la luz en 3 meses debido al aburrimiento. Los nuevos empleados no están disponibles de inmediato para operaciones prácticas. El resultado de la alta rotación de personal es que la calidad y el ciclo de anotación de datos no son lo suficientemente estables. Las mamás que tienen poco dinero son las personas más populares en los estudios de anotación de datos.
"Definitivamente no es posible encontrar un trabajo a tiempo parcial. Habrá lagunas. Si inviertes en alquiler y en computadoras, perderás dinero. La mejor manera es que todos los empleados trabajen", Wei Ming, que ha dirigido un estudio de datos. estudio de anotaciones, dijo a Tech Planet.
La mayoría de los datos indican que el ciclo de pago de la empresa comienza a los 3 meses y puede durar hasta medio año, pero deben pagar a sus empleados mensualmente, lo que requiere un cierto grado de reservas de capital. "3500 por persona, 100 personas, 3 meses es 1,05 millones."
Zhang Jian se unió una vez a un sindicato con más de 200 empleados. En el primer año, se pusieron al día con el período explosivo de la industria y el precio unitario del dibujo de marcos 2D llegó a los 5 centavos. Ese año, su sindicato ganó más de 4 millones.
Pero al año siguiente, las cosas empeoraron. El precio unitario marcado bajó, los empleados se volvieron más móviles y el período de intervalo aumentó. Además, dos grandes proyectos no se concretaron y, después de un año entero, perdieron más de 3 millones de yuanes. "Los jefes han dicho que no tocarán la anotación de datos en el corto plazo", dijo Zhang Jian. "Actualmente están en una demanda con el upstream".
Este es un negocio de bajo margen. Haitian Ruisheng es la primera empresa de la industria de anotación de datos que cotiza en la junta principal. El año pasado, la empresa obtuvo ingresos de 263 millones de yuanes, ganancias de sólo 29,45 millones de yuanes y un margen de beneficio neto de poco más del 10%. Pero en el primer semestre de este año, la empresa sufrió pérdidas debido a la disminución del número de clientes.
"Tornillos" que pueden ser reemplazados en cualquier momento
Basándose en la acumulación de hormigas que se mueven en Kenia, OpenAI finalmente se destacó por sus capacidades de modelo de diálogo lingüístico a gran escala. Estas personas comunes, llamadas trabajadores de datos, apoyan el sueño de IA de Sam Altman (el fundador de OpenAI), pero si no sucede nada más, la mayor parte del trabajo en sus manos pronto será reemplazado por los nuevos productos en cuya creación participaron. reemplazado.
En el extranjero, Anthropic, fundada en 2021 por antiguos empleados de Open AI, ha recaudado 5.150 millones de dólares este año, más de siete veces su financiación total en los últimos dos años. La empresa ofrece una nueva forma de entrenar modelos con menos participación humana.
Este año, la startup de IA refuel lanzó una herramienta de código abierto llamada Autolabel, que puede utilizar modelos grandes convencionales en el mercado para etiquetar conjuntos de datos. Los resultados de las pruebas de la compañía indicaron que la eficiencia del etiquetado de Autolabel es 100 veces mayor que el etiquetado manual y el costo es solo 1/7 del costo de mano de obra.
En China, una empresa llamada Vision Future también está construyendo modelos de anotación a gran escala. En una entrevista, dijeron que algunos proyectos se entregaron utilizando GPT y la precisión alcanzó más del 80%, lo que se acerca al trabajo manual.
Sin embargo, el haitiano Ruisheng cree que la IA no logrará una anotación completamente automatizada, porque si la máquina quiere seguir evolucionando y acercarse al juicio y la comprensión humanos, definitivamente necesitará la guía humana.
Casi todos los que se han involucrado en la anotación de datos revelaron el mismo punto de vista a Tech Planet: la anotación de datos es un trabajo sin umbral y solo requiere que usted sea competente en el uso de computadoras.
Pero, de hecho, si se pueden completar anotaciones simples con IA, entonces la participación manual será más difícil, la detección de datos y el trabajo estándar, lo que también significa que el umbral de la industria seguirá aumentando, especialmente ChatGPT, Wen Xinyiyan Un gran modelo de lenguaje para clases.
En comparación, mucho antes de que ChatGPT se hiciera popular, OpenAI organizó a más de una docena de estudiantes de doctorado para "calificar". La base de anotaciones de datos de Baidu en Haikou tiene cientos de anotadores de datos de modelos grandes a tiempo completo, y la tasa de anotadores universitarios alcanza el 100%.
La característica de este tipo de modelo de lenguaje grande es que el anotador debe tener una cierta reserva de conocimientos y capacidad de análisis lógico. Según el informe "Financial Eleven", los anotadores deben determinar el tipo de pregunta y luego calificar y clasificar las cinco respuestas respectivamente. El rango de puntuación es de 0 a 5 puntos. Si la puntuación es inferior a 3 puntos, las razones específicas deben Cabe señalar, como "La respuesta no es lo que se hizo la pregunta (0 puntos)", "muy fuera de tema (1 punto)", "hay problemas lógicos y errores fácticos, y la proporción es pequeña y 2 puntos son dado", etc.
Otra área popular de anotación de datos es la conducción autónoma. Según un informe de Deloitte, la demanda de etiquetado en el campo de la conducción autónoma representará el 38% de todas las aplicaciones posteriores de IA en 2022, y se espera que la proporción aumente al 52% para 2027. En comparación con los modelos de lenguajes grandes, para los modelos en el campo de la conducción autónoma, esas simples operaciones de extracción de cajas todavía tienen requisitos académicos relativamente flexibles.
Los anotadores son la piedra angular de la humanidad desde la era de Internet móvil hasta la era de la inteligencia artificial. La mayoría de los profesionales con los que Tech Planet ha entrado en contacto no conocen los cambios que les traerá la IA ni las contribuciones que han hecho al desarrollo de AI Son solo una nueva generación de tornillos en la era de Internet y pueden ser reemplazados en cualquier momento.
(Nota: todos los personajes del artículo son seudónimos).
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Plegado del modelo grande de IA: los datos indican que el ingreso mensual de los "trabajadores migrantes" no supera los 5000 y el precio unitario cae de 5 centavos a 4 centavos
Fuente original: Tech Planet
Zheng Wen todavía recuerda aquella tarde de hace unos meses: ese día ganaba 20 centavos la hora. Se graduó de una universidad en Hunan y es una gran anotadora de datos de modelos. Su trabajo diario no es complicado: agregar etiquetas a los datos sin procesar (como imágenes, videos, textos, etc.) que recibe.
Sin embargo, los modelos grandes tienen requisitos muy altos en cuanto a la calidad de los datos. Ese día, una imagen fue revisada ocho veces antes de ser aprobada. Todo el proceso de revisión duró una hora. En otras palabras, sólo ganaba 2 centavos por hora, mientras que en circunstancias normales podía ganar 12 yuanes y sacar 600 cajas. "Hacer dinero no es fácil", subrayó repetidamente.
Este es el consenso de casi todos los profesionales de la anotación de datos. Un extremo de la anotación de datos lleva el salario mensual de los practicantes, que cuestan menos de 5.000 yuanes y construyen la piedra angular del modelo grande como un ejército de hormigas. En el otro extremo está el sueño de IA de las principales empresas de Internet, que esperan superar a Chat GPT 4.
La anotación de datos utiliza el sistema de pago a destajo más primitivo para calcular los salarios y no hay intrigas en el lugar de trabajo. El único problema es que este aburrido trabajo hace que a la mayoría de ellos les resulte difícil persistir durante tres meses. Y casi todo el mundo le dijo a Planet Tech que será mejor que no vayas.
Pero lo que no saben es que la mayoría de ellos podrían perder pronto sus aburridos trabajos. Porque esas simples anotaciones de datos serán reemplazadas por IA.
De 5 céntimos a 4 céntimos, el precio se desplomó
Lin Shuang ganó mucho "dinero rápido" en 2017: más de 6.000 yuanes en 15 días. Para Lin Shuang, quien se graduó de una universidad, estos ingresos son realmente considerables. En ese momento, las expectativas de la gente sobre la IA se estaban disparando. Casi nadie dudaba de su futuro. Todas las instituciones de inversión creían firmemente que aquí podrían nacer empresas de miles de millones, decenas de miles de millones o incluso cientos de miles de millones.
Detrás de casi todas las tecnologías de IA hay competencia entre algoritmos, potencia informática y cálculos. La enorme cantidad de datos es la capa inferior de la excelencia técnica. Programadores con antecedentes brillantes se sientan en oficinas en "Beijing, Shanghai y Guangzhou" y dibujan planos de IA a través de algoritmos de iteración de código, mientras estudiantes universitarios, madres, etc. procesan imágenes, texto y voces en enormes paquetes de datos en cubículos de terceros y Ciudades de cuarto nivel, espera.
ChatGPT no es una excepción. Un empleado del equipo del proyecto Baidu Wenxinyiyan dijo que el modelo grande en sí no tiene ninguna tecnología nueva ni barreras técnicas altas, y la cuestión clave es la barrera de parámetros formada por la barrera de la potencia informática.
Los anotadores de datos en la era de los modelos grandes no son particularmente diferentes de los del pasado, las pocas diferencias pueden ser un entorno de oficina más cómodo y mayores requisitos de calidad de anotación. Un profesional de anotación de datos le dijo a Tech Planet que cuando ingresan por primera vez a la industria, generalmente forman un equipo de aproximadamente 10 personas, una de las cuales es responsable de la inspección de calidad. Si el trabajo no cumple con los estándares, el empleado será enviado de regreso a Vuelvelo a hacer. La calidad de los datos determina la calidad de los modelos grandes.
A los trabajadores migrantes de datos no les importan las nuevas ramas de la tecnología de inteligencia artificial, sino más bien el precio unitario, porque aquí los salarios se calculan pieza por pieza.
"En aquella época, cuando el precio unitario era alto, un marco 2D costaba más de 1 centavo. En mi mejor momento, trabajaba más de 10 horas y ganaba más de 600 yuanes al día", recuerda Lin Shuang. Sin embargo, esto no es el más alto: un comentarista dijo que el precio de los primeros dibujos de marcos en 2D podría alcanzar hasta 50 centavos.
El dibujo del marco es una operación común en la anotación de datos: el anotador marca los objetos en la imagen, como vehículos, semáforos rojos, obstáculos, etc., de acuerdo con los requisitos. Los fotogramas se dividen en 2D y 3D, este último será más caro.
Pero esta popularidad no duró mucho. Con la afluencia de cada vez más personas y el desarrollo general de la industria de la IA no va bien, el precio unitario de anotar una imagen es cada vez más bajo. Lin Shuang dijo que el precio más bajo ahora es sólo 4 centavos.
"Si se trata de un marco de tracción, el precio unitario promedio en la industria es de alrededor de 0,15 yuanes, pero aún depende del proyecto. Si se pueden recibir pedidos, el requisito mínimo para recibir un pedido de primera mano debe ser de 100 empleados. La escala es bastante grande y el marco 3D puede costar 30 centavos por pieza, pero es raro que llegue a 50 centavos”.
Por supuesto, si tiene conocimientos profesionales en los campos médico y financiero, el precio unitario será mayor. Por ejemplo, muchos modelos médicos grandes requieren que los anotadores tengan conocimientos clínicos y experiencia relevante.
El ingreso mensual de la mayoría de los practicantes no supera los 5.000 yuanes, y también hay algunos afortunados entre ellos. Yang Shuo originalmente tenía una tienda de ropa en Sichuan, pero la epidemia afectó su negocio. Este año hizo la transición a la anotación de datos de modelos a gran escala. Ahora, tiene un ingreso de 8.000 yuanes por mes. "Firmé un contrato con la empresa y pagado La tarifa de franquicia es de 9.500 yuanes y el contrato establece que el ingreso mensual mínimo es de 7.000 yuanes ".
Quién ganó el dinero
Gigantes de Internet como Alibaba, Tencent y Byte, así como compañías automotrices como SAIC y Lynk & Co, son las fuentes de distribución comercial de anotación de datos. Si desea obtener pedidos directamente de la fuente al mejor precio, anotación de datos las empresas necesitan tener una cierta escala. .
Un empleado de una empresa de anotación de datos le dijo a Tech Planet que reciben pedidos directamente de los grandes fabricantes, pero los grandes fabricantes les exigen 500 personas, por lo que optarán por satisfacer las necesidades de personal a través de franquicias o subsidiarias.
La diferencia entre los dos es que la franquicia es adecuada para que las personas que son nuevas en la industria monten un estudio. Si desea montar una filial, generalmente sólo hay una en una región. Xiaobai Studio necesita cobrar una tarifa de franquicia, que es de 25.000 o 30.000. La filial es el agente exclusivo en una región y debe pagar una tarifa de 50.000. Y pueden garantizar pedidos suficientes en un plazo de tres años y encargarse de la formación técnica en un plazo de tres años. Estos estudios o filiales forman un gran sindicato, que oscila entre varios cientos y varios miles.
Los empleados de la empresa de anotación de datos antes mencionada dijeron que la popularidad de los modelos grandes ha vuelto a enloquecer a la industria de la anotación de datos y ahora la gente visita su empresa casi todos los días.
Pero, de hecho, dirigir una empresa de etiquetado de datos no es fácil. Lo que le dice la empresa de anotación de datos es que esta industria es difícil de hacer en los primeros 1 o 2 meses porque los empleados necesitan un período de preparación. En la etapa inicial, solo de 5 a 8 personas son suficientes, e incluso una tía en ella. Los 40 no tendrán problema.
La estabilidad es el factor más importante para una empresa o estudio de anotación de datos. Sin embargo, la mayoría de los empleados de anotación con los que Tech Planet entra en contacto a menudo dejan sus trabajos a la velocidad de la luz en 3 meses debido al aburrimiento. Los nuevos empleados no están disponibles de inmediato para operaciones prácticas. El resultado de la alta rotación de personal es que la calidad y el ciclo de anotación de datos no son lo suficientemente estables. Las mamás que tienen poco dinero son las personas más populares en los estudios de anotación de datos.
"Definitivamente no es posible encontrar un trabajo a tiempo parcial. Habrá lagunas. Si inviertes en alquiler y en computadoras, perderás dinero. La mejor manera es que todos los empleados trabajen", Wei Ming, que ha dirigido un estudio de datos. estudio de anotaciones, dijo a Tech Planet.
La mayoría de los datos indican que el ciclo de pago de la empresa comienza a los 3 meses y puede durar hasta medio año, pero deben pagar a sus empleados mensualmente, lo que requiere un cierto grado de reservas de capital. "3500 por persona, 100 personas, 3 meses es 1,05 millones."
Zhang Jian se unió una vez a un sindicato con más de 200 empleados. En el primer año, se pusieron al día con el período explosivo de la industria y el precio unitario del dibujo de marcos 2D llegó a los 5 centavos. Ese año, su sindicato ganó más de 4 millones.
Pero al año siguiente, las cosas empeoraron. El precio unitario marcado bajó, los empleados se volvieron más móviles y el período de intervalo aumentó. Además, dos grandes proyectos no se concretaron y, después de un año entero, perdieron más de 3 millones de yuanes. "Los jefes han dicho que no tocarán la anotación de datos en el corto plazo", dijo Zhang Jian. "Actualmente están en una demanda con el upstream".
Este es un negocio de bajo margen. Haitian Ruisheng es la primera empresa de la industria de anotación de datos que cotiza en la junta principal. El año pasado, la empresa obtuvo ingresos de 263 millones de yuanes, ganancias de sólo 29,45 millones de yuanes y un margen de beneficio neto de poco más del 10%. Pero en el primer semestre de este año, la empresa sufrió pérdidas debido a la disminución del número de clientes.
"Tornillos" que pueden ser reemplazados en cualquier momento
Basándose en la acumulación de hormigas que se mueven en Kenia, OpenAI finalmente se destacó por sus capacidades de modelo de diálogo lingüístico a gran escala. Estas personas comunes, llamadas trabajadores de datos, apoyan el sueño de IA de Sam Altman (el fundador de OpenAI), pero si no sucede nada más, la mayor parte del trabajo en sus manos pronto será reemplazado por los nuevos productos en cuya creación participaron. reemplazado.
En el extranjero, Anthropic, fundada en 2021 por antiguos empleados de Open AI, ha recaudado 5.150 millones de dólares este año, más de siete veces su financiación total en los últimos dos años. La empresa ofrece una nueva forma de entrenar modelos con menos participación humana.
Este año, la startup de IA refuel lanzó una herramienta de código abierto llamada Autolabel, que puede utilizar modelos grandes convencionales en el mercado para etiquetar conjuntos de datos. Los resultados de las pruebas de la compañía indicaron que la eficiencia del etiquetado de Autolabel es 100 veces mayor que el etiquetado manual y el costo es solo 1/7 del costo de mano de obra.
En China, una empresa llamada Vision Future también está construyendo modelos de anotación a gran escala. En una entrevista, dijeron que algunos proyectos se entregaron utilizando GPT y la precisión alcanzó más del 80%, lo que se acerca al trabajo manual.
Sin embargo, el haitiano Ruisheng cree que la IA no logrará una anotación completamente automatizada, porque si la máquina quiere seguir evolucionando y acercarse al juicio y la comprensión humanos, definitivamente necesitará la guía humana.
Casi todos los que se han involucrado en la anotación de datos revelaron el mismo punto de vista a Tech Planet: la anotación de datos es un trabajo sin umbral y solo requiere que usted sea competente en el uso de computadoras.
Pero, de hecho, si se pueden completar anotaciones simples con IA, entonces la participación manual será más difícil, la detección de datos y el trabajo estándar, lo que también significa que el umbral de la industria seguirá aumentando, especialmente ChatGPT, Wen Xinyiyan Un gran modelo de lenguaje para clases.
En comparación, mucho antes de que ChatGPT se hiciera popular, OpenAI organizó a más de una docena de estudiantes de doctorado para "calificar". La base de anotaciones de datos de Baidu en Haikou tiene cientos de anotadores de datos de modelos grandes a tiempo completo, y la tasa de anotadores universitarios alcanza el 100%.
La característica de este tipo de modelo de lenguaje grande es que el anotador debe tener una cierta reserva de conocimientos y capacidad de análisis lógico. Según el informe "Financial Eleven", los anotadores deben determinar el tipo de pregunta y luego calificar y clasificar las cinco respuestas respectivamente. El rango de puntuación es de 0 a 5 puntos. Si la puntuación es inferior a 3 puntos, las razones específicas deben Cabe señalar, como "La respuesta no es lo que se hizo la pregunta (0 puntos)", "muy fuera de tema (1 punto)", "hay problemas lógicos y errores fácticos, y la proporción es pequeña y 2 puntos son dado", etc.
Otra área popular de anotación de datos es la conducción autónoma. Según un informe de Deloitte, la demanda de etiquetado en el campo de la conducción autónoma representará el 38% de todas las aplicaciones posteriores de IA en 2022, y se espera que la proporción aumente al 52% para 2027. En comparación con los modelos de lenguajes grandes, para los modelos en el campo de la conducción autónoma, esas simples operaciones de extracción de cajas todavía tienen requisitos académicos relativamente flexibles.
Los anotadores son la piedra angular de la humanidad desde la era de Internet móvil hasta la era de la inteligencia artificial. La mayoría de los profesionales con los que Tech Planet ha entrado en contacto no conocen los cambios que les traerá la IA ni las contribuciones que han hecho al desarrollo de AI Son solo una nueva generación de tornillos en la era de Internet y pueden ser reemplazados en cualquier momento.
(Nota: todos los personajes del artículo son seudónimos).