¿Cuántas empresas de etiquetado de IA acabará con el “gran movimiento” de Google?

Question

Fuente original: AI New Intelligence![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4ddb3768ca-dd1a6f-6d2ef1) Fuente de la imagen: Generada por Unbounded AI‌Si la IA generativa actual es como un niño que crece vigorosamente, entonces los datos continuos son el alimento que lo alimenta para crecer.La anotación de datos es el proceso de elaboración de este "alimento".Sin embargo, este proceso es realmente volumétrico y agotador.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-be656aad76-dd1a6f-6d2ef1) El "anotador" que realiza la anotación no solo necesita identificar repetidamente varios objetos, colores, formas, etc. en la imagen, sino que a veces incluso necesita limpiar y preprocesar los datos.Con el avance continuo de la tecnología de inteligencia artificial, las limitaciones de la anotación manual de datos son cada vez más evidentes. La anotación manual de datos no sólo requiere mucho tiempo y trabajo, sino que a veces es difícil garantizar la calidad.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0bce865bf3-dd1a6f-6d2ef1) Para resolver estos problemas, Google propuso recientemente un método que utiliza modelos grandes para reemplazar a los humanos en la anotación de preferencias, llamado AI Feedback Reinforcement Learning (RLAIF).![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f6f2f6e5f6-dd1a6f-6d2ef1) Los resultados de la investigación muestran que RLAIF puede producir mejoras comparables al aprendizaje reforzado con retroalimentación humana (RLHF) sin depender de la anotación humana, siendo ambas tasas de éxito del 50%. Mientras tanto, tanto el RLAIF como el RLHF superan la estrategia básica de ajuste supervisado (SFT).Estos resultados muestran que RLAIF no necesita depender de anotaciones manuales y es una alternativa factible a RLHF. **Entonces, si esta tecnología realmente se promueve y populariza en el futuro, ¿muchas empresas que todavía dependen de "cajas de extracción" manuales para la anotación de datos realmente se verán obligadas a llegar a un callejón sin salida de ahora en adelante?## **1 Estado actual de la anotación de datos**Si queremos simplemente resumir el estado actual de la industria nacional de anotaciones, sería: ** La carga de trabajo es grande, pero la eficiencia no es muy alta y es un estado ingrato. **Las empresas de etiquetado se conocen como fábricas de datos en el campo de la IA y generalmente se concentran en áreas con ricos recursos humanos como el sudeste asiático, África o Henan, Shanxi y Shandong en China.Para controlar costos, los jefes de la empresa etiquetadora alquilarán un espacio en el condado, instalarán computadoras y, cuando haya pedidos, contratarán gente cercana para trabajar a tiempo parcial, si no hay pedidos, se disolverán. y descansar.En pocas palabras, este tipo de trabajo es un poco similar al de los trabajadores temporales de decoración al borde de la carretera.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-b55ae865b4-dd1a6f-6d2ef1) En la estación de trabajo, el sistema le dará al "anotador" aleatoriamente un conjunto de datos, que generalmente incluye varias preguntas y varias respuestas.Después de eso, el "anotador" primero debe marcar a qué tipo pertenece la pregunta y luego calificar y clasificar las respuestas.Anteriormente, cuando la gente hablaba de la brecha entre los modelos grandes nacionales y los modelos grandes avanzados como GPT-4, resumían las razones de la baja calidad de los datos nacionales.Pero ¿por qué la calidad de los datos no es alta? Parte de la razón radica en la "línea de montaje" de la anotación de datos.Actualmente, existen dos tipos de fuentes de datos para los grandes modelos chinos: uno son conjuntos de datos de código abierto; el otro son datos de Internet chinos rastreados a través de rastreadores.**Una de las principales razones por las que el rendimiento de los modelos grandes chinos no es lo suficientemente bueno es la calidad de los datos de Internet. **Por ejemplo, los profesionales generalmente no utilizan Baidu cuando buscan información.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-1a39c5eeb5-dd1a6f-6d2ef1) Por tanto, ante algunos problemas de datos más profesionales y verticales, como atención médica, finanzas, etc., es necesario cooperar con un equipo profesional.Pero en este momento, el problema vuelve a surgir: para los equipos profesionales, no sólo el período de retorno es largo en lo que respecta a los datos, sino que los primeros en avanzar probablemente sufran pérdidas.Por ejemplo, si un determinado equipo de anotaciones gastó mucho dinero y tiempo para producir una gran cantidad de datos, otros pueden simplemente empaquetarlos y comprarlos por una pequeña cantidad de dinero.Ante este dilema del "gorrón", los grandes modelos nacionales han caído en la extraña situación de tener muchos datos pero baja calidad.Siendo ese el caso, ¿cómo resuelven este problema algunas de las principales empresas extranjeras de IA, como OpenAI?![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-39ed966e98-dd1a6f-6d2ef1) De hecho, en términos de anotación de datos, OpenAI no ha renunciado a utilizar mano de obra intensiva y barata para reducir costos.Por ejemplo, anteriormente se reveló que había contratado a un gran número de trabajadores kenianos para etiquetar información tóxica a un precio de 2 dólares estadounidenses la hora.**Pero la diferencia clave radica en cómo resolver los problemas de calidad de los datos y eficiencia de la anotación. **Específicamente, la mayor diferencia entre OpenAI y las empresas nacionales a este respecto es cómo reducir el impacto de la "subjetividad" y la "inestabilidad" de la anotación manual.## **2 El enfoque de OpenAI**Para reducir la "subjetividad" y la "inestabilidad" de dichos anotadores humanos, OpenAI adopta aproximadamente dos estrategias principales:**1. Combinación de retroalimentación artificial y aprendizaje por refuerzo;**Hablemos primero del primer punto: en términos del método de etiquetado, la mayor diferencia entre la retroalimentación manual de OpenAI y la retroalimentación doméstica es que principalmente clasifica o califica el comportamiento del sistema inteligente, en lugar de modificar o etiquetar su salida.El comportamiento de un sistema inteligente se refiere a que el sistema inteligente realiza una serie de acciones o decisiones basadas en sus propios objetivos y estrategias en un entorno complejo.Por ejemplo, jugar, controlar un robot, hablar con una persona, etc.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0c4753d38e-dd1a6f-6d2ef1) La salida de un sistema inteligente se refiere a generar un resultado o respuesta basada en datos de entrada en una tarea simple, como escribir un artículo o dibujar un cuadro.En términos generales, el comportamiento de los sistemas inteligentes es más difícil de juzgar en términos de "correcto" o "incorrecto" que su resultado, y debe evaluarse en términos de preferencia o satisfacción.Este tipo de sistema de evaluación basado en "preferencia" o "satisfacción" no requiere modificación o anotación de contenido específico, reduciendo así el impacto de la subjetividad humana, el nivel de conocimiento y otros factores en la calidad y precisión de la anotación de datos.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-fa089beac5-dd1a6f-6d2ef1) Es cierto que las empresas nacionales también utilizarán sistemas similares a "clasificar" y "puntuar" al etiquetar, pero debido a la falta de un "modelo de recompensa" como OpenAI como función de recompensa para optimizar la estrategia del sistema inteligente, como " ordenar" y "puntuar" La "puntuación" sigue siendo esencialmente un método para modificar o anotar la salida.**2. Canales de fuente de datos diversificados y a gran escala;**Las principales fuentes de anotación de datos en China son empresas de anotación de terceros o equipos de empresas de tecnología autoconstruidos, compuestos en su mayoría por estudiantes universitarios y que carecen de profesionalismo y experiencia suficientes para proporcionar comentarios eficientes y de alta calidad.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-25430fe51a-dd1a6f-6d2ef1) Por el contrario, la retroalimentación manual de OpenAI proviene de múltiples canales y equipos.OpenAI no solo utiliza conjuntos de datos de código abierto y rastreadores de Internet para obtener datos, sino que también coopera con múltiples empresas e instituciones de datos, como Scale AI, Appen, Lionbridge AI, etc., para obtener datos más diversos y de alta calidad.En comparación con sus homólogos nacionales, los métodos de etiquetado de estas empresas e instituciones de datos son mucho más "automáticos" e "inteligentes".![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-31b54c359b-dd1a6f-6d2ef1) Por ejemplo, Scale AI utiliza una técnica llamada Snorkel, un método de etiquetado de datos basado en un aprendizaje débilmente supervisado que puede generar etiquetas de alta calidad a partir de múltiples fuentes de datos imprecisas.Al mismo tiempo, Snorkel también puede utilizar una variedad de señales, como reglas, modelos y bases de conocimiento, para agregar etiquetas a los datos sin etiquetar manualmente cada punto de datos directamente. Esto puede reducir en gran medida el costo y el tiempo de la anotación manual.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-ff9b4ab4eb-dd1a6f-6d2ef1) A medida que se acortan el costo y el ciclo de anotación de datos, estas empresas de datos con ventajas competitivas pueden elegir subdivisiones de alto valor, alta dificultad y alto umbral, como conducción autónoma, modelos de lenguaje grandes, datos sintéticos, etc. Pueden mejorar continuamente su principal competitividad y ventajas diferenciadas.De esta manera, el dilema del parasitismo de que "los primeros en actuar sufrirán" también ha sido eliminado por fuertes barreras tecnológicas e industriales.## **3 Estandarización VS pequeño taller**Se puede ver que **La tecnología de etiquetado automático de IA realmente eliminará solo aquellas empresas de etiquetado que todavía utilizan el etiquetado puramente manual. **Aunque la anotación de datos parece una industria que requiere mucha mano de obra, una vez que profundice en los detalles, descubrirá que buscar datos de alta calidad no es una tarea fácil.Representada por Scale AI, un unicornio de anotación de datos en el extranjero, Scale AI no solo utiliza recursos humanos baratos de África y otros lugares, sino que también recluta docenas de doctores para manejar datos profesionales en diversas industrias.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-1a33c517f5-dd1a6f-6d2ef1) La calidad de la anotación de datos es el mayor valor que Scale AI ofrece a grandes empresas modelo como OpenAI.Para garantizar la calidad de los datos al máximo, además del uso de anotaciones asistidas por IA mencionadas anteriormente, otra innovación importante de **Scale AI es una plataforma de datos unificada. **Estas plataformas incluyen Scale Audit, Scale Analytics, ScaleData Quality, etc. A través de estas plataformas, los clientes pueden monitorear y analizar varios indicadores en el proceso de anotación, verificar y optimizar los datos de la anotación y evaluar la precisión, coherencia e integridad de la anotación.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-6d639f5fd0-dd1a6f-6d2ef1) Se puede decir que estas herramientas y procesos estandarizados y unificados se han convertido en los factores clave que distinguen entre **"fábricas de líneas de montaje"** y **"talleres hechos a mano"** en las empresas de etiquetado.En este sentido, la mayoría de las empresas de anotaciones nacionales todavía utilizan la "revisión manual" para revisar la calidad de las anotaciones de datos. Solo unos pocos gigantes como Baidu han introducido herramientas de gestión y evaluación más avanzadas, como la plataforma de servicios de datos inteligentes EasyData.Si no existen herramientas especializadas para monitorear y analizar los resultados de las anotaciones y los indicadores en el aspecto de revisión de datos clave, entonces el control de la calidad de los datos aún se reducirá a un nivel similar al de un taller que depende de la visión de un "maestro".![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-f461c4ee34-dd1a6f-6d2ef1) Por lo tanto, cada vez más empresas nacionales, como Baidu y My Neighbor Totoro Data, están comenzando a utilizar tecnologías de aprendizaje automático e inteligencia artificial para mejorar la eficiencia y la calidad de la anotación de datos e implementar modelos de colaboración hombre-máquina.Se puede ver que la aparición del etiquetado con IA no es el fin de las empresas de etiquetado nacionales, sino el fin de un método de etiquetado ineficiente, barato, que requiere mucha mano de obra y que carece de contenido técnico.