Les annotateurs de données, piégés dans les grands modèles

Texte original : 36°

Source de l'image : générée par Unbounded AI

Xiaoyan, qui travaille comme annotateur de données dans une grande société Internet, se sent souvent isolée au sein de l'entreprise.

Le poste de travail de Xiaoyan est à côté de celui des chefs de produit et des programmeurs. Ils peuvent bénéficier des mêmes avantages : le même badge de travail, les mêmes ordinateurs Apple, ils peuvent aller à la salle de sport ou aller dormir dans la capsule spatiale à toute heure.

Mais Xiaoyan peut se rendre compte qu'en tant qu'annotatrice de données, elle et ses autres collègues appartiennent à « deux mondes ».

Bien que nous soyons une équipe, personne n'appellera l'annotateur tous les jours lors de la réunion du matin, donc Xiaoyan ne peut que regarder secrètement devant la porte. Un jour, quelqu'un a apporté un chariot de lampes de bureau, qui était un prototype du produit d'IA sur lequel l'équipe travaillait. Les programmeurs se sont rassemblés autour, très excités, et l'ont pris dans leurs mains pour jouer avec. Les annotateurs étaient assis à leur poste de travail et vaquaient à leurs occupations sans aucun incident. "Ils ne savent pas que le produit est fabriqué sur la base de données étiquetées."

Lorsque Xiaoyan a rejoint l'entreprise, celle-ci développait un produit éducatif d'IA, qui nécessitait d'étiqueter une grande quantité de données pour entraîner l'IA. L'entreprise a acheté une montagne de cahiers de questions d'étude pour les écoles primaires et secondaires. Le travail de Xiaoyan consistait à prendre des photos de chaque question, puis à dessiner des cases et à noter ces questions sur l'ordinateur.

Travaillant également pour l'IA, les programmeurs sont clairement conscients de la valeur de leur travail et apprécient le plaisir apporté par l'avancement continu des algorithmes, mais peu d'annotateurs estiment que c'est leur propre travail qui crée l'IA.

Les progrès de l’intelligence artificielle sont indissociables de l’annotation des données. Le développement de la conduite autonome ces dernières années a stimulé le marché de l’annotation de données. Selon un rapport de Deloitte, la demande d'étiquetage dans le domaine de la conduite autonome représentera 38 % de toutes les applications d'IA en aval en 2022, et on s'attend à ce que cette proportion atteigne 52 % d'ici 2027.

La montée en puissance des grands modèles cette année a alimenté l'industrie de l'annotation de données. Un grand nombre de commandes basées sur des scénarios de formation de grands modèles se dirigent vers les sociétés d'annotation de données. Il semble que le secteur ennuyeux de l'annotation de données ait une fois de plus retrouvé de la vitalité. .

Certaines entreprises technologiques sont plus avancées et tentent d’utiliser l’IA pour synthétiser automatiquement des données destinées à la formation à l’IA. Les données synthétiques sont basées sur une petite quantité de données réelles, générées à l’infini par l’IA et ne nécessitent pas d’étiquetage, au lieu de s’appuyer sur un étiquetage manuel. Dans le domaine de la conduite autonome, les données synthétiques peuvent couvrir certaines conditions routières extrêmes, comme des piétons qui entrent soudainement sur la route.

Dans leur imagination, les données synthétiques remplaceront à l’avenir l’annotation manuelle. Les entreprises d'étiquetage qui ne disposent pas de technologie et qui dépendent uniquement de la main-d'œuvre seront progressivement éliminées. Une donnée montre que 70 % des données de base utilisées pour l’intelligence artificielle à l’étranger sont des données synthétiques, et cette piste est en cours de vérification.

Ce qui précède n’est pas une bonne nouvelle pour le grand nombre d’annotateurs de données. Cependant, certains annotateurs contactés par 36Kr ne savent toujours pas ce qu’est ChatGPT, et ils ont réagi comme s’ils avaient entendu le terme pour la première fois.

Xiaoyan a déclaré que le tagger est une queue qui peut être coupée à tout moment. Le seul suspense est quand le couteau tombera complètement.

Les annotateurs qui entraînent des machines se sentent davantage comme des machines

Xiaohe s'est spécialisé en anglais et a effectué un stage dans une grande usine au cours de sa dernière année. Lors de son premier jour de travail, le bureau se trouvait dans un immeuble de bureaux, spacieux et propre, tout à fait conforme à son imagination de société Internet. Il ne lui a pas fallu longtemps pour se rendre compte que le contenu du poste dont elle avait entendu parler lors de l'entretien - "organiser et classer les données vocales de l'entreprise" - était en réalité une annotation de données.

Plus tard, Xiaohe a admis que si elle avait su que c'était le début de son travail pour AI, elle serait partie immédiatement.

Le groupe compte 6 stagiaires, tous étudiants du département de langues étrangères d'une université prestigieuse. Une femme chef d’équipe attribue des tâches chaque jour. Parfois, il s'agit d'un tas de symboles phonétiques anglais, et la tâche de Xiaohe est de distinguer la prononciation britannique de la prononciation américaine ; parfois, c'est un fichier Excel, cliquez dessus et vous verrez des données partout. Si vous faites défiler vers le bas, il y a plus de 10 000 éléments. .

"C'est comme escalader une montagne", a déclaré Xiaohe.

Le « projet » que j’ai le plus réalisé est l’annotation orale pour des collégiens. Les annotateurs ont l'habitude de parler du travail comme de projets, un projet après l'autre. Xiaohe écoute chaque jour 200 enregistrements avec des accents forts, chacun d'une durée de deux minutes. Si vous entendez une question générale, notez 1 ; si vous entendez une question spéciale, notez 2 ; si vous n’entendez ni l’une ni l’autre, notez 0. Afin d'éviter les fuites, il ne pouvait utiliser que des écouteurs filaires au bureau. Les oreilles de Xiaohe étaient douloureuses et il se sentait « involontairement irritable ».

Elle entend souvent des injures utilisées dans les enregistrements. Certains enfants ne prononcent pas quelques mots avant de commencer à jurer. Une autre fois, lors d'un projet de navigation cartographique, quelqu'un n'a pas pu s'empêcher de jurer dans l'enregistrement. "Je ne sais pas pourquoi quelqu'un serait si en colère."

Xiaohe a dit que vous ne pouvez pas le prendre trop au sérieux. Vous pouvez seulement marquer cet enregistrement comme « dénué de sens », puis tourner la page et continuer à écouter le suivant.

**"Comme une machine", presque tous les annotateurs se décriraient ainsi. **L'annotation est une évidence. Un annotateur du Shandong a déclaré que le projet le plus difficile qu'il ait jamais réalisé est l'annotation d'empreintes digitales. Elle a reçu un tas d'empreintes digitales de quelqu'un qu'elle ne connaissait pas (certaines d'entre elles étaient encore floues), et elle a dû tirer le cadre le long des bords des empreintes petit à petit. "Une fois rentré à la maison ce jour-là, je pouvais voir des empreintes digitales partout sur mes yeux lorsque je fermais les yeux."

De nombreux projets exigent que les annotateurs maintiennent une stricte confidentialité, mais les annotateurs ne se soucient pas de l'objectif du projet. Pendant le travail, les tagueurs doivent remettre leurs téléphones portables et les placer dans un sac suspendu au mur. Ils ne pourront récupérer leur téléphone que s’ils reçoivent un appel.

La plupart des annotateurs ont vécu le processus allant de l'inconnu à la compétence, de la nouveauté à l'ennui. La première étape du projet a été la plus intéressante : à cette époque, les règles d'étiquetage n'étaient pas encore achevées, ils rencontraient souvent des sujets controversés et discutaient, voire se disputaient, et l'ambiance était animée. Aux stades intermédiaire et avancé, les règles sont presque finalisées, il ne reste plus que du travail répétitif et mécanique, et les gens tomberont dans un sentiment d'absurdité.

**Un annotateur a déclaré qu'il s'agissait d'un « travail insensé ». **

À Fuzhou, Jiangxi, les élèves d'une école professionnelle locale annotent des données ; Source : photo IC

Jia Wenjuan, professeur à l'Université de Shanghai, a mené des recherches sur le terrain sur l'annotation des données. Elle estime que l'annotation des données n'est pas un travail mental ou physique, mais un travail cognitif. « Ce que les gens vendent, c'est leur propre cognition ». L’humour noir, c’est que nous voulons que les machines ressemblent davantage à des humains, mais en même temps, nous faisons en sorte que les humains ressemblent davantage à des machines. En d’autres termes, mettez de côté le bon sens et pensez comme un robot. **

Et une fois que l’annotateur commence à se demander « Pourquoi devrais-je faire ça », cela signifie qu’il n’est pas loin de démissionner.

Zheng Wei est le patron d'une société d'annotation de données et a déclaré sans ambages qu'il ne pouvait pas retenir les gens. Au mieux, l’entreprise compte moins de 20 personnes. Les nouveaux employés ne restent souvent qu'un demi-mois : de nombreuses personnes arrivent au travail le premier jour et repartent le lendemain. Il n'a eu d'autre choix que de continuer à baisser ses exigences de recrutement et a finalement estimé que « ce n'est pas moi qui sélectionne les gens, mais ce sont d'autres qui me sélectionnent ».

Il ne savait pas comment retenir ceux qui partaient. "Ce sera de mieux en mieux si vous restez ici. En fait, je n'y crois pas moi-même", a déclaré le commissaire Zheng à 36 Krypton. L'attrition des employés a finalement submergé l'entreprise et, lorsqu'il ne restait plus que deux annotateurs, il a décidé de dissoudre l'équipe. Peu de temps après, ChatGPT a déclenché une nouvelle vague d'IA.

La montée en puissance des grands modèles est bonne pour l'annotation des données, mais elle intensifie également l'involution de l'équipe ** d'annotation. **

En ce qui concerne l'acceptation d'emplois, Xiaodai a déclaré que 80 à 90 % des projets de marquage sur le marché ont désormais des prix unitaires très bas, « parce qu'il y a trop de sous-traitants au milieu » et « tous veulent faire un profit sur le prix ». différence et je ne veux pas réellement faire le travail. » Il a travaillé comme annotateur sur une plateforme de crowdsourcing pendant deux ans et a lancé sa propre entreprise cette année pour former sa propre équipe d'annotation.

L'annotation des données n'est pas très rentable. En prenant comme exemple le dessin du cadre 2D de la conduite autonome, le prix d'expédition des commandes d'une grande entreprise est de 10 centimes et l'équipe d'étiquetage qui prend en charge le travail coûte 8 centimes chacune. "Maintenant, il ne reste plus que 5 ou 6 points", a déclaré Xiaodai. Il calculait un compte, et s'il était inférieur à 8 points, il ne pouvait que perdre de l'argent.

Afin de survivre, Xiao Dai passe la plupart de son temps à chercher des projets et à traîner sur diverses plateformes et bars de poste. Les projets sont authentiques et faux, et la plupart d'entre eux ne sont pas fiables. L'agent a subi des pertes. Il y a un projet pour lequel l'argent n'est pas arrivé après 8 mois d'attente.

Plus tard, il a d'abord travaillé comme annotateur à temps partiel, et seulement après qu'il n'y ait eu aucun problème avec les offres d'essai et le règlement, il a laissé l'équipe prendre le relais. Une fois, j'ai entendu dire que la plateforme publierait un lot de projets à 15 heures du milieu de la nuit, alors il a réglé une alarme à l'avance pour récupérer les commandes.

**La perte de personnel, la faiblesse des prix unitaires et l'instabilité du recouvrement des paiements sont comme des tumeurs qui entraînent la plupart des petites entreprises de ce secteur vers le bas. **

Il n'y a pas d'annotateur qui ne méprise pas ce travail : ils ne peuvent pas gagner d'argent, ils ne voient pas d'espace de promotion et d'opportunités de développement, et ils tombent dans une longue période de dépression et de perte.

Lors de la rédaction de cet article, la plupart des annotateurs contactés par 36Kr ont démissionné. Une jeune fille a déclaré qu'elle travaillait depuis deux mois et que son salaire était inférieur à 3 000 yuans.

Annotateurs internes : Taux de baccalauréat 100%

Dans le passé, le seuil d’annotation des données était faible. Dans le Shandong, le Shanxi, le Henan, le Guizhou et ailleurs, de nombreuses sociétés d'annotation de données ont recruté un grand nombre de main-d'œuvre bon marché. Les plus courants sont les mères, les personnes handicapées et les étudiants des écoles professionnelles. Tant qu'ils maîtrisent les opérations de base de l'ordinateur, ils peuvent entrer dans cette industrie.

À l’ère des grands modèles, un brassage et une élimination des annotations de données s’opèrent tranquillement parmi les candidats.

Les chercheurs ont découvert que la qualité des données d’entraînement a un impact très important sur les performances du modèle. Par rapport à la quantité de données, avec une qualité de données supérieure, l'effet d'amélioration du modèle est plus évident. Afin de contrôler la qualité des données, certaines entreprises d'IA ont constitué leurs propres équipes d'étiquetage. La première étape consiste à relever le seuil d'entrée dans l'industrie.

Le plus évident est que les qualifications académiques des annotateurs commencent à s’accumuler.

En avril de cette année, l'un des principaux fabricants de modèles à grande échelle a établi une base d'annotation de données et le premier groupe d'annotateurs recrutés ** avait un taux de baccalauréat de 100 %. **Le responsable de l'entreprise a expliqué que les données de grands modèles impliquent un large éventail de connaissances et des critères d'évaluation complexes, qui mettent grandement à l'épreuve la compréhension du langage et les capacités de raisonnement logique de l'annotateur.

Xiao Wang venait tout juste d'obtenir son diplôme universitaire et lorsqu'il est retourné dans sa ville natale pour chercher un emploi, il est tombé par hasard sur le recrutement de cette base d'étiquetage de données. Il a donc participé à l’entretien et l’a réussi. La base lui a envoyé un matériel de formation de 300 000 mots. Ce n'est qu'en réussissant l'examen de formation qu'il pourra officiellement prendre le poste.

Les annotateurs travaillent quotidiennement sur des questions. Les nouveaux arrivants se voient poser 40 questions par jour, tandis que les travailleurs expérimentés se voient poser 70 à 80 questions. Le système backend distribue des questions à tout le monde, dont la plupart sont des enregistrements de conversations entre de vrais utilisateurs et de grands modèles. Les questions des utilisateurs viennent du monde entier et sont encore plus bizarres : lequel de ces trois téléphones portables est le meilleur ? Quels œufs sont meilleurs, ou gashapon ? Quels sont les critères pour réussir ? Pourquoi Lin Daiyu a-t-il combattu le Bone Demon ?

Un grand modèle aura de nombreuses réponses, et le travail de Xiao Wang consiste à lire chaque réponse, à repérer les erreurs et à les noter une par une en fonction de la qualité. 5 points est un score parfait, 1 point est le plus bas et les réponses sont inférieures à 3 points. doivent être divisés en types d’erreurs. Si la réponse n'est pas celle demandée, la note la plus basse sera attribuée directement. Si une question sensible est rencontrée, aucune note ne sera attribuée et elle sera jugée « autre ».

Tri, notation et évaluation, ces étapes d'annotation un peu compliquées sont exactement ce qu'on appelle RLHF (Reinforcement Learning from Human Feedback). Le but est d'aligner continuellement les grands modèles avec les valeurs et les modes de pensée humains. OpenAI a utilisé RLHF dans le processus de formation de ChatGPT et a obtenu des résultats remarquables.

Par rapport à l’étiquetage des données antérieur, les règles d’étiquetage des grands modèles sont plus subjectives. Lorsqu'un ingénieur en algorithmie interroge un annotateur, il posera à l'autre personne cette question : « Si vous étiez un chef d'entreprise et confronté à quatre types d'employés : Sun Wukong, Zhu Bajie, Tang Monk et Sha Seng, qui préféreriez-vous ? embaucher?"

Il n’y a pas de réponse standard, a-t-il déclaré. **Ce type de question vise à tester si l'annotateur a une capacité de réflexion logique. **

La demande de talents de l'industrie est devenue urgente. Une start-up appelée Kaiwang Data coopère avec des universités pour former un grand nombre d’annotateurs étudiants universitaires. Le PDG Yu Xu a déclaré que la société avait construit la « Kaywang Data Academy » l'année dernière et avait formé plus de 1 500 étudiants dans 50 écoles à l'annotation de données.

Lorsque Xiao Wang note les réponses du grand modèle, il a souvent besoin de vérifier les faits, et la charge de travail dépend entièrement de la chance. Un jour, je me suis posé une question : laquelle est la meilleure, la BMW Série 3 ou la Mercedes-Benz Série C ? Le grand modèle répertorie respectivement 40 paramètres des deux voitures, et chaque paramètre doit être vérifié par Xiao Wang. Cette question lui prit une demi-heure.

Après avoir annoté pendant un certain temps, Xiao Wang a constaté que son score dépassait rarement 3 points : « Les réponses de l'IA ne suffisent pas à me faire sentir très satisfait ou exceptionnel. Il s'est souvenu qu'une question était "Si le casque Bluetooth est cassé, dois-je aller chez le dentiste ou chez le fabricant du casque ? " C'était évidemment une question de pêche, mais la réponse de l'IA a fait briller ses yeux. " Elle disait d'aller au dentiste pour réparation, pas à l'hôpital.

Xiao Wang est satisfait de ce travail. Son salaire de base mensuel est de 1 800 yuans, une prime d'assiduité parfaite de 200 yuans et une allocation de logement de 200 yuans. Compte tenu de ses performances, il peut toucher 4 000 yuans par mois. Il a déclaré que les revenus sont considérés comme supérieurs à la moyenne locale. Il a également relevé ses cheveux et tous deux se sont assis à des postes de travail adjacents.

Il y avait environ 20 étudiants qui s'entraînaient en même temps que Xiao Wang. En deux jours, ils étaient presque tous partis et il ne restait plus que deux ou trois personnes.

Mais nous n’avons pas à nous inquiéter pour l’entreprise, il n’y aura jamais de pénurie d’étudiants ici. Un CTO a révélé la vérité à 36Kr : allez jeter un œil à la situation actuelle de l'emploi des étudiants.

Ce que je veux le plus éliminer, ce sont les annotations humaines, pas l'IA

Il faut admettre qu'il existe de nombreux rapports sur l'annotation de données. Le consensus populaire inclut que ce travail est la « chaîne de montage d'Internet », ce qui est difficile à faire pendant longtemps, et que l'annotation manuelle sera éventuellement remplacée par l'IA.

Au cours du mois dernier, nous avons passé beaucoup de temps à communiquer avec des ingénieurs en algorithmes et des sociétés d’IA. Bien que le consensus ci-dessus n’ait pas été renouvelé, on peut vaguement penser que ce qui veut le plus éliminer le travail humain n’est peut-être pas l’IA. Avant que l’IA puisse réellement agir, ceux qui maîtrisent les technologies les plus avancées ont déjà levé leur faux.

Dans le monde de la technologie, l’importance des données ne peut être surestimée. L'ingénieur en algorithme Xiao Duan a déclaré que si une entreprise d'IA ne dispose pas de données étiquetées, quelle que soit la qualité de l'algorithme qu'elle écrit, elles seront en morceaux. Plus les données sont étiquetées, mieux c'est. Récupérer toute la laine des tagueurs est une activité à profit certain.

Parfois, l’algorithme peut terminer en une heure les données que les annotateurs ont mis quatre ou cinq jours à compléter. Xiao Duan travaille pour une grande société Internet. Le département dispose d'un budget suffisant et de plusieurs annotateurs à temps plein. "Nous essayons de ne pas laisser les annotateurs inactifs", a-t-il déclaré. "Les dirigeants liront le rapport hebdomadaire. S'ils estiment qu'il n'y a pas beaucoup de tâches, assignons-leur davantage de tâches".

Un annotateur a déclaré à 36Kr que même si les programmeurs qui travaillent avec lui disent que tout type de travail a de la valeur, ils révèlent néanmoins par inadvertance une trace de mépris. "Bien sûr, ce groupe de personnes eux-mêmes sont orientés vers la technologie", se réconforta l'annotateur.

La technologie progresse beaucoup plus vite que prévu. À l'ère des grands modèles, la qualité des données affectera directement les performances du modèle. ** Comprenant cela, certaines sociétés d'IA ont dit sans hésitation au revoir aux sous-traitants d'annotation de données.

"La qualité des données que nous avons récupérées était si mauvaise qu'elles étaient pratiquement inutiles", a déclaré le directeur technique d'une entreprise d'IA. Leur activité principale concerne les vidéos générées par l'IA et ils ont développé un modèle auto-développé qui peut générer un nombre illimité de vidéos de produits de commerce électronique. Afin de former le modèle, ils ont spécialement recruté 50 étudiants pour annoter les données.

S’il s’agit de domaines professionnels tels que les soins médicaux, la finance et l’informatique, il est également difficile de faire confiance aux étudiants. En plus de construire sa propre base d'étiquetage, une grande société Internet nationale rémunère également des professionnels pour l'étiquetage. Bien que la proportion de professionnels dans le secteur de l’annotation soit encore faible, leur rôle est tout à fait évident. Par exemple, il est très rassurant de laisser la question de la suspension des cotisations sociales à des professionnels connaissant les documents gouvernementaux.

Un secret de Polichinelle est que bien avant que ChatGPT ne devienne populaire, OpenAI a organisé la « notation » de plus d'une douzaine de doctorants. En huit ans, OpenAI a dépensé 1 milliard de dollars rien que pour former le modèle.

En mai de cette année, une société américaine de données a commencé à recruter des professionnels dans des domaines spécifiques. La rémunération de ces annotateurs seniors n'est plus une bonne affaire : par exemple, le salaire horaire pour l'étiquetage des données juridiques est de 45 $ US et le salaire horaire pour la poésie est de 25 $ US.

Pourtant, aux yeux de certaines entreprises d’IA, qu’elles soient cols bleus ou cols blancs, elles souhaitent réaliser des économies. Lors de ses communications avec ces entreprises, 36 Krypton entendait fréquemment un mot : réduire les coûts et augmenter l'efficacité.

La méthode la plus courante consiste à utiliser l’IA pour l’annotation automatisée. Une société de données a déclaré que la proportion d'annotations automatisées a atteint plus de 70 %.

L'ingénieur en algorithmes Xiao Li et ses collègues font des tentatives plus avant-gardistes : ** Tant qu'une petite partie des données réelles est utilisée comme modèle, grâce à la technologie d'IA générative et à une série d'algorithmes, des données d'entraînement de haute qualité peuvent être synthétisé. En d’autres termes, personne n’est nécessaire. **

"Le prix de nos données synthétiques est un peu moins cher que celui de l'annotation manuelle", a déclaré Xiao Li.

Les données synthétiques sont actuellement principalement utilisées dans les domaines de la conduite autonome et de la robotique. Xiao Li a déclaré que lorsque ChatGPT est sorti, il s'est rendu compte que les données annotées pourraient ne pas fonctionner et qu'il faudrait finalement utiliser des données synthétiques. Le fondateur d'OpenAI, Sam Altman, partage également un point de vue similaire : « Les données synthétiques sont le moyen le plus efficace de résoudre la pénurie de données de grands modèles. »

La start-up Light Wheel Intelligence produit principalement des données synthétiques dans les domaines de la conduite autonome et de la robotique. "Le résultat final de l'étiquetage automatisé est l'absence d'étiquetage", a déclaré le PDG Xie Chen. "La plupart des entreprises d'étiquetage ne voient pas cela à long terme."

Xie Chen a mentionné à 36Kr qu'un collègue de l'équipe avait déjà effectué des annotations automatisées chez un OEM et avait conquis l'annotation 4D-BEV, plus complexe. Il s'agit d'un outil d'annotation de pointe qui utilise le temps comme quatrième latitude pour l'annotation dans l'espace 3D afin d'améliorer les performances des systèmes de conduite autonome. Cette année, il a décidé d'abandonner l'annotation automatisée, a pris l'initiative de retrouver Xie Chen et a finalement rejoint Nimbus Intelligence.

Ce collègue est Xiao Li. Il a déclaré que l'émergence de l'IA générative l'avait autrefois rendu très anxieux, mais qu'après avoir vu des données synthétiques, il est redevenu enthousiasmé.

L'un de ses objectifs de travail est de "remplacer (labelliser) les gens de cette industrie", mais il est gêné de dire avec certitude : "Ce sera probablement à court terme, peut-être un ou deux ans".

Enfin, revenons au monde des annotateurs. L’inquiétude provoquée par le développement rapide de la technologie est ici presque invisible. Il n’y a que des désagréments triviaux et répétitifs, et quelques fantasmes naïfs.

L'étudiant Xiao Wang forme toujours de grands mannequins dans sa ville natale. Lors de notre conversation récente, il a déclaré que ce poste était une opportunité d'entrer dans le domaine de l'intelligence artificielle. Le parcours de promotion défini par l'entreprise pour eux va des annotateurs aux inspecteurs qualité, formateurs, superviseurs et enfin chefs de projet. L’objectif de Xiao Wang est de devenir superviseur puis de changer d’emploi pour un poste plus proche de l’IA. De quoi s'agit-il exactement, il ne le sait pas encore.

Comparés à l’ambitieux Xiao Wang, la plupart des annotateurs s’intéressent peu à l’IA. Une jeune fille a expliqué : « Je ne prête pas beaucoup d'attention à la haute technologie. » Elle fait du marquage depuis deux ans et est déjà une employée de haut niveau. Elle a récemment été promue inspectrice de qualité. Pour elle, le travail d’annotation est simple et stable, sans « friction mentale » et elle peut occasionnellement attraper du poisson. En cette année où l’IA a bouleversé le monde de la technologie, sa vie a été aussi calme que l’eau.

L'un des rares changements est l'ajout d'un bot conversationnel aux outils d'annotation fournis par l'entreprise. L’entreprise dit à tout le monde que si vous rencontrez des questions que vous ne comprenez pas lors de l’annotation, demandez simplement au robot directement pour gagner du temps. L'efficacité s'est rapidement améliorée. Elle a déclaré à 36 Krypton qu'avant, elle pouvait fabriquer jusqu'à cinq ou six cents boîtes par jour, mais qu'elle peut désormais en faire plus de sept cents.

"Grâce au robot", dit-elle. Personne ne lui a encore dit que cela s'appelait ChatGPT.

(À la demande de la personne interrogée, certains des personnages de l’article ont des pseudonymes. L’auteur de 36Kr, Anita Deng, a également contribué à l’article.)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)