Згортання великої моделі штучного інтелекту: дані вказують на те, що місячний дохід «трудових мігрантів» становить не більше 5000, а ціна за одиницю падає з 5 центів до 4 центів
Чжен Вень досі пам'ятає той день кілька місяців тому, коли вона заробляла 20 центів на годину. Вона закінчила молодший коледж у Хунані та є анотатором великих моделей даних. Її щоденна робота нескладна – додавати мітки до необроблених даних (таких як зображення, відео, тексти тощо), які вона отримує.
Але великі моделі пред'являють дуже високі вимоги до якості даних.Того дня знімок переглядався вісім разів перед тим, як його затвердили.Весь процес перегляду зайняв годину. Іншими словами, вона заробляла лише 2 центи на годину, тоді як за звичайних обставин вона могла б заробити 12 юанів і тягнути 600 ящиків. «Гроші не легко заробити», — неодноразово наголошувала вона.
Це консенсус майже всіх практиків анотації даних. Один кінець анотації даних містить місячну зарплату практикуючих, яка становить менше 5000 юанів.Вони будують наріжний камінь великої моделі, як армія мурах. З іншого боку – мрія великих інтернет-компаній про AI, який вони сподіваються перевершити Chat GPT 4.
Анотація даних використовує найпримітивнішу відрядну систему розрахунку заробітної плати, а інтриги на робочому місці немає. Єдина біда в тому, що ця нудна робота заважає більшості з них витримати три місяці. І майже всі сказали Planet Tech, що вам краще не йти.
Але вони не знають, що більшість із них незабаром можуть втратити нудну роботу. Оскільки ці прості анотації даних буде замінено ШІ.
З 5 центів до 4 центів ціна впала
У 2017 році Лінь Шуан заробив багато «швидких грошей»: понад 6000 юанів за 15 днів. Для Лінь Шуан, який закінчив молодший коледж, цей дохід справді значний. У той час очікування людей від штучного інтелекту зашкалювали, майже ніхто не сумнівався в його майбутньому, усі інвестиційні інститути твердо вірили, що тут можуть народжуватися компанії масштабом у мільярди, десятки мільярдів і навіть сотні мільярдів.
Майже за всіма технологіями штучного інтелекту стоїть конкуренція між алгоритмами, обчислювальною потужністю та обчисленнями. Величезні дані є нижнім рівнем технічної досконалості. Програмісти з яскравим фоном сидять в офісах у «Пекіні, Шанхаї та Гуанчжоу» та малюють креслення штучного інтелекту за допомогою алгоритмів ітерації коду, тоді як студенти коледжу, матері тощо обробляють зображення, текст і голоси у величезних пакетах даних у відділеннях у третьому та міста четвертого рівня.чекай.
ChatGPT не є винятком. Співробітник команди проекту Baidu Wenxinyiyan сказав, що велика модель сама по собі не має ні нових технологій, ні високих технічних бар’єрів.Ключовою проблемою є бар’єр параметрів, утворений бар’єром обчислювальної потужності.
Анотатори даних в епоху великих моделей не особливо відрізняються від тих, що були в минулому.Нечисленні відмінності можуть полягати в більш комфортному офісному середовищі та вищих вимогах до якості анотацій. Практик анотації даних розповів Tech Planet, що коли вони вперше приходять у галузь, вони зазвичай формують команду приблизно з 10 осіб, один з яких відповідає за перевірку якості. Якщо робота не відповідає стандартам, працівника повертають до повторити це. Якість даних визначає якість великих моделей.
Дата-мігрантів не хвилюють нові галузі технології штучного інтелекту, їм більше важлива ціна за одиницю товару, тому що зарплата тут розраховується поштучно.
«У той час, коли ціна за одиницю була високою, 2D-кадр коштував більше 1 цента. На піку я працював більше 10 годин і заробляв більше 600 юанів на день», — згадує Лінь Шуан. Однак це не найвищий показник.Один із анотаторів сказав, що ціна ранніх 2D-рамок могла досягати 50 центів.
Креслення рамки є звичайною операцією в анотації даних. Анотатор позначає об’єкти на зображенні, наприклад транспортні засоби, червоні вуличні ліхтарі, перешкоди тощо, відповідно до вимог. Рамки діляться на 2D і 3D, останні будуть дорожче.
Але ця популярність тривала недовго. Через приплив все більшої кількості людей і загальний розвиток індустрії штучного інтелекту не йде гладко, ціна за одиницю анотації до зображення стає все нижчою. Лінь Шуан сказав, що найнижча ціна зараз лише 4 центи.
«Якщо це висувна рама, середня ціна за одиницю в галузі становить близько 0,15 юаня, але все ще залежить від проекту. Якщо ви можете отримувати замовлення, мінімальна вимога для отримання замовлення з перших рук має становити 100 співробітників. масштаб досить великий, і 3D Рамка може коштувати 30 центів за штуку, але рідко можна отримати її вище 50 центів».
Звичайно, якщо у вас є професійні знання в медичній та фінансовій сферах, ціна за одиницю буде вищою. Наприклад, багато великих медичних моделей вимагають від анотаторів клінічних знань і відповідного досвіду.
Щомісячний дохід більшості практикуючих становить не більше 5000 юанів, і серед них є і кілька щасливчиків. Спочатку Ян Шуо керував магазином одягу в Сичуані, але епідемія вплинула на його бізнес. Цього року він перейшов на анотацію даних про моделі великого розміру. Зараз його дохід становить 8000 юанів на місяць. "Я підписав контракт із компанією та сплачено Комісія за франшизу становить 9500 юанів, а в контракті зазначено, що мінімальний місячний дохід становить 7000 юанів».
Хто заробив гроші
Інтернет-гіганти, такі як Alibaba, Tencent і Byte, а також автомобільні компанії, такі як SAIC і Lynk & Co, є джерелами розповсюдження бізнесу анотації даних. Якщо ви хочете отримувати замовлення безпосередньо від джерела за найкращою ціною, анотація даних Компанії повинні мати певний масштаб.
Співробітник компанії з анотації даних розповів Tech Planet, що вони отримують замовлення безпосередньо від великих виробників, але великі виробники вимагають, щоб у них було 500 людей, тому вони вирішать задовольняти потреби персоналу через франчайзинг або дочірні компанії.
Різниця між ними полягає в тому, що франчайзинг підходить для тих, хто новачок у галузі, щоб створити студію. Якщо ви хочете створити дочірню компанію, зазвичай є лише одна в регіоні. Студія Xiaobai повинна стягувати комісію за франшизу, яка становить 25 000 або 30 000. Дочірня компанія є ексклюзивним агентом у регіоні та має сплатити гонорар у розмірі 50 000. І вони можуть гарантувати достатню кількість замовлень протягом трьох років і нести відповідальність за технічне навчання протягом трьох років.Ці студії або дочірні компанії утворюють велику профспілку, яка становить від кількох сотень до кількох тисяч.
Співробітники вищезгаданої компанії анотації даних розповіли, що популярність великих моделей знову підштовхнула індустрію анотації даних до божевілля, і тепер люди відвідують їхню компанію майже щодня.
Але насправді керувати компанією з маркування даних нелегко. Компанія з анотації даних каже вам, що цю галузь важко зробити в перші 1-2 місяці, оскільки працівникам потрібен період нарощування. На початковому етапі достатньо лише 5-8 людей, і навіть тітки в ній У 40-х не буде проблем.
Стабільність є найважливішим фактором для компанії або студії анотації даних. Однак більшість співробітників анотацій, з якими стикається Tech Planet, часто залишають роботу зі швидкістю світла протягом 3 місяців через нудьгу. Нові співробітники не відразу готові до практичних операцій. Результатом високої плинності кадрів є те, що якість і цикл анотації даних недостатньо стабільні. Для студій анотації даних найпопулярнішими людьми є мами, у яких бракує грошей.
«Безперечно неможливо знайти роботу на неповний робочий день. Будуть прогалини. Якщо ви інвестуєте в оренду та комп’ютери, ви втратите гроші. Найкраще, щоб усі працівники працювали», — Вей Мін, який керував даними анотаційної студії, розповіли Tech Planet.
Більшість даних вказує на те, що цикл погашення компанії починається з 3 місяців і може тривати до півроку, але вони повинні виплачувати зарплату своїм співробітникам щомісяця, що вимагає певного рівня резервного капіталу. "3500 на людину, 100 осіб, 3 місяців становить 1,05 млн».
Колись Чжан Цзянь приєднався до профспілки з понад 200 співробітниками. У перший рік вони наздогнали вибуховий період індустрії, і ціна за одиницю 2D-каркаса сягала 5 центів.Того року його профспілка заробила більше 4 мільйонів.
Але наступного року все пішло гірше. Зазначена ціна за одиницю продукції стала нижчою, співробітники стали більш мобільними, а період розриву збільшився. Крім того, два великі проекти не були врегульовані. Через цілий рік вони втратили більше 3 мільйонів юанів. «Боси сказали, що вони не торкатимуться анотації даних у короткостроковій перспективі, — сказав Чжан Цзянь.
Це маломаржинальний бізнес. Haitian Ruisheng є першою основною компанією в індустрії анотації даних, яка зареєстрована на біржі. Минулого року дохід компанії склав 263 мільйони юанів, прибуток лише 29,45 мільйона юанів, а чистий прибуток трохи більше 10%. Але в першому півріччі цього року компанія стала збитковою через зменшення кількості клієнтів.
"Гвинти", які можна замінити в будь-який час
Спираючись на накопичення мурашок, що рухаються в Кенії, OpenAI нарешті виділявся своєю широкомасштабною моделлю мовного діалогу. Ці звичайні люди, яких називають працівниками обробки даних, підтримують AI-мрію Сема Альтмана (засновника OpenAI), але якщо нічого не станеться, більшу частину їхньої роботи незабаром замінять нові продукти, у створенні яких вони брали участь. замінено.
За кордоном компанія Anthropic, заснована в 2021 році колишніми співробітниками Open AI, цього року залучила 5,15 мільярда доларів США, що більш ніж у сім разів перевищує загальний обсяг фінансування за останні два роки. Компанія пропонує новий спосіб навчання моделей з меншою залученням людини.
Цього року компанія AI startup refuel запустила інструмент з відкритим кодом під назвою Autolabel, який може використовувати основні великі моделі на ринку для позначення наборів даних. Результати випробувань компанії показали, що ефективність маркування Autolabel у 100 разів вища, ніж маркування вручну, а вартість становить лише 1/7 вартості праці.
У Китаї компанія під назвою Vision Future також створює масштабні моделі анотацій. В інтерв'ю вони сказали, що деякі проекти були доставлені з використанням GPT, і точність досягла понад 80%, що близько до ручної роботи.
Однак Haitian Ruisheng вважає, що штучний інтелект не досягне повністю автоматизованих анотацій, тому що якщо машина хоче продовжувати розвиватися та наближати її до людського судження та розуміння, їй обов’язково знадобиться людське керівництво.
Майже кожен, хто займався анотацією даних, висловив Tech Planet таку саму точку зору: анотація даних — це робота без обмежень, яка вимагає лише вміння користуватися комп’ютером.
Але насправді, якщо просту анотацію можна завершити за допомогою штучного інтелекту, то участь вручну ускладнить перевірку даних і стандартну роботу, що також означає, що поріг галузі продовжуватиме збільшуватися, особливо ChatGPT, Вень Сіньян Велика мовна модель для класи.
Для порівняння, задовго до того, як ChatGPT став популярним, OpenAI організував більше десятка докторантів, щоб «відзначити». База анотації даних Baidu в Хайкоу має сотні штатних анотаторів даних великих моделей, а кількість анотаторів студентів досягає 100%.
Особливістю цього типу великої мовної моделі є те, що анотатор повинен мати певний запас знань і здатність до логічного аналізу. Відповідно до звіту "Financial Eleven", анотатори повинні визначити тип запитання, а потім оцінити та ранжувати п’ять відповідей відповідно. Діапазон оцінок становить 0-5 балів. Якщо оцінка нижча за 3 бали, необхідно вказати конкретні причини такі, як «Відповідь не така, як було поставлено запитання (0 балів)», «серйозно не по темі (1 бал)», «є логічні проблеми та фактичні помилки, частка невелика і 2 бали дано» тощо.
Ще одна популярна сфера анотації даних – автономне водіння. Відповідно до звіту Deloitte, у 2022 році попит на маркування у сфері автономного водіння становитиме 38% усіх додатків штучного інтелекту, а до 2027 року очікується, що ця частка зросте до 52%. У порівнянні з великими мовними моделями, для моделей у сфері автономного водіння ці прості операції витягування коробки все ще мають відносно вільні академічні вимоги.
Анотатори є наріжним каменем людства від епохи мобільного Інтернету до епохи штучного інтелекту. Більшість практиків, з якими стикалася Tech Planet, не знають ні про зміни, які принесе їм ШІ, ні про внесок, який вони зробили в розвиток ШІ. Вони — це лише нове покоління гвинтів в епоху Інтернету, і їх можна будь-коли замінити.
(Примітка: всі герої в статті є псевдонімами.)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Згортання великої моделі штучного інтелекту: дані вказують на те, що місячний дохід «трудових мігрантів» становить не більше 5000, а ціна за одиницю падає з 5 центів до 4 центів
Джерело: Tech Planet
Чжен Вень досі пам'ятає той день кілька місяців тому, коли вона заробляла 20 центів на годину. Вона закінчила молодший коледж у Хунані та є анотатором великих моделей даних. Її щоденна робота нескладна – додавати мітки до необроблених даних (таких як зображення, відео, тексти тощо), які вона отримує.
Але великі моделі пред'являють дуже високі вимоги до якості даних.Того дня знімок переглядався вісім разів перед тим, як його затвердили.Весь процес перегляду зайняв годину. Іншими словами, вона заробляла лише 2 центи на годину, тоді як за звичайних обставин вона могла б заробити 12 юанів і тягнути 600 ящиків. «Гроші не легко заробити», — неодноразово наголошувала вона.
Це консенсус майже всіх практиків анотації даних. Один кінець анотації даних містить місячну зарплату практикуючих, яка становить менше 5000 юанів.Вони будують наріжний камінь великої моделі, як армія мурах. З іншого боку – мрія великих інтернет-компаній про AI, який вони сподіваються перевершити Chat GPT 4.
Анотація даних використовує найпримітивнішу відрядну систему розрахунку заробітної плати, а інтриги на робочому місці немає. Єдина біда в тому, що ця нудна робота заважає більшості з них витримати три місяці. І майже всі сказали Planet Tech, що вам краще не йти.
Але вони не знають, що більшість із них незабаром можуть втратити нудну роботу. Оскільки ці прості анотації даних буде замінено ШІ.
З 5 центів до 4 центів ціна впала
У 2017 році Лінь Шуан заробив багато «швидких грошей»: понад 6000 юанів за 15 днів. Для Лінь Шуан, який закінчив молодший коледж, цей дохід справді значний. У той час очікування людей від штучного інтелекту зашкалювали, майже ніхто не сумнівався в його майбутньому, усі інвестиційні інститути твердо вірили, що тут можуть народжуватися компанії масштабом у мільярди, десятки мільярдів і навіть сотні мільярдів.
Майже за всіма технологіями штучного інтелекту стоїть конкуренція між алгоритмами, обчислювальною потужністю та обчисленнями. Величезні дані є нижнім рівнем технічної досконалості. Програмісти з яскравим фоном сидять в офісах у «Пекіні, Шанхаї та Гуанчжоу» та малюють креслення штучного інтелекту за допомогою алгоритмів ітерації коду, тоді як студенти коледжу, матері тощо обробляють зображення, текст і голоси у величезних пакетах даних у відділеннях у третьому та міста четвертого рівня.чекай.
ChatGPT не є винятком. Співробітник команди проекту Baidu Wenxinyiyan сказав, що велика модель сама по собі не має ні нових технологій, ні високих технічних бар’єрів.Ключовою проблемою є бар’єр параметрів, утворений бар’єром обчислювальної потужності.
Анотатори даних в епоху великих моделей не особливо відрізняються від тих, що були в минулому.Нечисленні відмінності можуть полягати в більш комфортному офісному середовищі та вищих вимогах до якості анотацій. Практик анотації даних розповів Tech Planet, що коли вони вперше приходять у галузь, вони зазвичай формують команду приблизно з 10 осіб, один з яких відповідає за перевірку якості. Якщо робота не відповідає стандартам, працівника повертають до повторити це. Якість даних визначає якість великих моделей.
Дата-мігрантів не хвилюють нові галузі технології штучного інтелекту, їм більше важлива ціна за одиницю товару, тому що зарплата тут розраховується поштучно.
«У той час, коли ціна за одиницю була високою, 2D-кадр коштував більше 1 цента. На піку я працював більше 10 годин і заробляв більше 600 юанів на день», — згадує Лінь Шуан. Однак це не найвищий показник.Один із анотаторів сказав, що ціна ранніх 2D-рамок могла досягати 50 центів.
Креслення рамки є звичайною операцією в анотації даних. Анотатор позначає об’єкти на зображенні, наприклад транспортні засоби, червоні вуличні ліхтарі, перешкоди тощо, відповідно до вимог. Рамки діляться на 2D і 3D, останні будуть дорожче.
Але ця популярність тривала недовго. Через приплив все більшої кількості людей і загальний розвиток індустрії штучного інтелекту не йде гладко, ціна за одиницю анотації до зображення стає все нижчою. Лінь Шуан сказав, що найнижча ціна зараз лише 4 центи.
«Якщо це висувна рама, середня ціна за одиницю в галузі становить близько 0,15 юаня, але все ще залежить від проекту. Якщо ви можете отримувати замовлення, мінімальна вимога для отримання замовлення з перших рук має становити 100 співробітників. масштаб досить великий, і 3D Рамка може коштувати 30 центів за штуку, але рідко можна отримати її вище 50 центів».
Звичайно, якщо у вас є професійні знання в медичній та фінансовій сферах, ціна за одиницю буде вищою. Наприклад, багато великих медичних моделей вимагають від анотаторів клінічних знань і відповідного досвіду.
Щомісячний дохід більшості практикуючих становить не більше 5000 юанів, і серед них є і кілька щасливчиків. Спочатку Ян Шуо керував магазином одягу в Сичуані, але епідемія вплинула на його бізнес. Цього року він перейшов на анотацію даних про моделі великого розміру. Зараз його дохід становить 8000 юанів на місяць. "Я підписав контракт із компанією та сплачено Комісія за франшизу становить 9500 юанів, а в контракті зазначено, що мінімальний місячний дохід становить 7000 юанів».
Хто заробив гроші
Інтернет-гіганти, такі як Alibaba, Tencent і Byte, а також автомобільні компанії, такі як SAIC і Lynk & Co, є джерелами розповсюдження бізнесу анотації даних. Якщо ви хочете отримувати замовлення безпосередньо від джерела за найкращою ціною, анотація даних Компанії повинні мати певний масштаб.
Співробітник компанії з анотації даних розповів Tech Planet, що вони отримують замовлення безпосередньо від великих виробників, але великі виробники вимагають, щоб у них було 500 людей, тому вони вирішать задовольняти потреби персоналу через франчайзинг або дочірні компанії.
Різниця між ними полягає в тому, що франчайзинг підходить для тих, хто новачок у галузі, щоб створити студію. Якщо ви хочете створити дочірню компанію, зазвичай є лише одна в регіоні. Студія Xiaobai повинна стягувати комісію за франшизу, яка становить 25 000 або 30 000. Дочірня компанія є ексклюзивним агентом у регіоні та має сплатити гонорар у розмірі 50 000. І вони можуть гарантувати достатню кількість замовлень протягом трьох років і нести відповідальність за технічне навчання протягом трьох років.Ці студії або дочірні компанії утворюють велику профспілку, яка становить від кількох сотень до кількох тисяч.
Співробітники вищезгаданої компанії анотації даних розповіли, що популярність великих моделей знову підштовхнула індустрію анотації даних до божевілля, і тепер люди відвідують їхню компанію майже щодня.
Але насправді керувати компанією з маркування даних нелегко. Компанія з анотації даних каже вам, що цю галузь важко зробити в перші 1-2 місяці, оскільки працівникам потрібен період нарощування. На початковому етапі достатньо лише 5-8 людей, і навіть тітки в ній У 40-х не буде проблем.
Стабільність є найважливішим фактором для компанії або студії анотації даних. Однак більшість співробітників анотацій, з якими стикається Tech Planet, часто залишають роботу зі швидкістю світла протягом 3 місяців через нудьгу. Нові співробітники не відразу готові до практичних операцій. Результатом високої плинності кадрів є те, що якість і цикл анотації даних недостатньо стабільні. Для студій анотації даних найпопулярнішими людьми є мами, у яких бракує грошей.
«Безперечно неможливо знайти роботу на неповний робочий день. Будуть прогалини. Якщо ви інвестуєте в оренду та комп’ютери, ви втратите гроші. Найкраще, щоб усі працівники працювали», — Вей Мін, який керував даними анотаційної студії, розповіли Tech Planet.
Більшість даних вказує на те, що цикл погашення компанії починається з 3 місяців і може тривати до півроку, але вони повинні виплачувати зарплату своїм співробітникам щомісяця, що вимагає певного рівня резервного капіталу. "3500 на людину, 100 осіб, 3 місяців становить 1,05 млн».
Колись Чжан Цзянь приєднався до профспілки з понад 200 співробітниками. У перший рік вони наздогнали вибуховий період індустрії, і ціна за одиницю 2D-каркаса сягала 5 центів.Того року його профспілка заробила більше 4 мільйонів.
Але наступного року все пішло гірше. Зазначена ціна за одиницю продукції стала нижчою, співробітники стали більш мобільними, а період розриву збільшився. Крім того, два великі проекти не були врегульовані. Через цілий рік вони втратили більше 3 мільйонів юанів. «Боси сказали, що вони не торкатимуться анотації даних у короткостроковій перспективі, — сказав Чжан Цзянь.
Це маломаржинальний бізнес. Haitian Ruisheng є першою основною компанією в індустрії анотації даних, яка зареєстрована на біржі. Минулого року дохід компанії склав 263 мільйони юанів, прибуток лише 29,45 мільйона юанів, а чистий прибуток трохи більше 10%. Але в першому півріччі цього року компанія стала збитковою через зменшення кількості клієнтів.
"Гвинти", які можна замінити в будь-який час
Спираючись на накопичення мурашок, що рухаються в Кенії, OpenAI нарешті виділявся своєю широкомасштабною моделлю мовного діалогу. Ці звичайні люди, яких називають працівниками обробки даних, підтримують AI-мрію Сема Альтмана (засновника OpenAI), але якщо нічого не станеться, більшу частину їхньої роботи незабаром замінять нові продукти, у створенні яких вони брали участь. замінено.
За кордоном компанія Anthropic, заснована в 2021 році колишніми співробітниками Open AI, цього року залучила 5,15 мільярда доларів США, що більш ніж у сім разів перевищує загальний обсяг фінансування за останні два роки. Компанія пропонує новий спосіб навчання моделей з меншою залученням людини.
Цього року компанія AI startup refuel запустила інструмент з відкритим кодом під назвою Autolabel, який може використовувати основні великі моделі на ринку для позначення наборів даних. Результати випробувань компанії показали, що ефективність маркування Autolabel у 100 разів вища, ніж маркування вручну, а вартість становить лише 1/7 вартості праці.
У Китаї компанія під назвою Vision Future також створює масштабні моделі анотацій. В інтерв'ю вони сказали, що деякі проекти були доставлені з використанням GPT, і точність досягла понад 80%, що близько до ручної роботи.
Однак Haitian Ruisheng вважає, що штучний інтелект не досягне повністю автоматизованих анотацій, тому що якщо машина хоче продовжувати розвиватися та наближати її до людського судження та розуміння, їй обов’язково знадобиться людське керівництво.
Майже кожен, хто займався анотацією даних, висловив Tech Planet таку саму точку зору: анотація даних — це робота без обмежень, яка вимагає лише вміння користуватися комп’ютером.
Але насправді, якщо просту анотацію можна завершити за допомогою штучного інтелекту, то участь вручну ускладнить перевірку даних і стандартну роботу, що також означає, що поріг галузі продовжуватиме збільшуватися, особливо ChatGPT, Вень Сіньян Велика мовна модель для класи.
Для порівняння, задовго до того, як ChatGPT став популярним, OpenAI організував більше десятка докторантів, щоб «відзначити». База анотації даних Baidu в Хайкоу має сотні штатних анотаторів даних великих моделей, а кількість анотаторів студентів досягає 100%.
Особливістю цього типу великої мовної моделі є те, що анотатор повинен мати певний запас знань і здатність до логічного аналізу. Відповідно до звіту "Financial Eleven", анотатори повинні визначити тип запитання, а потім оцінити та ранжувати п’ять відповідей відповідно. Діапазон оцінок становить 0-5 балів. Якщо оцінка нижча за 3 бали, необхідно вказати конкретні причини такі, як «Відповідь не така, як було поставлено запитання (0 балів)», «серйозно не по темі (1 бал)», «є логічні проблеми та фактичні помилки, частка невелика і 2 бали дано» тощо.
Ще одна популярна сфера анотації даних – автономне водіння. Відповідно до звіту Deloitte, у 2022 році попит на маркування у сфері автономного водіння становитиме 38% усіх додатків штучного інтелекту, а до 2027 року очікується, що ця частка зросте до 52%. У порівнянні з великими мовними моделями, для моделей у сфері автономного водіння ці прості операції витягування коробки все ще мають відносно вільні академічні вимоги.
Анотатори є наріжним каменем людства від епохи мобільного Інтернету до епохи штучного інтелекту. Більшість практиків, з якими стикалася Tech Planet, не знають ні про зміни, які принесе їм ШІ, ні про внесок, який вони зробили в розвиток ШІ. Вони — це лише нове покоління гвинтів в епоху Інтернету, і їх можна будь-коли замінити.
(Примітка: всі герої в статті є псевдонімами.)