Слова Марка Вень Сінь, 4000 юанів на місяць

Джерело: Pinwan

Автор: Оцет

«Скільки інтелекту, стільки й штучного інтелекту».

Жарти приховані за штучним інтелектом, і вони досі актуальні. Дін Янг, який щойно закінчив університет, тимчасово має своє майбутнє на другій половині речення.

Дін Ян вивчав легку хімічну інженерію, коли навчався в університеті. Після закінчення навчання більшість студентів факультету пішли на паперові фабрики в три зміни. Він не хотів йти на фабрику. Після закінчення навчання в червні цього року Дін Янг повернувся в Хайкоу. На початку серпня він пройшов електронну версію банку запитань для навчання. Через два дні він став «початківцем» у маркуванні даних Wenxin Yiyan.

Будівлю китайських купців у районі Сюїн міста Хайкоу називають «базою» представники Вень Сіньї, які займаються етикетуванням даних. Понад двісті людей заходили та виходили з цієї бази, розподілених між трьома поверхами цієї офісної будівлі. Вони повинні були підписати угоду про нерозголошення перед тим, як приступити до роботи, і повинні були сканувати свої обличчя, коли входили в двері. Кожна особа мав комп’ютер Багато комп’ютерів орендував та відправляв бос із Шаньсі, тому що не так багато знайомих орендують це обладнання на місці.

«Купівня цього комп’ютера не коштує 500 юанів. Одного разу я взяв хоста шукати на Xianyu — він коштував 60 юанів. Я можу встановити набагато кращий за 500 юанів».

Дін Ян подав документи на інформатику під час вступних іспитів до коледжу, а пізніше його перевели на легку хімічну інженерію, але це його не цікавило. Натомість він читав багато комп’ютерної та програмної інженерії в коледжі, що змусило його швидко про це дізнатися в кінці минулого року Поява ChatGPT.

У грудні він зареєстрував обліковий запис ChatGPT, і тоді «здатність перевершила мої прогнози», сказав він.

Джерело: Pinwan

Коли я зустрів Дін Яна на робочому місці на базі, на екрані комп’ютера перед ним було запитання: «Який стандарт успішної людини?»

Це може бути справжнє запитання від користувача Wenxin Yiyan, або це може бути тестове запитання, створене з повітря, але воно розміщене перед екраном і потребує позначення.

Маркування непросте.

На одне таке запитання Вень Сінь Іянь дасть п’ять різних відповідей. Розміщувач даних має прочитати їх, а потім знайти всі недоліки в кожній відповіді.

Наприклад, у відповідях є друкарські помилки або неправильне використання логічних слів, таких як «тому що» і «тому», але більшість відповідей не мають відношення до запитання, або існують так звані «ілюзії», які не мають фактичного значення. основу в певному параграфі.

Він оцінить ці п’ять відповідей відповідно до якості відповіді, при цьому повна оцінка становить 5 балів, загалом п’ять рівнів і мінімум 1 бал. Для відповідей із 3 балами та нижче Дін Янг має розділити кожну помилку на різні типи помилок, визначені системою маркування.

Цей складний процес виправлення помилок полягає в навчанні та створенні відповідної моделі винагороди RM (модель винагороди, яка також називається моделлю переваг), а дії підрахунку балів і сортування додатково узгодять модель з уподобаннями людини.

Це також ключ до успіху ChatGPT.У документі OpenAI описується процес узгодження штучного інтелекту з людськими ідеями під час процесу налаштування інструкцій.

Перед тим, як працювати з мітками даних, потрібен додатковий професійний персонал, щоб перетворити розбіжний корпус на конкретні пари запитання-відповідь, а потім передати їх у велику модель, як приклади питань. Після того, як остання буде оптимізована після великої кількості запитань-відповідей навчання даних, починається Дайте відповіді на запитання.

На цьому етапі маркувальник даних оцінює якість відповідей, згенерованих великою моделлю, з точки зору безпеки, точності та релевантності. Ці оціночні дані далі навчають модель винагороди. Зрештою ця модель винагороди замінить роботу з маркування вручну.

За оцінкою OpenAI у понад 30 мільярдів доларів США стоїть велика кількість кенійських працівників із маркування даних, чия погодинна оплата становить менше 2 доларів США, інакше це не було б перед Ding Yang у грудні минулого року.

Але Дін Янг не знав визначення RM або SFT. Він сказав, що не було такого теоретичного змісту в навчанні до початку, і деякі люди тут навіть не знали, на що Вень Сіньянь він працює. Але це не має значення, головне — це виконувати завдання.

Основна зарплата на цій посаді, а це дев'ять до шостої години ранку і шість вихідних, становить 1800 юанів. Через місяць, якщо ви зможете відзначати в середньому 40 запитань на день, ви отримаєте основну зарплату. Основна заробітна плата розраховується відповідно до коефіцієнта завершеності, і комісія також повинна враховувати правильний тариф. «Ветеран», який тут трохи, має стабільне навантаження 7-80 на день, а проблеми виникають складніше. В середньому ви можете отримувати 4000 юанів на місяць, якщо працювати більше, наприклад, відзначаючи близько 100 питань щодня, ви можете отримувати 7000 юанів на місяць.

Для такого свіжого випускника, як Дін Ян, 4000 юанів вважаються роботою з гідним стартом. Середня місячна зарплата жителів Хайкоу становить лише трохи більше 3000 юанів, і навіть 6 з 10 людей не можуть отримати 3000 юанів на місяць. Знаменитий місцевий порошок Hou'an коштує 11 юанів, а тегери ChatGPT можуть купити миску протягом години. Для порівняння порошок коштує дорого. За його словами, люди в Хайкоу не заробляють багато грошей, але вони готові витрачати на їжу.

Джерело: Pinwan

«Акції – це найважче, або автомобілі», – сказав Дін Ян. Щоб виявити проблему в цій області, може знадобитися 20 хвилин.

«Наприклад, хтось запитає, чи купувати BMW 3-ї серії чи Mercedes-Benz серії C.» У цей час велика модель перелічить понад 80 параметрів двох автомобілів для порівняння користувача, і він повинен слідуйте за ним один за одним.Перевіряйте достовірність кожного параметра.

За півмісяця роботи було відмічено сотні запитань, але він сказав, що, на його враження, отримати 3 – це вже добре, а 4 – рідко.

Він запам’ятав запитання, яке отримало 4 бали, а його назва була «Чому Лін Дайю бився з Кістяним демоном?»

Вень Сінь не послідував за полюсом жодного слова, і зрозумів, що Лін Дайю не був тим, хто побив Кістяного Демона, а потім представив історію Лінь Дайю та Кістяного Демона. З усіх аспектів якості відповідей це майже бездоганно.

Я поставив це запитання Клоду 2, і в ньому було сказано: «Кістяний демон перетворився на Ван Сіфена і багато разів принижував Лінь Дайю, а Лін Дайю був розлючений через убивство Кістяного демона».—— Галюцинація справді досить неприємна.

Джерело: Pinwan

На початку 2020 року «тренер зі штучного інтелекту» офіційно став професією та був включений до національного довідника класифікації професій. Через два роки хвиля великих моделей раптово відкрила ще більшу діру в цьому довіднику.

Спостерігати, як штучний інтелект забирає у людей старі робочі місця, а потім сподіватися, що він створить нові. Подібно до того, як карету замінив автомобіль, нова індустрія дасть візнику загальну метафору нового світу праці для збагачення. Багато інвесторів, які шукають цілі з грошима, погоджуються на це твердження, а деякі люди не Не купуйте. Наприклад, вони заклали основу глибокого навчання. Тепер англієць Джеффрі Хінтон стурбований.

Але найбільш прямим творінням на даний момент є велика модель етикетки даних, як Ding Yang.

До 2022 року межі штучного інтелекту все ще визначаються безпілотними автомобілями, які не можуть самостійно керувати. Існує холодна метафора для етикеток даних:

«Якщо ви думаєте про штучний інтелект як про тварину, робота етикетувальника даних приблизно еквівалентна підготовці корму».

Робота дешева, повторювана — навіть не настільки, щоб бути годувальником.

Традиційний пристрій для наклейки даних, щоденна робота полягає лише в тому, щоб уважно спостерігати за кожним отриманим зображенням, обводити контур автомобіля чи собаки, позначати його, перетягувати в різні папки; або використовувати точкову матрицю Інструмент позначає перешкоди в кожному кадрі відео водіння, залишаючи повну «зону для водіння».

Така дія може виконуватися 2000 разів на день.

Штучний інтелект може вивчати лише позначені дані. Постачальник даних автономного водіння одного разу заявив, що ступінь автоматизації маркування даних все ще становить лише 5% з моменту розробки маркування даних, а інші 95% роботи з маркування все ще виконуються вручну.

Після появи великої моделі сам тип маркування даних почав змінюватися. Не просто малювання прямокутників, малювання точок або ліній на екрані, основною роботою ярлика даних великої моделі стає оцінка, сортування та підрахунок балів створеного вмісту. Якщо це передбачає кілька раундів генерації діалогу або мультимодального вмісту, складність Ще одне різке підвищення.

Якщо сказати, що анотація моделі в епоху традиційного резюме та НЛП має тенденцію діяти відповідно до об’єктивних правил, правила анотації великих моделей є більш суб’єктивними, і це також перевіряє якість анотаційного персоналу. Через це великі команди маркування моделей Baidu в Хайкоу та Шаньсі складаються зі студентів або вище.

Звичайні етикетувальники на базі Хайкоу мають можливість підвищитися до інспекторів якості, а потім вони можуть стати інструкторами, потім супервайзерами і, нарешті, менеджерами проектів. Це канал, який був створений протягом кількох місяців. Агент, який робив анотації даних для Wenxin Yiyan у Хайкоу, сказав, що після випробувального терміну можна підвищити, якщо є внутрішні посади, але немає графіка.

Це нова галузь, яка стрімко формується. «Кожна ланка — новачок», — сказав Дін Ян.

Після того, як інспектор з якості завершить перший огляд, він передасть банк запитань на другий огляд. Друга перевірка була проведена компанією Baidu всередині компанії, а навчальні дані були поза контролем команди маркування Ding Yang.

Дін Янг, який працює на Wen Xinyiyan, і понад 200 людей у всій базі не є співробітниками Baidu.

Етикетувальники на базі Хайкоу належать чотирьом різним агентствам. Їхні трудові договори підписуються з цими сторонніми компаніями з маркування даних. Це практика цієї посади. Довга історія штучного інтелекту Baidu від пошуку до автономного водіння до великомасштабних моделей пов’язана з понад 600 агентами по всій країні та 200 000 розміщувачів даних у понад 300 містах.

Baidu припускає, що розмір штатної великомасштабної команди моделей наближається до 10 000. Цей план буде виконано як нова «база» в більш ніж десяти містах по всій країні в майбутньому.

Ху Чі, менеджер із продуктів Baidu Intelligent Cloud Data Annotation Base, вважає, що анотатори великих моделей даних будуть довгостроковою кар’єрою. З поглибленням можливостей великих моделей у різних сценаріях з’являться нові проблеми, що також означає, що з’являться нові вимоги до маркування.Людям завжди буде потрібно таке ретельне узгодження.

Дін Ян сказав, що піде звідси.

Одночасно з ним прийшло понад 20 початківців, які прийшли на ярлики даних, і більшість із них незабаром пішли — більшість із них пішли добровільно. Нудний зміст роботи, спосіб заробляння грошей відрядною оплатою праці та споживання людей, неважко уявити, що це буде високоплинна посада. І скільки б люди не аплодували, незахищеність від того, що нас замінять машини, є, і це всім подобається бачити.

Дін Янг бачить у цьому можливість розвиватися разом із галуззю. «Спробуй і подивись, чи зможеш ти бути супервайзером», — сказав він, перш ніж знайти посаду, ближчу до хвилі ШІ.

(Дінь Янг - це псевдонім у тексті)

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити