شياو يان، الذي يعمل كمعلق بيانات في إحدى شركات الإنترنت الكبرى، غالبًا ما يشعر بالعزلة في الشركة.
تقع محطة عمل Xiaoyan بجوار محطة عمل مديري المنتجات والمبرمجين، حيث يمكنهم الاستمتاع بنفس المزايا: نفس شارة العمل، وأجهزة كمبيوتر Apple، ويمكنهم الذهاب إلى صالة الألعاب الرياضية أو الذهاب إلى الكبسولة الفضائية للنوم في أي وقت.
لكن شياويان يمكنها أن تدرك أنها كمعلقة بيانات، فهي وزملاؤها الآخرون ينتمون إلى "عالمين".
على الرغم من أننا فريق، إلا أنه لن يتصل أحد بالمعلق في الاجتماع الصباحي كل يوم، لذلك لا يمكن لـ Xiaoyan سوى المشاهدة سرًا خارج الباب. ذات مرة، أحضر أحدهم عربة بها مصابيح مكتبية، وهي نموذج أولي لمنتج الذكاء الاصطناعي الذي كان الفريق يعمل عليه، فاجتمع المبرمجون حولها، في غاية الحماس، وأخذوها بين أيديهم ليلعبوا بها. جلس المفسرون في محطات عملهم ومارسوا أعمالهم الخاصة دون وقوع أي حادث. "إنهم لا يعرفون أن المنتج مصنوع بناءً على البيانات المصنفة."
عندما انضم Xiaoyan إلى الشركة، كانت شركة Xiaoyan تعمل على تطوير منتج تعليمي للذكاء الاصطناعي، الأمر الذي يتطلب تصنيف كمية كبيرة من البيانات لتدريب الذكاء الاصطناعي. اشترت الشركة جبلًا من كتب الأسئلة الدراسية للمدارس الابتدائية والثانوية، وكانت مهمة شياو يان هي التقاط صور لكل سؤال، ثم رسم مربعات ووضع علامة على هذه الأسئلة على الكمبيوتر.
كما أن المبرمجين، الذين يعملون أيضًا في مجال الذكاء الاصطناعي، يدركون بوضوح قيمة عملهم ويستمتعون بالمتعة التي يجلبها التقدم المستمر للخوارزميات، لكن القليل من المعلقين يشعرون أن عملهم هو الذي يخلق الذكاء الاصطناعي.
لا يمكن فصل تقدم الذكاء الاصطناعي عن شرح البيانات. أدى تطور القيادة الذاتية في السنوات الأخيرة إلى دفع سوق التعليقات التوضيحية للبيانات. وفقًا لتقرير شركة ديلويت، سيشكل الطلب على العلامات في مجال القيادة الذاتية 38% من جميع تطبيقات الذكاء الاصطناعي النهائية في عام 2022، ومن المتوقع أن ترتفع النسبة إلى 52% بحلول عام 2027.
لقد أدى ظهور النماذج الكبيرة هذا العام إلى إضافة الوقود إلى صناعة التعليقات التوضيحية للبيانات. وهناك عدد كبير من الطلبات المستندة إلى سيناريوهات تدريب النماذج الكبيرة تتجه نحو شركات التعليقات التوضيحية للبيانات. ويبدو أن العمل الممل لتعليق البيانات قد تم حقنه مرة أخرى بالحيوية .
تتقدم بعض شركات التكنولوجيا بشكل أكبر وتحاول استخدام الذكاء الاصطناعي لتجميع البيانات تلقائيًا للتدريب على الذكاء الاصطناعي. تعتمد البيانات الاصطناعية على كمية صغيرة من البيانات الحقيقية، التي يتم إنشاؤها بشكل لا نهائي بواسطة الذكاء الاصطناعي ولا تتطلب تصنيفًا، بدلاً من الاعتماد على التصنيف اليدوي. في مجال القيادة الذاتية، يمكن للبيانات الاصطناعية أن تغطي بعض ظروف الطريق القاسية، مثل اقتحام المشاة الطريق فجأة.
في مخيلتهم، ستحل البيانات الاصطناعية محل التعليقات التوضيحية اليدوية في المستقبل. سيتم القضاء تدريجياً على شركات وضع العلامات التي ليس لديها تكنولوجيا وتعتمد فقط على القوى العاملة. وتشير إحدى البيانات إلى أن 70% من البيانات الأساسية المستخدمة للذكاء الاصطناعي في الخارج هي بيانات تركيبية، ويتم التحقق من هذا المسار.
ما ورد أعلاه ليس خبرًا جيدًا للعدد الهائل من شروح البيانات. ومع ذلك، لا يزال بعض المعلقين الذين اتصلت بهم 36Kr لا يعرفون ما هو ChatGPT، وكان رد فعلهم كما لو أنهم سمعوا هذا المصطلح لأول مرة.
قال Xiaoyan أن العلامة عبارة عن ذيل يمكن قطعه في أي وقت. التشويق الوحيد هو متى ستسقط السكين بالكامل.
يشعر المدونون الذين يدربون الآلات وكأنهم آلات
تخصص Xiaohe في اللغة الإنجليزية وتدرب في مصنع كبير خلال سنته الأخيرة. في يومها الأول في العمل، كان المكتب في مبنى إداري، وكان فسيحًا ونظيفًا، ويتماشى تمامًا مع خيالها حول شركة إنترنت. ولم يستغرق الأمر وقتًا طويلاً حتى أدركت أن محتوى الوظيفة الذي تعلمت عنه أثناء المقابلة - "تنظيم وتصنيف البيانات الصوتية للشركة" - كان في الواقع شرحًا توضيحيًا للبيانات.
لاحقًا، اعترفت Xiaohe بأنها لو علمت أن هذه هي بداية العمل في الذكاء الاصطناعي، لكانت قد غادرت على الفور.
تضم المجموعة 6 متدربين، جميعهم طلاب من قسم اللغات الأجنبية في إحدى الجامعات المرموقة. تقوم قائدة الفريق بتعيين المهام كل يوم. في بعض الأحيان يكون الأمر عبارة عن مجموعة من الرموز الصوتية الإنجليزية، ومهمة Xiaohe هي التمييز بين النطق البريطاني والنطق الأمريكي؛ وفي بعض الأحيان يكون برنامج Excel، انقر عليه، وسترى البيانات في كل مكان. إذا قمت بالتمرير لأسفل، فستجد أكثر من 10000 عنصر .
"يبدو الأمر وكأنه تسلق جبل." قال شياو خه.
"المشروع" الذي قمت به أكثر هو الشرح الشفهي لطلاب المدارس المتوسطة. اعتاد المفسرون على الحديث عن العمل كمشاريع، مشروعًا تلو الآخر. يستمع شياو خه إلى 200 تسجيل بلهجات قوية يوميًا، مدة كل منها دقيقتين. إذا سمعت سؤالاً عامًا، فاحصل على 1، وإذا سمعت سؤالًا خاصًا، فاحصل على 2، وإذا لم تسمع أيًا منهما، فاحصل على 0. من أجل منع التسريبات، لم يتمكن من استخدام سماعات الرأس السلكية إلا في المكتب، وكانت آذان شياو خه تؤلمه وشعر "بالغضب اللاإرادي".
غالبًا ما تسمع كلمات بذيئة مستخدمة في التسجيلات. بعض الأطفال لا يتكلمون بضع كلمات قبل أن يبدأوا بالسب. وفي مرة أخرى أثناء مشروع التنقل على الخريطة، لم يستطع أحد إلا أن يلعن التسجيل. "لا أعرف لماذا قد يكون أي شخص غاضبًا جدًا."
"قال Xiaohe إنه لا يمكنك أن تأخذ الأمر على محمل الجد. يمكنك فقط وضع علامة على هذا التسجيل على أنه "لا معنى له"، ثم اقلب الصفحة واستمر في الاستماع إلى التسجيل التالي.
** "مثل الآلة"، يصف كل معلق تقريبًا نفسه بهذه الطريقة. **التعليق التوضيحي أمر لا يحتاج إلى تفكير. قال أحد المعلقين في شاندونغ إن أصعب مشروع قام به على الإطلاق هو التعليق التوضيحي لبصمات الأصابع. لقد حصلت على مجموعة من بصمات الأصابع من شخص لا تعرفه (بعضها لا يزال غير واضح)، وكان عليها سحب الإطار على طول حواف بصمات الأصابع شيئًا فشيئًا. "بعد أن عدت إلى المنزل في ذلك اليوم، تمكنت من رؤية بصمات الأصابع في جميع أنحاء عيني عندما أغمضت عيني."
تتطلب العديد من المشاريع من المفسرين الحفاظ على السرية التامة، لكن المفسرين لا يهتمون بغرض المشروع. أثناء العمل، يُطلب من أصحاب العلامات تسليم هواتفهم المحمولة ووضعها في حقيبة معلقة على الحائط. ولن يُسمح لهم باستعادة هواتفهم إلا إذا تلقوا مكالمة.
لقد شهد معظم المفسرين العملية من عدم الإلمام إلى الكفاءة، ومن الحداثة إلى الملل. كانت المرحلة الأولى من المشروع هي الأكثر إثارة للاهتمام، ففي ذلك الوقت لم تكن قواعد وضع العلامات قد اكتملت بعد، وغالبًا ما واجهوا مجالات مثيرة للجدل وكانوا يتناقشون أو حتى يتجادلون مع بعضهم البعض، وكان الجو مفعمًا بالحيوية. في المراحل المتوسطة والمتأخرة، يتم الانتهاء تقريبًا من القواعد، ولم يتبق سوى العمل المتكرر والميكانيكي، وسيقع الناس في شعور باللا معنى.
**قال أحد المعلقين إنها كانت "عملاً طائشًا". **
في فوتشو، جيانغشي، يقوم طلاب المدارس المهنية المحلية بشرح البيانات؛ المصدر: صورة IC
أجرت جيا وينجوان، الأستاذة في جامعة شنغهاي، بحثًا ميدانيًا حول شرح البيانات، وهي تعتقد أن شرح البيانات ليس عملاً عقليًا أو جهدًا بدنيًا، بل عملًا معرفيًا، "ما يبيعه الناس هو إدراكهم الخاص". الفكاهة المظلمة هي أننا نريد أن تصبح الآلات أكثر شبهاً بالبشر، ولكن في نفس الوقت نجعل البشر أشبه بالآلات. بمعنى آخر، ضع الفطرة السليمة جانبًا وفكر كالروبوت. **
وبمجرد أن يبدأ المعلق في التفكير "لماذا يجب أن أفعل هذا"، فهذا يعني أنه ليس بعيدًا عن الاستقالة.
تشنغ وي هو رئيس شركة لتعليق البيانات، وقال بصراحة إنه لا يستطيع الاحتفاظ بالأشخاص. وفي أفضل حالاتها، تضم الشركة أقل من 20 شخصًا. غالبًا ما يستمر الموظفون الجدد لمدة نصف شهر فقط، ويأتي الكثير من الأشخاص للعمل في اليوم الأول ويغادرون في اليوم التالي. ولم يكن أمامه خيار سوى الاستمرار في خفض متطلبات التوظيف، وفي النهاية شعر أنني "لا أختار الأشخاص، لكن الآخرين يختارونني".
"لم يكن يعرف كيفية الاحتفاظ بأولئك الذين كانوا يغادرون. قال المفوض تشنغ لـ 36 كريبتون: "سيصبح الأمر أفضل وأفضل إذا بقيت هنا. أنا شخصياً لا أصدق هذا". في نهاية المطاف، طغى استنزاف الموظفين على الشركة، وعندما بقي اثنان فقط من المفسرين، قرر حل الفريق. ولم يمض وقت طويل حتى أطلق ChatGPT موجة جديدة من الذكاء الاصطناعي.
يعد ظهور النماذج الكبيرة مفيدًا لتعليقات البيانات، ولكنه يؤدي أيضًا إلى تكثيف تكامل فريق التعليقات التوضيحية **. **
عندما يتعلق الأمر بقبول الوظائف، قال شياو داي إن 80-90% من المشاريع المميزة في السوق لديها الآن أسعار وحدات منخفضة للغاية، "لأن هناك الكثير من المقاولين من الباطن في الوسط" و"الجميع يريدون تحقيق ربح من السعر". الفرق، ولا تريد القيام بالعمل فعليًا." . لقد عمل كمعلق على منصة التعهيد الجماعي لمدة عامين وبدأ عمله الخاص هذا العام لتشكيل فريق التعليقات التوضيحية الخاص به.
شرح البيانات ليس مربحًا جدًا. بأخذ رسم الإطار ثنائي الأبعاد للقيادة الذاتية كمثال، يبلغ سعر إرسال الطلب لشركة كبيرة 10 سنتات، ويكلف فريق وضع العلامات الذي يتولى المهمة 8 سنتات لكل منهما. وقال شياو داي: "لقد انخفض الآن إلى 5 أو 6 نقاط". قام بحساب حساب، وإذا كان أقل من 8 نقاط، فيمكنه خسارة المال فقط.
من أجل البقاء، يقضي شياو داي معظم وقته في البحث عن المشاريع والتسكع على منصات مختلفة وحانات البريد. المشاريع حقيقية ومزيفة وأغلبها غير موثوقة والوكيل تعرض للخسائر وهناك مشروع لم تصل الأموال بعد 8 أشهر من الانتظار.
لاحقًا، عمل في البداية كمعلق بدوام جزئي، وفقط بعد عدم وجود مشكلة في تقديم العطاءات التجريبية والتسوية، سمح للفريق بتولي المهمة. سمعت ذات مرة أن المنصة ستطلق مجموعة من المشاريع في الساعة الثالثة منتصف الليل، لذلك قام بضبط المنبه مسبقًا للحصول على الطلبات.
**إن فقدان الموظفين، وانخفاض أسعار الوحدات، وتحصيل المدفوعات غير المستقرة يشبه الأورام، مما يؤدي إلى تراجع معظم الشركات الصغيرة في هذه الصناعة. **
ليس هناك كاتب لا يحتقر هذه الوظيفة، فلا يستطيعون كسب المال، ولا يرون مساحة للترقي وفرص التطوير، فيقعون في فترة طويلة من الاكتئاب والخسارة.
أثناء كتابة هذا المقال، استقال معظم المعلقين الذين اتصلت بهم 36Kr. قالت إحدى الفتيات إنها كانت تعمل لمدة شهرين وكان راتبها أقل من 3000 يوان.
المفسرون الداخليون: معدل درجة البكالوريوس 100%
في الماضي، كانت عتبة شرح البيانات منخفضة. في شاندونغ وشانشي وخنان وقويتشو وأماكن أخرى، قامت العديد من شركات شرح البيانات بتوظيف عدد كبير من العمالة الرخيصة. وتشمل أكثر هذه الصناعات شيوعا الأمهات، والمعوقين، وطلاب المدارس المهنية. وطالما أنهم يتقنون العمليات الأساسية لأجهزة الكمبيوتر، فيمكنهم دخول هذه الصناعة.
في عصر النماذج الكبيرة، يحدث خلط وحذف التعليقات التوضيحية للبيانات بهدوء بين المرشحين.
وجد الباحثون أن جودة بيانات التدريب لها تأثير كبير جدًا على أداء النموذج. بالمقارنة مع كمية البيانات، مع جودة البيانات الأعلى، يكون تأثير تحسين النموذج أكثر وضوحًا. ومن أجل التحكم في جودة البيانات، شكلت بعض شركات الذكاء الاصطناعي فرق وضع العلامات الخاصة بها، والخطوة الأولى هي رفع عتبة الدخول إلى الصناعة.
الأمر الأكثر وضوحًا هو أن المؤهلات الأكاديمية للمعلقين بدأت في الظهور.
في أبريل من هذا العام، أنشأت إحدى الشركات الرائدة في مجال تصنيع النماذج واسعة النطاق قاعدة لتعليقات توضيحية للبيانات، وتم تعيين الدفعة الأولى من المعلقين ** وحصلت على معدل درجة البكالوريوس بنسبة 100٪. **أوضح الشخص المسؤول عن الشركة أن البيانات النموذجية الكبيرة تتضمن نطاقًا واسعًا من المعرفة ومعايير التقييم المعقدة، والتي تختبر بشكل كبير فهم لغة المدون وقدراته على التفكير المنطقي.
كان شياو وانغ قد تخرج للتو من الكلية، وعندما عاد إلى مسقط رأسه للبحث عن وظيفة، صادف بالصدفة توظيف قاعدة تصنيف البيانات هذه. فشارك في المقابلة واجتازها بنجاح. أرسلت له القاعدة مادة تدريبية مكونة من 300000 كلمة. فقط من خلال اجتياز اختبار التدريب يمكنه تولي المنصب رسميًا.
يعمل المدونون على الأسئلة كل يوم. يُطرح على الوافدين الجدد 40 سؤالاً يوميًا، بينما يُطرح على العمال ذوي الخبرة 70-80 سؤالًا. يقوم النظام الخلفي بتوزيع الأسئلة على الجميع، ومعظمها عبارة عن سجلات محادثة بين مستخدمين حقيقيين ونماذج كبيرة. وتتراوح أسئلة المستخدمين من جميع أنحاء العالم وهي أكثر غرابة: أي من هذه الهواتف المحمولة الثلاثة أفضل؟ أي البيض أفضل أم غاشابون؟ ما هي معايير الأشخاص الناجحين؟ لماذا حارب لين دايو شيطان العظام؟
سيكون للنموذج الكبير العديد من الإجابات، ومهمة شياو وانغ هي قراءة كل إجابة واختيار الأخطاء وتسجيلها واحدة تلو الأخرى وفقًا للجودة، 5 نقاط هي الدرجة المثالية، ونقطة واحدة هي الأدنى، والإجابات أقل من 3 نقاط يجب تقسيمها إلى أنواع الخطأ. إذا لم تكن الإجابة هي ما تم طرحه، فسيتم منح أدنى درجة مباشرة، وإذا تمت مواجهة سؤال حساس، فلن يتم منح أي درجة وسيتم الحكم عليه على أنه "آخر".
الفرز والتسجيل والتقييم، هذه الخطوات التوضيحية المعقدة قليلاً هي بالضبط ما يسمى RLHF (التعلم المعزز من ردود الفعل البشرية، أي التعلم المعزز من ردود الفعل البشرية). والغرض من ذلك هو مواءمة النماذج الكبيرة بشكل مستمر مع القيم والطرق الإنسانية التفكير.أكثر قابلية للاستخدام. استخدمت OpenAI RLHF في عملية تدريب ChatGPT وحققت نتائج ملحوظة.
بالمقارنة مع تصنيف البيانات السابقة، تعد قواعد وضع العلامات للنماذج الكبيرة أكثر ذاتية. عندما يقوم مهندس الخوارزميات بإجراء مقابلة مع أحد المعلقين، فإنه سيطرح على الشخص الآخر هذا السؤال: "إذا كنت قائد أعمال وتواجه أربعة أنواع من الموظفين: سون وو كونغ، وتشو باجي، وتانغ مونك، وشا سينغ، فمن الذي تفضله؟ يؤجر؟"
وقال إنه لا توجد إجابة موحدة. **هذا النوع من الأسئلة هو اختبار ما إذا كان المدون لديه القدرة على التفكير المنطقي. **
أصبح الطلب على المواهب في الصناعة أمرًا ملحًا. تتعاون شركة ناشئة تدعى Kaiwang Data مع الجامعات لتدريب عدد كبير من المشرعين من طلاب الجامعات. وقال الرئيس التنفيذي يو شو إن الشركة قامت ببناء "أكاديمية كايوانغ للبيانات" العام الماضي وقامت بتدريب أكثر من 1500 طالب في 50 مدرسة للمشاركة في شرح البيانات.
عندما يسجل شياو وانغ إجابات النموذج الكبير، فإنه غالبًا ما يحتاج إلى إجراء بعض التحقق من الحقائق، ويعتمد عبء العمل كليًا على الحظ. ذات مرة صادفني سؤال: أيهما أفضل، سلسلة BMW 3 أم سلسلة مرسيدس بنز C؟ يسرد النموذج الكبير 40 معلمة للسيارتين على التوالي، ويحتاج شياو وانغ إلى التحقق من كل معلمة. استغرق هذا السؤال منه نصف ساعة.
"بعد إجراء التعليقات التوضيحية لفترة من الوقت، وجد شياو وانغ أن درجاته نادرًا ما تتجاوز 3 نقاط. "إن استجابات الذكاء الاصطناعي ليست كافية لتجعلني أشعر بالرضا الشديد أو التميز." وتذكر أن أحد الأسئلة كان "إذا كانت سماعة البلوتوث مكسورة، فهل يجب أن أذهب إلى طبيب الأسنان أو الشركة المصنعة لسماعة الرأس؟" كان من الواضح أنه سؤال صيد، لكن إجابة الذكاء الاصطناعي جعلت عينيه تشتعلان. طبيب الأسنان للإصلاح، وليس إلى المستشفى."
شياو وانغ راضٍ عن هذه الوظيفة. ويبلغ راتبه الأساسي الشهري 1800 يوان، ومكافأة الحضور المثالية 200 يوان، وإعانة السكن 200 يوان، ومع الأخذ في الاعتبار الأداء، يمكنه الحصول على 4000 يوان شهريا. وقال إن الدخل يعتبر أعلى من المتوسط في المنطقة المحلية. كما قام برفع شعره، وجلس الاثنان في محطات العمل المجاورة.
كان هناك حوالي 20 طالبًا جامعيًا يتدربون في نفس الوقت الذي يتدرب فيه شياو وانغ، وفي غضون يومين، رحلوا جميعًا تقريبًا، ولم يتبق سوى شخصين أو ثلاثة أشخاص.
لكن لا داعي للقلق بشأن الشركة، فلن يكون هناك أبدًا نقص في طلاب الجامعات هنا. كشف CTO الحقيقة لـ 36Kr: اذهب وألق نظرة على الوضع الوظيفي الحالي لطلاب الجامعات.
أكثر ما أريد التخلص منه هو التعليقات التوضيحية البشرية، وليس الذكاء الاصطناعي
يجب الاعتراف بأن هناك العديد من التقارير حول التعليقات التوضيحية للبيانات، ويتضمن إجماع الناس أن هذه الوظيفة هي "خط تجميع الإنترنت"، وهو أمر يصعب القيام به لفترة طويلة، وسيتم استبدال هذا التعليق التوضيحي اليدوي في النهاية بالذكاء الاصطناعي.
في الشهر الماضي، أمضينا الكثير من الوقت في التواصل مع مهندسي الخوارزميات وشركات الذكاء الاصطناعي. على الرغم من أن الإجماع المذكور أعلاه لم يتم تحديثه، إلا أنه يمكن الشعور بشكل غامض بأن الشيء الذي يريد القضاء على العمالة البشرية قد لا يكون الذكاء الاصطناعي. قبل أن يتمكن الذكاء الاصطناعي من اتخاذ الإجراءات اللازمة، فإن أولئك الذين أتقنوا التكنولوجيا الأكثر تقدمًا قد رفعوا مناجلهم بالفعل.
في عالم التكنولوجيا، لا يمكن المبالغة في أهمية البيانات. قال مهندس الخوارزميات شياو دوان إنه إذا لم يكن لدى شركة الذكاء الاصطناعي بيانات مصنفة، بغض النظر عن مدى جودة الخوارزمية التي يكتبونها، فستكون أجزاء. كلما زادت البيانات المسمى، كلما كان ذلك أفضل. يعد جمع كل صوف العلامات عملاً مربحًا بالتأكيد.
في بعض الأحيان، يمكن للخوارزمية إنهاء البيانات التي استغرق المدونون أربعة أو خمسة أيام لإكمالها في ساعة واحدة. يعمل شياو دوان في إحدى شركات الإنترنت الكبرى، ويتمتع القسم بميزانية كافية ولديه العديد من المفسرين المتفرغين. وقال "إننا نحاول ألا نترك المفسرين خاملين. وسيقرأ القادة التقرير الأسبوعي. وإذا شعروا أنه لا يوجد الكثير من المهام، فلنكلفهم بمزيد من المهام".
قال أحد المعلقين لموقع 36Kr إنه على الرغم من أن المبرمجين الذين يعملون معه يقولون إن كل نوع من العمل له قيمة، إلا أنهم ما زالوا يكشفون عن غير قصد عن أثر من الازدراء. "بالطبع، هذه المجموعة من الأشخاص أنفسهم موجهون نحو التكنولوجيا." لقد طمأن المعلق نفسه.
تتقدم التكنولوجيا بشكل أسرع بكثير مما توقعه الجميع، وفي عصر النماذج الكبيرة، ستؤثر جودة البيانات بشكل مباشر على أداء النموذج. ** من خلال فهم ذلك، قامت بعض شركات الذكاء الاصطناعي بالتخلي عن الاستعانة بمصادر خارجية لتعليق البيانات دون تردد.
قال الرئيس التنفيذي للتكنولوجيا في إحدى شركات الذكاء الاصطناعي: "كانت جودة البيانات التي حصلنا عليها سيئة للغاية لدرجة أنها كانت عديمة الفائدة في الأساس". عملهم الأساسي هو مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، وقد قاموا بتطوير نموذج مطور ذاتيًا يمكنه إنشاء كميات غير محدودة من مقاطع فيديو منتجات التجارة الإلكترونية. ومن أجل تدريب النموذج، قاموا بتجنيد 50 طالبًا جامعيًا خصيصًا للقيام بشرح البيانات.
إذا كان الأمر يتعلق بمجالات مهنية مثل الرعاية الطبية والتمويل وأجهزة الكمبيوتر، فمن الصعب أيضًا الوثوق بطلاب الجامعات. بالإضافة إلى بناء قاعدة التصنيف الخاصة بها، تقوم إحدى شركات الإنترنت المحلية الكبرى أيضًا بدفع أموال للمتخصصين من أجل وضع العلامات. على الرغم من أن نسبة المتخصصين في صناعة التعليقات التوضيحية لا تزال صغيرة، إلا أن دورهم واضح تمامًا. على سبيل المثال، من المطمئن للغاية ترك سؤال حول تعليق مدفوعات الضمان الاجتماعي للمهنيين الذين هم على دراية بالوثائق الحكومية.
السر المكشوف هو أنه قبل وقت طويل من انتشار ChatGPT، قامت OpenAI بتنظيم أكثر من عشرة طلاب دكتوراه "لتقييمهم". وفي غضون ثماني سنوات، أنفقت شركة OpenAI مليار دولار أمريكي فقط لتدريب النموذج.
في شهر مايو من هذا العام، بدأت شركة بيانات أمريكية في توظيف متخصصين في مجالات محددة. ولم تعد تعويضات هؤلاء المفسرين الكبار تشكل صفقة رابحة. على سبيل المثال، يبلغ الأجر بالساعة مقابل تصنيف البيانات القانونية 45 دولاراً أميركياً، والأجر بالساعة للشعر 25 دولاراً أميركياً.
ومع ذلك، في نظر بعض شركات الذكاء الاصطناعي، سواء كانوا عمالًا من ذوي الياقات الزرقاء أو من ذوي الياقات البيضاء، فإنهم يريدون توفير التكاليف. عند التواصل مع هذه الشركات، سمعت 36 كريبتون كلمة واحدة بشكل متكرر: خفض التكاليف وزيادة الكفاءة.
الطريقة الأكثر شيوعًا هي استخدام الذكاء الاصطناعي للتعليقات التوضيحية الآلية. ذكرت إحدى شركات البيانات أن نسبة الشرح الآلي وصلت إلى أكثر من 70%.
يقوم مهندس الخوارزميات شياو لي وزملاؤه بمحاولات أكثر تطورًا: ** طالما تم استخدام جزء صغير من البيانات الحقيقية كنموذج، من خلال تقنية الذكاء الاصطناعي التوليدي وسلسلة من الخوارزميات، يمكن استخدام بيانات التدريب عالية الجودة مجمعة. وبعبارة أخرى، لا حاجة لأحد على الإطلاق. **
وقال شياو لي: "إن سعر بياناتنا الاصطناعية أرخص قليلاً من سعر التعليقات التوضيحية اليدوية".
تُستخدم البيانات الاصطناعية حاليًا بشكل أساسي في مجالات القيادة الذاتية والروبوتات. قال شياو لي إنه عندما ظهر ChatGPT، أدرك أن البيانات المشروحة قد لا تعمل، ويجب استخدام البيانات الاصطناعية في النهاية. لدى مؤسس OpenAI سام ألتمان أيضًا وجهة نظر مماثلة: "البيانات الاصطناعية هي الطريقة الأكثر فعالية لحل النقص في بيانات النماذج الكبيرة".
تنتج شركة Light Wheel Intelligence الناشئة بشكل أساسي بيانات اصطناعية في مجالات القيادة الذاتية والروبوتات. قال الرئيس التنفيذي شيه تشن: "النتيجة النهائية لوضع العلامات الآلي هي عدم وضع العلامات. معظم شركات وضع العلامات لا ترى ذلك على المدى الطويل".
ذكر Xie Chen لـ 36Kr أن أحد زملائه في الفريق قد قام سابقًا بعمل تعليق توضيحي آلي في مصنع تصنيع المعدات الأصلية (OEM) وانتصر على التعليق التوضيحي 4D-BEV الأكثر تعقيدًا. هذه أداة تعليقات توضيحية رائدة في الصناعة تستخدم الوقت كخط عرض رابع للتعليقات التوضيحية في الفضاء ثلاثي الأبعاد لتحسين أداء أنظمة القيادة الذاتية. قرر هذا العام التخلي عن التعليقات التوضيحية الآلية، وأخذ زمام المبادرة للعثور على Xie Chen، وانضم أخيرًا إلى Nimbus Intelligence.
هذا الزميل هو شياو لي. وقال إن ظهور الذكاء الاصطناعي التوليدي جعله قلقًا للغاية ذات مرة، ولكن بعد رؤية البيانات الاصطناعية، أصبح متحمسًا مرة أخرى.
أحد أهداف عمله هو "استبدال (تسمية) الأشخاص في هذه الصناعة"، لكنه يشعر بالحرج من القول بالتأكيد: "من المحتمل أن يكون ذلك على المدى القصير، ربما سنة أو سنتين".
وأخيرا، دعونا نعود إلى عالم الشروح. القلق الناجم عن التطور السريع للتكنولوجيا يكاد يكون غير مرئي هنا. لا يوجد سوى مضايقات تافهة ومتكررة وبعض التخيلات الساذجة.
لا يزال الطالب الجامعي شياو وانغ يدرب عارضات الأزياء الكبيرة في مسقط رأسه. وعندما تحدثنا مؤخرًا، قال إن هذه الوظيفة كانت فرصة لدخول مجال الذكاء الاصطناعي. مسار الترقية الذي حددته الشركة لهم هو من المفسرين إلى مفتشي الجودة والمدربين والمشرفين وأخيرا مديري المشاريع. هدف شياو وانغ هو أن يصبح مشرفًا ثم يغير وظيفته إلى منصب أقرب إلى الذكاء الاصطناعي. ما هو بالضبط، فهو لا يعرف بعد.
بالمقارنة مع شياو وانغ الطموح، فإن معظم المعلقين ليس لديهم اهتمام كبير بالذكاء الاصطناعي. أوضحت إحدى الفتيات: "أنا لا أهتم كثيرًا بالتكنولوجيا المتقدمة. لقد بدأت في وضع العلامات لمدة عامين وهي بالفعل موظفة كبيرة. وقد تمت ترقيتها مؤخرًا إلى مفتشة جودة. بالنسبة لها، يعتبر عمل التعليقات التوضيحية بسيطًا ومستقرًا، دون "أي احتكاك ذهني" ويمكنها أحيانًا صيد الأسماك. في هذا العام، عندما أثار الذكاء الاصطناعي عالم التكنولوجيا، كانت حياتها هادئة مثل الماء.
أحد التغييرات القليلة هو إضافة روبوت المحادثة إلى أدوات التعليقات التوضيحية التي توفرها الشركة. تخبر الشركة الجميع أنه إذا واجهت أي أسئلة لم تفهمها أثناء التعليق التوضيحي، فما عليك سوى طرح السؤال على الروبوت مباشرة لتوفير الوقت. لقد تحسنت الكفاءة بسرعة، وأخبرت موقع 36 كريبتون أنها في السابق كانت تستطيع عمل ما يصل إلى خمس أو ستمائة صندوق في اليوم، لكنها الآن تستطيع عمل أكثر من سبعمائة صندوق.
وقالت: "بفضل الروبوت". لم يخبرها أحد بعد أنه يسمى ChatGPT.
(بناءً على طلب الشخص الذي تمت مقابلته، بعض الشخصيات في المقال لها أسماء مستعارة. كما ساهمت مؤلفة 36Kr أنيتا دينغ في كتابة المقال.)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
معلقو البيانات، محاصرون في نماذج كبيرة
النص الأصلي: 36氪
شياو يان، الذي يعمل كمعلق بيانات في إحدى شركات الإنترنت الكبرى، غالبًا ما يشعر بالعزلة في الشركة.
تقع محطة عمل Xiaoyan بجوار محطة عمل مديري المنتجات والمبرمجين، حيث يمكنهم الاستمتاع بنفس المزايا: نفس شارة العمل، وأجهزة كمبيوتر Apple، ويمكنهم الذهاب إلى صالة الألعاب الرياضية أو الذهاب إلى الكبسولة الفضائية للنوم في أي وقت.
لكن شياويان يمكنها أن تدرك أنها كمعلقة بيانات، فهي وزملاؤها الآخرون ينتمون إلى "عالمين".
على الرغم من أننا فريق، إلا أنه لن يتصل أحد بالمعلق في الاجتماع الصباحي كل يوم، لذلك لا يمكن لـ Xiaoyan سوى المشاهدة سرًا خارج الباب. ذات مرة، أحضر أحدهم عربة بها مصابيح مكتبية، وهي نموذج أولي لمنتج الذكاء الاصطناعي الذي كان الفريق يعمل عليه، فاجتمع المبرمجون حولها، في غاية الحماس، وأخذوها بين أيديهم ليلعبوا بها. جلس المفسرون في محطات عملهم ومارسوا أعمالهم الخاصة دون وقوع أي حادث. "إنهم لا يعرفون أن المنتج مصنوع بناءً على البيانات المصنفة."
عندما انضم Xiaoyan إلى الشركة، كانت شركة Xiaoyan تعمل على تطوير منتج تعليمي للذكاء الاصطناعي، الأمر الذي يتطلب تصنيف كمية كبيرة من البيانات لتدريب الذكاء الاصطناعي. اشترت الشركة جبلًا من كتب الأسئلة الدراسية للمدارس الابتدائية والثانوية، وكانت مهمة شياو يان هي التقاط صور لكل سؤال، ثم رسم مربعات ووضع علامة على هذه الأسئلة على الكمبيوتر.
كما أن المبرمجين، الذين يعملون أيضًا في مجال الذكاء الاصطناعي، يدركون بوضوح قيمة عملهم ويستمتعون بالمتعة التي يجلبها التقدم المستمر للخوارزميات، لكن القليل من المعلقين يشعرون أن عملهم هو الذي يخلق الذكاء الاصطناعي.
لا يمكن فصل تقدم الذكاء الاصطناعي عن شرح البيانات. أدى تطور القيادة الذاتية في السنوات الأخيرة إلى دفع سوق التعليقات التوضيحية للبيانات. وفقًا لتقرير شركة ديلويت، سيشكل الطلب على العلامات في مجال القيادة الذاتية 38% من جميع تطبيقات الذكاء الاصطناعي النهائية في عام 2022، ومن المتوقع أن ترتفع النسبة إلى 52% بحلول عام 2027.
لقد أدى ظهور النماذج الكبيرة هذا العام إلى إضافة الوقود إلى صناعة التعليقات التوضيحية للبيانات. وهناك عدد كبير من الطلبات المستندة إلى سيناريوهات تدريب النماذج الكبيرة تتجه نحو شركات التعليقات التوضيحية للبيانات. ويبدو أن العمل الممل لتعليق البيانات قد تم حقنه مرة أخرى بالحيوية .
تتقدم بعض شركات التكنولوجيا بشكل أكبر وتحاول استخدام الذكاء الاصطناعي لتجميع البيانات تلقائيًا للتدريب على الذكاء الاصطناعي. تعتمد البيانات الاصطناعية على كمية صغيرة من البيانات الحقيقية، التي يتم إنشاؤها بشكل لا نهائي بواسطة الذكاء الاصطناعي ولا تتطلب تصنيفًا، بدلاً من الاعتماد على التصنيف اليدوي. في مجال القيادة الذاتية، يمكن للبيانات الاصطناعية أن تغطي بعض ظروف الطريق القاسية، مثل اقتحام المشاة الطريق فجأة.
في مخيلتهم، ستحل البيانات الاصطناعية محل التعليقات التوضيحية اليدوية في المستقبل. سيتم القضاء تدريجياً على شركات وضع العلامات التي ليس لديها تكنولوجيا وتعتمد فقط على القوى العاملة. وتشير إحدى البيانات إلى أن 70% من البيانات الأساسية المستخدمة للذكاء الاصطناعي في الخارج هي بيانات تركيبية، ويتم التحقق من هذا المسار.
ما ورد أعلاه ليس خبرًا جيدًا للعدد الهائل من شروح البيانات. ومع ذلك، لا يزال بعض المعلقين الذين اتصلت بهم 36Kr لا يعرفون ما هو ChatGPT، وكان رد فعلهم كما لو أنهم سمعوا هذا المصطلح لأول مرة.
قال Xiaoyan أن العلامة عبارة عن ذيل يمكن قطعه في أي وقت. التشويق الوحيد هو متى ستسقط السكين بالكامل.
يشعر المدونون الذين يدربون الآلات وكأنهم آلات
تخصص Xiaohe في اللغة الإنجليزية وتدرب في مصنع كبير خلال سنته الأخيرة. في يومها الأول في العمل، كان المكتب في مبنى إداري، وكان فسيحًا ونظيفًا، ويتماشى تمامًا مع خيالها حول شركة إنترنت. ولم يستغرق الأمر وقتًا طويلاً حتى أدركت أن محتوى الوظيفة الذي تعلمت عنه أثناء المقابلة - "تنظيم وتصنيف البيانات الصوتية للشركة" - كان في الواقع شرحًا توضيحيًا للبيانات.
لاحقًا، اعترفت Xiaohe بأنها لو علمت أن هذه هي بداية العمل في الذكاء الاصطناعي، لكانت قد غادرت على الفور.
تضم المجموعة 6 متدربين، جميعهم طلاب من قسم اللغات الأجنبية في إحدى الجامعات المرموقة. تقوم قائدة الفريق بتعيين المهام كل يوم. في بعض الأحيان يكون الأمر عبارة عن مجموعة من الرموز الصوتية الإنجليزية، ومهمة Xiaohe هي التمييز بين النطق البريطاني والنطق الأمريكي؛ وفي بعض الأحيان يكون برنامج Excel، انقر عليه، وسترى البيانات في كل مكان. إذا قمت بالتمرير لأسفل، فستجد أكثر من 10000 عنصر .
"يبدو الأمر وكأنه تسلق جبل." قال شياو خه.
"المشروع" الذي قمت به أكثر هو الشرح الشفهي لطلاب المدارس المتوسطة. اعتاد المفسرون على الحديث عن العمل كمشاريع، مشروعًا تلو الآخر. يستمع شياو خه إلى 200 تسجيل بلهجات قوية يوميًا، مدة كل منها دقيقتين. إذا سمعت سؤالاً عامًا، فاحصل على 1، وإذا سمعت سؤالًا خاصًا، فاحصل على 2، وإذا لم تسمع أيًا منهما، فاحصل على 0. من أجل منع التسريبات، لم يتمكن من استخدام سماعات الرأس السلكية إلا في المكتب، وكانت آذان شياو خه تؤلمه وشعر "بالغضب اللاإرادي".
غالبًا ما تسمع كلمات بذيئة مستخدمة في التسجيلات. بعض الأطفال لا يتكلمون بضع كلمات قبل أن يبدأوا بالسب. وفي مرة أخرى أثناء مشروع التنقل على الخريطة، لم يستطع أحد إلا أن يلعن التسجيل. "لا أعرف لماذا قد يكون أي شخص غاضبًا جدًا."
"قال Xiaohe إنه لا يمكنك أن تأخذ الأمر على محمل الجد. يمكنك فقط وضع علامة على هذا التسجيل على أنه "لا معنى له"، ثم اقلب الصفحة واستمر في الاستماع إلى التسجيل التالي.
** "مثل الآلة"، يصف كل معلق تقريبًا نفسه بهذه الطريقة. **التعليق التوضيحي أمر لا يحتاج إلى تفكير. قال أحد المعلقين في شاندونغ إن أصعب مشروع قام به على الإطلاق هو التعليق التوضيحي لبصمات الأصابع. لقد حصلت على مجموعة من بصمات الأصابع من شخص لا تعرفه (بعضها لا يزال غير واضح)، وكان عليها سحب الإطار على طول حواف بصمات الأصابع شيئًا فشيئًا. "بعد أن عدت إلى المنزل في ذلك اليوم، تمكنت من رؤية بصمات الأصابع في جميع أنحاء عيني عندما أغمضت عيني."
تتطلب العديد من المشاريع من المفسرين الحفاظ على السرية التامة، لكن المفسرين لا يهتمون بغرض المشروع. أثناء العمل، يُطلب من أصحاب العلامات تسليم هواتفهم المحمولة ووضعها في حقيبة معلقة على الحائط. ولن يُسمح لهم باستعادة هواتفهم إلا إذا تلقوا مكالمة.
لقد شهد معظم المفسرين العملية من عدم الإلمام إلى الكفاءة، ومن الحداثة إلى الملل. كانت المرحلة الأولى من المشروع هي الأكثر إثارة للاهتمام، ففي ذلك الوقت لم تكن قواعد وضع العلامات قد اكتملت بعد، وغالبًا ما واجهوا مجالات مثيرة للجدل وكانوا يتناقشون أو حتى يتجادلون مع بعضهم البعض، وكان الجو مفعمًا بالحيوية. في المراحل المتوسطة والمتأخرة، يتم الانتهاء تقريبًا من القواعد، ولم يتبق سوى العمل المتكرر والميكانيكي، وسيقع الناس في شعور باللا معنى.
**قال أحد المعلقين إنها كانت "عملاً طائشًا". **
أجرت جيا وينجوان، الأستاذة في جامعة شنغهاي، بحثًا ميدانيًا حول شرح البيانات، وهي تعتقد أن شرح البيانات ليس عملاً عقليًا أو جهدًا بدنيًا، بل عملًا معرفيًا، "ما يبيعه الناس هو إدراكهم الخاص". الفكاهة المظلمة هي أننا نريد أن تصبح الآلات أكثر شبهاً بالبشر، ولكن في نفس الوقت نجعل البشر أشبه بالآلات. بمعنى آخر، ضع الفطرة السليمة جانبًا وفكر كالروبوت. **
وبمجرد أن يبدأ المعلق في التفكير "لماذا يجب أن أفعل هذا"، فهذا يعني أنه ليس بعيدًا عن الاستقالة.
تشنغ وي هو رئيس شركة لتعليق البيانات، وقال بصراحة إنه لا يستطيع الاحتفاظ بالأشخاص. وفي أفضل حالاتها، تضم الشركة أقل من 20 شخصًا. غالبًا ما يستمر الموظفون الجدد لمدة نصف شهر فقط، ويأتي الكثير من الأشخاص للعمل في اليوم الأول ويغادرون في اليوم التالي. ولم يكن أمامه خيار سوى الاستمرار في خفض متطلبات التوظيف، وفي النهاية شعر أنني "لا أختار الأشخاص، لكن الآخرين يختارونني".
"لم يكن يعرف كيفية الاحتفاظ بأولئك الذين كانوا يغادرون. قال المفوض تشنغ لـ 36 كريبتون: "سيصبح الأمر أفضل وأفضل إذا بقيت هنا. أنا شخصياً لا أصدق هذا". في نهاية المطاف، طغى استنزاف الموظفين على الشركة، وعندما بقي اثنان فقط من المفسرين، قرر حل الفريق. ولم يمض وقت طويل حتى أطلق ChatGPT موجة جديدة من الذكاء الاصطناعي.
يعد ظهور النماذج الكبيرة مفيدًا لتعليقات البيانات، ولكنه يؤدي أيضًا إلى تكثيف تكامل فريق التعليقات التوضيحية **. **
عندما يتعلق الأمر بقبول الوظائف، قال شياو داي إن 80-90% من المشاريع المميزة في السوق لديها الآن أسعار وحدات منخفضة للغاية، "لأن هناك الكثير من المقاولين من الباطن في الوسط" و"الجميع يريدون تحقيق ربح من السعر". الفرق، ولا تريد القيام بالعمل فعليًا." . لقد عمل كمعلق على منصة التعهيد الجماعي لمدة عامين وبدأ عمله الخاص هذا العام لتشكيل فريق التعليقات التوضيحية الخاص به.
شرح البيانات ليس مربحًا جدًا. بأخذ رسم الإطار ثنائي الأبعاد للقيادة الذاتية كمثال، يبلغ سعر إرسال الطلب لشركة كبيرة 10 سنتات، ويكلف فريق وضع العلامات الذي يتولى المهمة 8 سنتات لكل منهما. وقال شياو داي: "لقد انخفض الآن إلى 5 أو 6 نقاط". قام بحساب حساب، وإذا كان أقل من 8 نقاط، فيمكنه خسارة المال فقط.
من أجل البقاء، يقضي شياو داي معظم وقته في البحث عن المشاريع والتسكع على منصات مختلفة وحانات البريد. المشاريع حقيقية ومزيفة وأغلبها غير موثوقة والوكيل تعرض للخسائر وهناك مشروع لم تصل الأموال بعد 8 أشهر من الانتظار.
لاحقًا، عمل في البداية كمعلق بدوام جزئي، وفقط بعد عدم وجود مشكلة في تقديم العطاءات التجريبية والتسوية، سمح للفريق بتولي المهمة. سمعت ذات مرة أن المنصة ستطلق مجموعة من المشاريع في الساعة الثالثة منتصف الليل، لذلك قام بضبط المنبه مسبقًا للحصول على الطلبات.
**إن فقدان الموظفين، وانخفاض أسعار الوحدات، وتحصيل المدفوعات غير المستقرة يشبه الأورام، مما يؤدي إلى تراجع معظم الشركات الصغيرة في هذه الصناعة. **
ليس هناك كاتب لا يحتقر هذه الوظيفة، فلا يستطيعون كسب المال، ولا يرون مساحة للترقي وفرص التطوير، فيقعون في فترة طويلة من الاكتئاب والخسارة.
أثناء كتابة هذا المقال، استقال معظم المعلقين الذين اتصلت بهم 36Kr. قالت إحدى الفتيات إنها كانت تعمل لمدة شهرين وكان راتبها أقل من 3000 يوان.
المفسرون الداخليون: معدل درجة البكالوريوس 100%
في الماضي، كانت عتبة شرح البيانات منخفضة. في شاندونغ وشانشي وخنان وقويتشو وأماكن أخرى، قامت العديد من شركات شرح البيانات بتوظيف عدد كبير من العمالة الرخيصة. وتشمل أكثر هذه الصناعات شيوعا الأمهات، والمعوقين، وطلاب المدارس المهنية. وطالما أنهم يتقنون العمليات الأساسية لأجهزة الكمبيوتر، فيمكنهم دخول هذه الصناعة.
في عصر النماذج الكبيرة، يحدث خلط وحذف التعليقات التوضيحية للبيانات بهدوء بين المرشحين.
وجد الباحثون أن جودة بيانات التدريب لها تأثير كبير جدًا على أداء النموذج. بالمقارنة مع كمية البيانات، مع جودة البيانات الأعلى، يكون تأثير تحسين النموذج أكثر وضوحًا. ومن أجل التحكم في جودة البيانات، شكلت بعض شركات الذكاء الاصطناعي فرق وضع العلامات الخاصة بها، والخطوة الأولى هي رفع عتبة الدخول إلى الصناعة.
الأمر الأكثر وضوحًا هو أن المؤهلات الأكاديمية للمعلقين بدأت في الظهور.
في أبريل من هذا العام، أنشأت إحدى الشركات الرائدة في مجال تصنيع النماذج واسعة النطاق قاعدة لتعليقات توضيحية للبيانات، وتم تعيين الدفعة الأولى من المعلقين ** وحصلت على معدل درجة البكالوريوس بنسبة 100٪. **أوضح الشخص المسؤول عن الشركة أن البيانات النموذجية الكبيرة تتضمن نطاقًا واسعًا من المعرفة ومعايير التقييم المعقدة، والتي تختبر بشكل كبير فهم لغة المدون وقدراته على التفكير المنطقي.
كان شياو وانغ قد تخرج للتو من الكلية، وعندما عاد إلى مسقط رأسه للبحث عن وظيفة، صادف بالصدفة توظيف قاعدة تصنيف البيانات هذه. فشارك في المقابلة واجتازها بنجاح. أرسلت له القاعدة مادة تدريبية مكونة من 300000 كلمة. فقط من خلال اجتياز اختبار التدريب يمكنه تولي المنصب رسميًا.
يعمل المدونون على الأسئلة كل يوم. يُطرح على الوافدين الجدد 40 سؤالاً يوميًا، بينما يُطرح على العمال ذوي الخبرة 70-80 سؤالًا. يقوم النظام الخلفي بتوزيع الأسئلة على الجميع، ومعظمها عبارة عن سجلات محادثة بين مستخدمين حقيقيين ونماذج كبيرة. وتتراوح أسئلة المستخدمين من جميع أنحاء العالم وهي أكثر غرابة: أي من هذه الهواتف المحمولة الثلاثة أفضل؟ أي البيض أفضل أم غاشابون؟ ما هي معايير الأشخاص الناجحين؟ لماذا حارب لين دايو شيطان العظام؟
سيكون للنموذج الكبير العديد من الإجابات، ومهمة شياو وانغ هي قراءة كل إجابة واختيار الأخطاء وتسجيلها واحدة تلو الأخرى وفقًا للجودة، 5 نقاط هي الدرجة المثالية، ونقطة واحدة هي الأدنى، والإجابات أقل من 3 نقاط يجب تقسيمها إلى أنواع الخطأ. إذا لم تكن الإجابة هي ما تم طرحه، فسيتم منح أدنى درجة مباشرة، وإذا تمت مواجهة سؤال حساس، فلن يتم منح أي درجة وسيتم الحكم عليه على أنه "آخر".
الفرز والتسجيل والتقييم، هذه الخطوات التوضيحية المعقدة قليلاً هي بالضبط ما يسمى RLHF (التعلم المعزز من ردود الفعل البشرية، أي التعلم المعزز من ردود الفعل البشرية). والغرض من ذلك هو مواءمة النماذج الكبيرة بشكل مستمر مع القيم والطرق الإنسانية التفكير.أكثر قابلية للاستخدام. استخدمت OpenAI RLHF في عملية تدريب ChatGPT وحققت نتائج ملحوظة.
بالمقارنة مع تصنيف البيانات السابقة، تعد قواعد وضع العلامات للنماذج الكبيرة أكثر ذاتية. عندما يقوم مهندس الخوارزميات بإجراء مقابلة مع أحد المعلقين، فإنه سيطرح على الشخص الآخر هذا السؤال: "إذا كنت قائد أعمال وتواجه أربعة أنواع من الموظفين: سون وو كونغ، وتشو باجي، وتانغ مونك، وشا سينغ، فمن الذي تفضله؟ يؤجر؟"
وقال إنه لا توجد إجابة موحدة. **هذا النوع من الأسئلة هو اختبار ما إذا كان المدون لديه القدرة على التفكير المنطقي. **
أصبح الطلب على المواهب في الصناعة أمرًا ملحًا. تتعاون شركة ناشئة تدعى Kaiwang Data مع الجامعات لتدريب عدد كبير من المشرعين من طلاب الجامعات. وقال الرئيس التنفيذي يو شو إن الشركة قامت ببناء "أكاديمية كايوانغ للبيانات" العام الماضي وقامت بتدريب أكثر من 1500 طالب في 50 مدرسة للمشاركة في شرح البيانات.
عندما يسجل شياو وانغ إجابات النموذج الكبير، فإنه غالبًا ما يحتاج إلى إجراء بعض التحقق من الحقائق، ويعتمد عبء العمل كليًا على الحظ. ذات مرة صادفني سؤال: أيهما أفضل، سلسلة BMW 3 أم سلسلة مرسيدس بنز C؟ يسرد النموذج الكبير 40 معلمة للسيارتين على التوالي، ويحتاج شياو وانغ إلى التحقق من كل معلمة. استغرق هذا السؤال منه نصف ساعة.
"بعد إجراء التعليقات التوضيحية لفترة من الوقت، وجد شياو وانغ أن درجاته نادرًا ما تتجاوز 3 نقاط. "إن استجابات الذكاء الاصطناعي ليست كافية لتجعلني أشعر بالرضا الشديد أو التميز." وتذكر أن أحد الأسئلة كان "إذا كانت سماعة البلوتوث مكسورة، فهل يجب أن أذهب إلى طبيب الأسنان أو الشركة المصنعة لسماعة الرأس؟" كان من الواضح أنه سؤال صيد، لكن إجابة الذكاء الاصطناعي جعلت عينيه تشتعلان. طبيب الأسنان للإصلاح، وليس إلى المستشفى."
شياو وانغ راضٍ عن هذه الوظيفة. ويبلغ راتبه الأساسي الشهري 1800 يوان، ومكافأة الحضور المثالية 200 يوان، وإعانة السكن 200 يوان، ومع الأخذ في الاعتبار الأداء، يمكنه الحصول على 4000 يوان شهريا. وقال إن الدخل يعتبر أعلى من المتوسط في المنطقة المحلية. كما قام برفع شعره، وجلس الاثنان في محطات العمل المجاورة.
كان هناك حوالي 20 طالبًا جامعيًا يتدربون في نفس الوقت الذي يتدرب فيه شياو وانغ، وفي غضون يومين، رحلوا جميعًا تقريبًا، ولم يتبق سوى شخصين أو ثلاثة أشخاص.
لكن لا داعي للقلق بشأن الشركة، فلن يكون هناك أبدًا نقص في طلاب الجامعات هنا. كشف CTO الحقيقة لـ 36Kr: اذهب وألق نظرة على الوضع الوظيفي الحالي لطلاب الجامعات.
أكثر ما أريد التخلص منه هو التعليقات التوضيحية البشرية، وليس الذكاء الاصطناعي
يجب الاعتراف بأن هناك العديد من التقارير حول التعليقات التوضيحية للبيانات، ويتضمن إجماع الناس أن هذه الوظيفة هي "خط تجميع الإنترنت"، وهو أمر يصعب القيام به لفترة طويلة، وسيتم استبدال هذا التعليق التوضيحي اليدوي في النهاية بالذكاء الاصطناعي.
في الشهر الماضي، أمضينا الكثير من الوقت في التواصل مع مهندسي الخوارزميات وشركات الذكاء الاصطناعي. على الرغم من أن الإجماع المذكور أعلاه لم يتم تحديثه، إلا أنه يمكن الشعور بشكل غامض بأن الشيء الذي يريد القضاء على العمالة البشرية قد لا يكون الذكاء الاصطناعي. قبل أن يتمكن الذكاء الاصطناعي من اتخاذ الإجراءات اللازمة، فإن أولئك الذين أتقنوا التكنولوجيا الأكثر تقدمًا قد رفعوا مناجلهم بالفعل.
في عالم التكنولوجيا، لا يمكن المبالغة في أهمية البيانات. قال مهندس الخوارزميات شياو دوان إنه إذا لم يكن لدى شركة الذكاء الاصطناعي بيانات مصنفة، بغض النظر عن مدى جودة الخوارزمية التي يكتبونها، فستكون أجزاء. كلما زادت البيانات المسمى، كلما كان ذلك أفضل. يعد جمع كل صوف العلامات عملاً مربحًا بالتأكيد.
في بعض الأحيان، يمكن للخوارزمية إنهاء البيانات التي استغرق المدونون أربعة أو خمسة أيام لإكمالها في ساعة واحدة. يعمل شياو دوان في إحدى شركات الإنترنت الكبرى، ويتمتع القسم بميزانية كافية ولديه العديد من المفسرين المتفرغين. وقال "إننا نحاول ألا نترك المفسرين خاملين. وسيقرأ القادة التقرير الأسبوعي. وإذا شعروا أنه لا يوجد الكثير من المهام، فلنكلفهم بمزيد من المهام".
قال أحد المعلقين لموقع 36Kr إنه على الرغم من أن المبرمجين الذين يعملون معه يقولون إن كل نوع من العمل له قيمة، إلا أنهم ما زالوا يكشفون عن غير قصد عن أثر من الازدراء. "بالطبع، هذه المجموعة من الأشخاص أنفسهم موجهون نحو التكنولوجيا." لقد طمأن المعلق نفسه.
تتقدم التكنولوجيا بشكل أسرع بكثير مما توقعه الجميع، وفي عصر النماذج الكبيرة، ستؤثر جودة البيانات بشكل مباشر على أداء النموذج. ** من خلال فهم ذلك، قامت بعض شركات الذكاء الاصطناعي بالتخلي عن الاستعانة بمصادر خارجية لتعليق البيانات دون تردد.
قال الرئيس التنفيذي للتكنولوجيا في إحدى شركات الذكاء الاصطناعي: "كانت جودة البيانات التي حصلنا عليها سيئة للغاية لدرجة أنها كانت عديمة الفائدة في الأساس". عملهم الأساسي هو مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي، وقد قاموا بتطوير نموذج مطور ذاتيًا يمكنه إنشاء كميات غير محدودة من مقاطع فيديو منتجات التجارة الإلكترونية. ومن أجل تدريب النموذج، قاموا بتجنيد 50 طالبًا جامعيًا خصيصًا للقيام بشرح البيانات.
إذا كان الأمر يتعلق بمجالات مهنية مثل الرعاية الطبية والتمويل وأجهزة الكمبيوتر، فمن الصعب أيضًا الوثوق بطلاب الجامعات. بالإضافة إلى بناء قاعدة التصنيف الخاصة بها، تقوم إحدى شركات الإنترنت المحلية الكبرى أيضًا بدفع أموال للمتخصصين من أجل وضع العلامات. على الرغم من أن نسبة المتخصصين في صناعة التعليقات التوضيحية لا تزال صغيرة، إلا أن دورهم واضح تمامًا. على سبيل المثال، من المطمئن للغاية ترك سؤال حول تعليق مدفوعات الضمان الاجتماعي للمهنيين الذين هم على دراية بالوثائق الحكومية.
السر المكشوف هو أنه قبل وقت طويل من انتشار ChatGPT، قامت OpenAI بتنظيم أكثر من عشرة طلاب دكتوراه "لتقييمهم". وفي غضون ثماني سنوات، أنفقت شركة OpenAI مليار دولار أمريكي فقط لتدريب النموذج.
في شهر مايو من هذا العام، بدأت شركة بيانات أمريكية في توظيف متخصصين في مجالات محددة. ولم تعد تعويضات هؤلاء المفسرين الكبار تشكل صفقة رابحة. على سبيل المثال، يبلغ الأجر بالساعة مقابل تصنيف البيانات القانونية 45 دولاراً أميركياً، والأجر بالساعة للشعر 25 دولاراً أميركياً.
ومع ذلك، في نظر بعض شركات الذكاء الاصطناعي، سواء كانوا عمالًا من ذوي الياقات الزرقاء أو من ذوي الياقات البيضاء، فإنهم يريدون توفير التكاليف. عند التواصل مع هذه الشركات، سمعت 36 كريبتون كلمة واحدة بشكل متكرر: خفض التكاليف وزيادة الكفاءة.
الطريقة الأكثر شيوعًا هي استخدام الذكاء الاصطناعي للتعليقات التوضيحية الآلية. ذكرت إحدى شركات البيانات أن نسبة الشرح الآلي وصلت إلى أكثر من 70%.
يقوم مهندس الخوارزميات شياو لي وزملاؤه بمحاولات أكثر تطورًا: ** طالما تم استخدام جزء صغير من البيانات الحقيقية كنموذج، من خلال تقنية الذكاء الاصطناعي التوليدي وسلسلة من الخوارزميات، يمكن استخدام بيانات التدريب عالية الجودة مجمعة. وبعبارة أخرى، لا حاجة لأحد على الإطلاق. **
وقال شياو لي: "إن سعر بياناتنا الاصطناعية أرخص قليلاً من سعر التعليقات التوضيحية اليدوية".
تُستخدم البيانات الاصطناعية حاليًا بشكل أساسي في مجالات القيادة الذاتية والروبوتات. قال شياو لي إنه عندما ظهر ChatGPT، أدرك أن البيانات المشروحة قد لا تعمل، ويجب استخدام البيانات الاصطناعية في النهاية. لدى مؤسس OpenAI سام ألتمان أيضًا وجهة نظر مماثلة: "البيانات الاصطناعية هي الطريقة الأكثر فعالية لحل النقص في بيانات النماذج الكبيرة".
تنتج شركة Light Wheel Intelligence الناشئة بشكل أساسي بيانات اصطناعية في مجالات القيادة الذاتية والروبوتات. قال الرئيس التنفيذي شيه تشن: "النتيجة النهائية لوضع العلامات الآلي هي عدم وضع العلامات. معظم شركات وضع العلامات لا ترى ذلك على المدى الطويل".
ذكر Xie Chen لـ 36Kr أن أحد زملائه في الفريق قد قام سابقًا بعمل تعليق توضيحي آلي في مصنع تصنيع المعدات الأصلية (OEM) وانتصر على التعليق التوضيحي 4D-BEV الأكثر تعقيدًا. هذه أداة تعليقات توضيحية رائدة في الصناعة تستخدم الوقت كخط عرض رابع للتعليقات التوضيحية في الفضاء ثلاثي الأبعاد لتحسين أداء أنظمة القيادة الذاتية. قرر هذا العام التخلي عن التعليقات التوضيحية الآلية، وأخذ زمام المبادرة للعثور على Xie Chen، وانضم أخيرًا إلى Nimbus Intelligence.
هذا الزميل هو شياو لي. وقال إن ظهور الذكاء الاصطناعي التوليدي جعله قلقًا للغاية ذات مرة، ولكن بعد رؤية البيانات الاصطناعية، أصبح متحمسًا مرة أخرى.
أحد أهداف عمله هو "استبدال (تسمية) الأشخاص في هذه الصناعة"، لكنه يشعر بالحرج من القول بالتأكيد: "من المحتمل أن يكون ذلك على المدى القصير، ربما سنة أو سنتين".
وأخيرا، دعونا نعود إلى عالم الشروح. القلق الناجم عن التطور السريع للتكنولوجيا يكاد يكون غير مرئي هنا. لا يوجد سوى مضايقات تافهة ومتكررة وبعض التخيلات الساذجة.
لا يزال الطالب الجامعي شياو وانغ يدرب عارضات الأزياء الكبيرة في مسقط رأسه. وعندما تحدثنا مؤخرًا، قال إن هذه الوظيفة كانت فرصة لدخول مجال الذكاء الاصطناعي. مسار الترقية الذي حددته الشركة لهم هو من المفسرين إلى مفتشي الجودة والمدربين والمشرفين وأخيرا مديري المشاريع. هدف شياو وانغ هو أن يصبح مشرفًا ثم يغير وظيفته إلى منصب أقرب إلى الذكاء الاصطناعي. ما هو بالضبط، فهو لا يعرف بعد.
بالمقارنة مع شياو وانغ الطموح، فإن معظم المعلقين ليس لديهم اهتمام كبير بالذكاء الاصطناعي. أوضحت إحدى الفتيات: "أنا لا أهتم كثيرًا بالتكنولوجيا المتقدمة. لقد بدأت في وضع العلامات لمدة عامين وهي بالفعل موظفة كبيرة. وقد تمت ترقيتها مؤخرًا إلى مفتشة جودة. بالنسبة لها، يعتبر عمل التعليقات التوضيحية بسيطًا ومستقرًا، دون "أي احتكاك ذهني" ويمكنها أحيانًا صيد الأسماك. في هذا العام، عندما أثار الذكاء الاصطناعي عالم التكنولوجيا، كانت حياتها هادئة مثل الماء.
أحد التغييرات القليلة هو إضافة روبوت المحادثة إلى أدوات التعليقات التوضيحية التي توفرها الشركة. تخبر الشركة الجميع أنه إذا واجهت أي أسئلة لم تفهمها أثناء التعليق التوضيحي، فما عليك سوى طرح السؤال على الروبوت مباشرة لتوفير الوقت. لقد تحسنت الكفاءة بسرعة، وأخبرت موقع 36 كريبتون أنها في السابق كانت تستطيع عمل ما يصل إلى خمس أو ستمائة صندوق في اليوم، لكنها الآن تستطيع عمل أكثر من سبعمائة صندوق.
وقالت: "بفضل الروبوت". لم يخبرها أحد بعد أنه يسمى ChatGPT.
(بناءً على طلب الشخص الذي تمت مقابلته، بعض الشخصيات في المقال لها أسماء مستعارة. كما ساهمت مؤلفة 36Kr أنيتا دينغ في كتابة المقال.)