النكات مخفية خلف الذكاء الاصطناعي، ولا تزال صحيحة حتى الآن. دينغ يانغ، الذي تخرج للتو من الجامعة، لديه مستقبله مؤقتًا في النصف الثاني من الجملة.
درس دينغ يانغ الهندسة الكيميائية الخفيفة عندما كان في الجامعة، وبعد التخرج، ذهب معظم الطلاب في القسم إلى مصانع الورق في ثلاث نوبات، ولم يكن يريد الذهاب إلى المصنع. بعد تخرجه في يونيو من هذا العام، عاد دينغ يانغ إلى هايكو، وحصل على نسخة إلكترونية من بنك الأسئلة التدريبي في أوائل أغسطس، وبعد يومين، أصبح مصمم بيانات "مبتدئًا" في Wenxin Yiyan.
يُطلق على مبنى التجار الصيني في منطقة Xiuying بمدينة Haikou اسم "القاعدة" من قبل واضعي بيانات Wen Xinyi. كان يدخل ويخرج من هذه القاعدة أكثر من مائتي شخص، موزعين على الطوابق الثلاثة لمبنى المكاتب هذا، وكان عليهم التوقيع على اتفاقية عدم الإفصاح قبل دخول الوظيفة، وكان عليهم مسح وجوههم عند دخول الباب. كان لديه جهاز كمبيوتر، وقد استأجر الرئيس العديد من أجهزة الكمبيوتر وشحنها من شانشي، لأنه لا يوجد الكثير من المعارف الذين يستأجرون هذه المعدات محليًا.
"لا يكلف شراء هذا الكمبيوتر 500 يوان. لقد أخذت المضيف ذات مرة للبحث عن Xianyu - كان يساوي 60 يوانًا. يمكنني تثبيت جهاز أفضل بكثير مقابل 500 يوان."
تقدم دينغ يانغ بطلب للحصول على علوم الكمبيوتر أثناء امتحان القبول بالكلية، وتم تحويله لاحقًا إلى الهندسة الكيميائية الخفيفة، لكنه لم يكن مهتمًا بهذا، وبدلاً من ذلك، قرأ الكثير من هندسة الكمبيوتر والبرمجيات في الكلية، مما جعله يسمع عنها بسرعة في نهاية العام الماضي ظهور ChatGPT.
وفي ديسمبر/كانون الأول، قام بتسجيل حساب ChatGPT، وبعد ذلك "فاقت القدرة توقعاتي"، على حد قوله.
المصدر: بينوان
عندما التقيت دينغ يانغ في محطة العمل بالقاعدة، كان السؤال الذي ظهر على شاشة الكمبيوتر أمامه: "ما هو معيار الشخص الناجح؟"
قد يكون هذا سؤالًا حقيقيًا من مستخدم Wenxin Yiyan، أو قد يكون سؤال اختبار تم إنشاؤه من لا شيء، ولكن يتم وضعه أمام الشاشة ويحتاج إلى وضع علامة عليه.
وضع العلامات ليس بالأمر السهل.
لسؤال واحد من هذا القبيل، سيكون هناك خمس إجابات مختلفة قدمها وين شين ييان. يجب على مُصنف البيانات قراءتها، ثم اكتشاف جميع العيوب في كل إجابة.
على سبيل المثال، هناك أخطاء مطبعية في الإجابات أو استخدام خاطئ للكلمات المنطقية مثل "لأن" و"لذلك"، ولكن معظم الإجابات لا علاقة لها بالسؤال، أو هناك ما يسمى "أوهام" ليس لها أي حقيقة الأساس في فقرة معينة.
وسيمنح هذه الإجابات الخمس درجة وفقًا لجودة الإجابة، بحيث تكون الدرجة الكاملة 5 نقاط، وإجمالي خمسة مستويات، وبحد أدنى نقطة واحدة. للحصول على إجابات بثلاث نقاط أو أقل، يحتاج Ding Yang إلى تقسيم كل خطأ إلى أنواع أخطاء مختلفة يقدمها نظام التصنيف.
تهدف عملية تصحيح الأخطاء المعقدة هذه إلى تدريب وإنشاء نموذج مكافأة مناسب RM (نموذج المكافأة، ويسمى أيضًا نموذج التفضيل)، وستؤدي إجراءات التسجيل والفرز إلى زيادة مواءمة النموذج مع التفضيلات البشرية.
وهذا أيضًا هو مفتاح نجاح ChatGPT، فقد وصفت ورقة OpenAI عملية مواءمة الذكاء الاصطناعي مع الأفكار البشرية أثناء عملية ضبط التعليمات.
قبل عمل واضعي البيانات، هناك حاجة إلى المزيد من الموظفين المحترفين لتحويل المجموعة المتباينة إلى أزواج محددة من الأسئلة والأجوبة، ومن ثم تغذيتها بالنموذج الكبير مثل الأسئلة النموذجية، بعد تحسين الأخير بعد عدد كبير من الأسئلة والأجوبة التدريب على البيانات، ويبدأ الإجابة على الأسئلة.
في هذه المرحلة، يقوم واضع البيانات بتقييم جودة الإجابات الناتجة عن النموذج الكبير من منظور السلامة والدقة والملاءمة، وتعمل بيانات التقييم هذه على تدريب نموذج المكافأة. في النهاية، سيحل نموذج المكافأة هذا محل عمل وضع العلامات اليدوية.
وراء تقييم OpenAI بأكثر من 30 مليار دولار أمريكي، هناك عدد كبير من البيانات الكينية التي تصف العمال الذين تقل أجورهم بالساعة عن 2 دولار أمريكي، وإلا لما كانت أمام دينغ يانغ في ديسمبر من العام الماضي.
لكن دينغ يانغ لم يكن يعرف تعريف RM أو SFT، وقال إنه لم يكن هناك مثل هذا المحتوى النظري في التدريب قبل البدء، وبعض الناس هنا لم يعرفوا حتى ما الذي كان يعمل من أجله وين شينييان. ولكن هذا لا يهم، المهم هو إنجاز الأمور.
الراتب الأساسي لهذه الوظيفة، وهو من التاسعة إلى السادسة صباحًا وستة أيام إجازة، هو 1800 يوان. وبعد شهر واحد، إذا تمكنت من وضع علامة على 40 سؤالًا يوميًا في المتوسط، فستحصل على الراتب الأساسي. يتم احتساب الراتب الأساسي على أساس نسبة الإنجاز، كما يجب أن تأخذ العمولة في الاعتبار المعدل الصحيح. "المحارب القديم" الموجود هنا لفترة من الوقت لديه عبء عمل ثابت يبلغ 7 أو 80 شخصًا في اليوم، والمشاكل التي يواجهها أكثر صعوبة. في المتوسط، يمكنك الحصول على 4000 يوان شهريًا، وإذا كنت تعمل بجدية أكبر، مثل الإجابة على حوالي 100 سؤال يوميًا، فيمكنك الحصول على 7000 يوان شهريًا.
بالنسبة لخريج جديد مثل دينغ يانغ، تعتبر 4000 يوان وظيفة ذات بداية جيدة. يبلغ متوسط الراتب الشهري لسكان هايكو ما يزيد قليلاً عن 3000 يوان، وحتى 6 من كل 10 أشخاص لا يمكنهم الحصول على 3000 يوان شهريًا. تبلغ تكلفة مسحوق هوان المحلي الشهير 11 يوانًا، ويمكن لأصحاب العلامات في ChatGPT شراء وعاء لمدة ساعة. وبالمقارنة، فإن المسحوق باهظ الثمن. ووفقا له، فإن الناس في هايكو لا يكسبون الكثير من المال، لكنهم على استعداد للإنفاق على الطعام.
المصدر: بينوان
وقال دينغ يانغ "الأسهم هي الأصعب، أو السيارات". قد يستغرق الأمر 20 دقيقة لمواجهة مشكلة في هذه المنطقة.
"على سبيل المثال، سيسأل شخص ما ما إذا كان سيشتري سيارة BMW الفئة الثالثة أو سلسلة مرسيدس بنز C." في هذا الوقت، سيدرج الطراز الكبير أكثر من 80 معلمة حول السيارتين ليقوم المستخدم بمقارنتها، وعليه أن يقوم بذلك. اتبع خلفه واحدًا تلو الآخر، وتأكد من صحة كل معلمة.
وبعد نصف شهر من العمل، تم وضع مئات الأسئلة، لكنه قال إنه في انطباعه، الحصول على 3 نقاط أمر جيد بالفعل، ومن النادر الحصول على 4 نقاط.
لقد تذكر السؤال الذي حصل على 4 نقاط، وكان العنوان "لماذا حارب لين دايو شيطان العظام؟"
لم يتبع Wen Xin القطب بكلمة واحدة، وأدرك أن Lin Daiyu لم يكن الشخص الذي تغلب على Bone Demon، ثم قدم خلفيات Lin Daiyu وBone Demon. ومن جميع أبعاد جودة الإجابة، يكاد يكون هذا لا تشوبه شائبة.
لقد طرحت هذا السؤال على كلود 2، وقال: "لقد تحول شيطان العظام إلى وانغ شيفنغ وأهان لين دايو عدة مرات، وكان لين دايو غاضبًا من مقتل شيطان العظام." —— الهلوسة مزعجة بالفعل بما فيه الكفاية.
المصدر: بينوان
في بداية عام 2020، أصبح "مدرب الذكاء الاصطناعي" مهنة رسميًا وتم إدراجه في دليل التصنيف المهني الوطني، وبعد عامين، فتحت موجة النماذج الكبيرة فجأة فجوة أكبر في هذا الدليل.
نشاهد الذكاء الاصطناعي وهو ينتزع الوظائف القديمة من البشر ثم نأمل أن يخلق وظائف جديدة. تماما كما تم استبدال العربة بالسيارة، فإن الصناعة الجديدة سوف تعطي سائق العربة استعارة عامة لعالم جديد من العمل لتحقيق الثراء. وكثير من المستثمرين الذين يبحثون عن أهداف بالمال يشترون هذه العبارة، وبعض الناس لا يفعلون ذلك. لا أعتقد ذلك، على سبيل المثال، لقد وضعوا الأساس للتعلم العميق، والآن يشعر الإنجليزي جيفري هينتون بالقلق.
لكن الإبداع الأكثر مباشرة الآن هو صانع بيانات النماذج الكبيرة مثل دينغ يانغ.
قبل عام 2022، كانت حدود الذكاء الاصطناعي لا تزال محددة من خلال السيارات ذاتية القيادة التي لا تستطيع التحكم في نفسها. وهناك استعارة باردة لواضعي البيانات:
"إذا كنت تفكر في الذكاء الاصطناعي كحيوان، فإن وظيفة مُلصق البيانات تعادل تقريبًا إعداد العلف."
الوظيفة رخيصة ومتكررة - وليست قريبة بما يكفي لتكون مغذية.
كملصق بيانات تقليدي، يقتصر العمل اليومي على مراقبة كل صورة مستلمة بعناية، ووضع دائرة حول الخطوط العريضة لسيارة أو كلب، ووضع علامة عليها، وسحبها وإسقاطها في مجلدات مختلفة؛ أو استخدام مصفوفة نقطية تحدد الأداة العوائق في كل إطار من مقطع فيديو للقيادة، مع ترك "منطقة صالحة للقيادة" كاملة.
يمكن تنفيذ مثل هذا الإجراء 2000 مرة يوميًا بواسطة مُصنف البيانات.
يمكن تعلم البيانات المصنفة فقط بواسطة الذكاء الاصطناعي. صرح أحد موردي بيانات القيادة الذاتية ذات مرة أن درجة أتمتة تصنيف البيانات لا تزال 5% فقط منذ تطوير تصنيف البيانات، بينما لا تزال نسبة 95% الأخرى من أعمال وضع العلامات تتم يدويًا.
بعد وصول النموذج الكبير، بدأ نوع تصنيف البيانات نفسه يتغير. لا يقتصر الأمر على رسم المربعات أو رسم النقاط أو رسم الخطوط على الشاشة فحسب، بل يصبح العمل الرئيسي لواضع بيانات النماذج الكبيرة هو تقييم المحتوى الذي تم إنشاؤه وفرزه وتسجيله. وإذا كان ذلك يتضمن جولات متعددة من الحوار أو إنشاء محتوى متعدد الوسائط، الصعوبة زيادة حادة أخرى.
إذا قيل أن التعليقات التوضيحية النموذجية في عصر السيرة الذاتية التقليدية والبرمجة اللغوية العصبية تميل إلى العمل وفقًا لقواعد موضوعية، فإن قواعد التعليقات التوضيحية للنماذج الكبيرة تكون أكثر ذاتية، كما أنها تختبر جودة موظفي التعليقات التوضيحية. ولهذا السبب، فإن فرق وضع العلامات الكبيرة التابعة لشركة بايدو في هايكو وشانشي جميعها من الطلاب الجامعيين أو أعلى.
يتمتع واضعو العلامات العاديون في قاعدة هايكو بفرصة الترقية إلى مفتشي جودة، وبعد ذلك يمكنهم أن يصبحوا مدربين، ثم مشرفين، وأخيراً مديري مشاريع. هذه هي القناة التي تم إنشاؤها في غضون بضعة أشهر. قال الوكيل الذي قدم تعليقات توضيحية للبيانات لـ Wenxin Yiyan في Haikou إنه بعد فترة الاختبار، يمكن ترقية الشخص إذا كانت هناك مناصب داخلية، ولا يوجد جدول زمني.
هذه صناعة جديدة تتشكل بسرعة. وقال دينغ يانغ "كل رابط هو وافد جديد".
بعد انتهاء مفتش الجودة من المراجعة الأولى، يقوم بتسليم بنك الأسئلة إلى المراجعة الثانية. تم إجراء المراجعة الثانية داخليًا بواسطة Baidu، وكانت بيانات التدريب خارج أيدي فريق وضع العلامات في Ding Yang.
دينغ يانغ، الذي يعمل لدى Wen Xinyiyan، وأكثر من 200 شخص في القاعدة بأكملها ليسوا موظفين في Baidu.
تنتمي العلامات الموجودة في قاعدة هايكو إلى أربع وكالات مختلفة. يتم توقيع عقود عملهم مع شركات تصنيف البيانات التابعة لجهات خارجية. هذه هي ممارسة هذا المنصب، إن تاريخ بايدو الطويل في الذكاء الاصطناعي، بدءًا من البحث إلى القيادة الذاتية إلى النماذج واسعة النطاق، يقف خلف أكثر من 600 وكيل في جميع أنحاء البلاد و200 ألف مُصنِّف بيانات في أكثر من 300 مدينة.
وتفترض بايدو أن حجم فريقها النموذجي واسع النطاق الذي يعمل بدوام كامل يقترب من 10000 شخص. وسيتم تنفيذ هذه الخطة باعتبارها "قاعدة" جديدة في أكثر من عشر مدن في جميع أنحاء البلاد في المستقبل.
يعتقد Hu Chi، مدير المنتج في Baidu Intelligent Cloud Data Annotation Base، أن معلقي البيانات النموذجية الكبيرة سيكونون مهنة طويلة الأمد. ومع تعميق قدرات النماذج الضخمة في سيناريوهات مختلفة، سوف تظهر مشاكل جديدة، وهو ما يعني أيضا ظهور متطلبات جديدة لوضع العلامات. وسوف يحتاج البشر دائما إلى مثل هذه المواءمة الدؤوبة.
قال دينغ يانغ إنه سيغادر هنا.
كان هناك أكثر من 20 من مسئولي البيانات المبتدئين الذين جاءوا في نفس الوقت الذي جاء فيه، وغادر معظمهم قريبًا - معظمهم غادروا طوعًا. المحتوى الممل للعمل، وطريقة كسب المال عن طريق الأجور بالقطعة، واستهلاك الأشخاص، ليس من الصعب أن نتخيل أن هذا سيكون منصبًا عالي السيولة. وبغض النظر عن مدى استحسان الناس، فإن الشعور بعدم الأمان المتمثل في استبدال الآلات بالآلات موجود، وهو ما يحب الجميع رؤيته.
يرى دينغ يانغ أن هذه فرصة للنمو مع هذه الصناعة. وقال: "حاول أن ترى ما إذا كان بإمكانك أن تصبح مشرفاً"، قبل أن تجد منصباً أقرب إلى موجة الذكاء الاصطناعي.
(دينغ يانغ هو اسم مستعار في النص)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
كلمات مارك ون شين، 4000 يوان شهريا
المصدر: بينوان
الكاتب : الخل
"بقدر الذكاء الذي يوجد به الذكاء الاصطناعي".
النكات مخفية خلف الذكاء الاصطناعي، ولا تزال صحيحة حتى الآن. دينغ يانغ، الذي تخرج للتو من الجامعة، لديه مستقبله مؤقتًا في النصف الثاني من الجملة.
درس دينغ يانغ الهندسة الكيميائية الخفيفة عندما كان في الجامعة، وبعد التخرج، ذهب معظم الطلاب في القسم إلى مصانع الورق في ثلاث نوبات، ولم يكن يريد الذهاب إلى المصنع. بعد تخرجه في يونيو من هذا العام، عاد دينغ يانغ إلى هايكو، وحصل على نسخة إلكترونية من بنك الأسئلة التدريبي في أوائل أغسطس، وبعد يومين، أصبح مصمم بيانات "مبتدئًا" في Wenxin Yiyan.
يُطلق على مبنى التجار الصيني في منطقة Xiuying بمدينة Haikou اسم "القاعدة" من قبل واضعي بيانات Wen Xinyi. كان يدخل ويخرج من هذه القاعدة أكثر من مائتي شخص، موزعين على الطوابق الثلاثة لمبنى المكاتب هذا، وكان عليهم التوقيع على اتفاقية عدم الإفصاح قبل دخول الوظيفة، وكان عليهم مسح وجوههم عند دخول الباب. كان لديه جهاز كمبيوتر، وقد استأجر الرئيس العديد من أجهزة الكمبيوتر وشحنها من شانشي، لأنه لا يوجد الكثير من المعارف الذين يستأجرون هذه المعدات محليًا.
"لا يكلف شراء هذا الكمبيوتر 500 يوان. لقد أخذت المضيف ذات مرة للبحث عن Xianyu - كان يساوي 60 يوانًا. يمكنني تثبيت جهاز أفضل بكثير مقابل 500 يوان."
تقدم دينغ يانغ بطلب للحصول على علوم الكمبيوتر أثناء امتحان القبول بالكلية، وتم تحويله لاحقًا إلى الهندسة الكيميائية الخفيفة، لكنه لم يكن مهتمًا بهذا، وبدلاً من ذلك، قرأ الكثير من هندسة الكمبيوتر والبرمجيات في الكلية، مما جعله يسمع عنها بسرعة في نهاية العام الماضي ظهور ChatGPT.
وفي ديسمبر/كانون الأول، قام بتسجيل حساب ChatGPT، وبعد ذلك "فاقت القدرة توقعاتي"، على حد قوله.
عندما التقيت دينغ يانغ في محطة العمل بالقاعدة، كان السؤال الذي ظهر على شاشة الكمبيوتر أمامه: "ما هو معيار الشخص الناجح؟"
قد يكون هذا سؤالًا حقيقيًا من مستخدم Wenxin Yiyan، أو قد يكون سؤال اختبار تم إنشاؤه من لا شيء، ولكن يتم وضعه أمام الشاشة ويحتاج إلى وضع علامة عليه.
وضع العلامات ليس بالأمر السهل.
لسؤال واحد من هذا القبيل، سيكون هناك خمس إجابات مختلفة قدمها وين شين ييان. يجب على مُصنف البيانات قراءتها، ثم اكتشاف جميع العيوب في كل إجابة.
على سبيل المثال، هناك أخطاء مطبعية في الإجابات أو استخدام خاطئ للكلمات المنطقية مثل "لأن" و"لذلك"، ولكن معظم الإجابات لا علاقة لها بالسؤال، أو هناك ما يسمى "أوهام" ليس لها أي حقيقة الأساس في فقرة معينة.
وسيمنح هذه الإجابات الخمس درجة وفقًا لجودة الإجابة، بحيث تكون الدرجة الكاملة 5 نقاط، وإجمالي خمسة مستويات، وبحد أدنى نقطة واحدة. للحصول على إجابات بثلاث نقاط أو أقل، يحتاج Ding Yang إلى تقسيم كل خطأ إلى أنواع أخطاء مختلفة يقدمها نظام التصنيف.
تهدف عملية تصحيح الأخطاء المعقدة هذه إلى تدريب وإنشاء نموذج مكافأة مناسب RM (نموذج المكافأة، ويسمى أيضًا نموذج التفضيل)، وستؤدي إجراءات التسجيل والفرز إلى زيادة مواءمة النموذج مع التفضيلات البشرية.
وهذا أيضًا هو مفتاح نجاح ChatGPT، فقد وصفت ورقة OpenAI عملية مواءمة الذكاء الاصطناعي مع الأفكار البشرية أثناء عملية ضبط التعليمات.
قبل عمل واضعي البيانات، هناك حاجة إلى المزيد من الموظفين المحترفين لتحويل المجموعة المتباينة إلى أزواج محددة من الأسئلة والأجوبة، ومن ثم تغذيتها بالنموذج الكبير مثل الأسئلة النموذجية، بعد تحسين الأخير بعد عدد كبير من الأسئلة والأجوبة التدريب على البيانات، ويبدأ الإجابة على الأسئلة.
في هذه المرحلة، يقوم واضع البيانات بتقييم جودة الإجابات الناتجة عن النموذج الكبير من منظور السلامة والدقة والملاءمة، وتعمل بيانات التقييم هذه على تدريب نموذج المكافأة. في النهاية، سيحل نموذج المكافأة هذا محل عمل وضع العلامات اليدوية.
وراء تقييم OpenAI بأكثر من 30 مليار دولار أمريكي، هناك عدد كبير من البيانات الكينية التي تصف العمال الذين تقل أجورهم بالساعة عن 2 دولار أمريكي، وإلا لما كانت أمام دينغ يانغ في ديسمبر من العام الماضي.
لكن دينغ يانغ لم يكن يعرف تعريف RM أو SFT، وقال إنه لم يكن هناك مثل هذا المحتوى النظري في التدريب قبل البدء، وبعض الناس هنا لم يعرفوا حتى ما الذي كان يعمل من أجله وين شينييان. ولكن هذا لا يهم، المهم هو إنجاز الأمور.
الراتب الأساسي لهذه الوظيفة، وهو من التاسعة إلى السادسة صباحًا وستة أيام إجازة، هو 1800 يوان. وبعد شهر واحد، إذا تمكنت من وضع علامة على 40 سؤالًا يوميًا في المتوسط، فستحصل على الراتب الأساسي. يتم احتساب الراتب الأساسي على أساس نسبة الإنجاز، كما يجب أن تأخذ العمولة في الاعتبار المعدل الصحيح. "المحارب القديم" الموجود هنا لفترة من الوقت لديه عبء عمل ثابت يبلغ 7 أو 80 شخصًا في اليوم، والمشاكل التي يواجهها أكثر صعوبة. في المتوسط، يمكنك الحصول على 4000 يوان شهريًا، وإذا كنت تعمل بجدية أكبر، مثل الإجابة على حوالي 100 سؤال يوميًا، فيمكنك الحصول على 7000 يوان شهريًا.
بالنسبة لخريج جديد مثل دينغ يانغ، تعتبر 4000 يوان وظيفة ذات بداية جيدة. يبلغ متوسط الراتب الشهري لسكان هايكو ما يزيد قليلاً عن 3000 يوان، وحتى 6 من كل 10 أشخاص لا يمكنهم الحصول على 3000 يوان شهريًا. تبلغ تكلفة مسحوق هوان المحلي الشهير 11 يوانًا، ويمكن لأصحاب العلامات في ChatGPT شراء وعاء لمدة ساعة. وبالمقارنة، فإن المسحوق باهظ الثمن. ووفقا له، فإن الناس في هايكو لا يكسبون الكثير من المال، لكنهم على استعداد للإنفاق على الطعام.
وقال دينغ يانغ "الأسهم هي الأصعب، أو السيارات". قد يستغرق الأمر 20 دقيقة لمواجهة مشكلة في هذه المنطقة.
"على سبيل المثال، سيسأل شخص ما ما إذا كان سيشتري سيارة BMW الفئة الثالثة أو سلسلة مرسيدس بنز C." في هذا الوقت، سيدرج الطراز الكبير أكثر من 80 معلمة حول السيارتين ليقوم المستخدم بمقارنتها، وعليه أن يقوم بذلك. اتبع خلفه واحدًا تلو الآخر، وتأكد من صحة كل معلمة.
وبعد نصف شهر من العمل، تم وضع مئات الأسئلة، لكنه قال إنه في انطباعه، الحصول على 3 نقاط أمر جيد بالفعل، ومن النادر الحصول على 4 نقاط.
لقد تذكر السؤال الذي حصل على 4 نقاط، وكان العنوان "لماذا حارب لين دايو شيطان العظام؟"
لم يتبع Wen Xin القطب بكلمة واحدة، وأدرك أن Lin Daiyu لم يكن الشخص الذي تغلب على Bone Demon، ثم قدم خلفيات Lin Daiyu وBone Demon. ومن جميع أبعاد جودة الإجابة، يكاد يكون هذا لا تشوبه شائبة.
لقد طرحت هذا السؤال على كلود 2، وقال: "لقد تحول شيطان العظام إلى وانغ شيفنغ وأهان لين دايو عدة مرات، وكان لين دايو غاضبًا من مقتل شيطان العظام." —— الهلوسة مزعجة بالفعل بما فيه الكفاية.
في بداية عام 2020، أصبح "مدرب الذكاء الاصطناعي" مهنة رسميًا وتم إدراجه في دليل التصنيف المهني الوطني، وبعد عامين، فتحت موجة النماذج الكبيرة فجأة فجوة أكبر في هذا الدليل.
نشاهد الذكاء الاصطناعي وهو ينتزع الوظائف القديمة من البشر ثم نأمل أن يخلق وظائف جديدة. تماما كما تم استبدال العربة بالسيارة، فإن الصناعة الجديدة سوف تعطي سائق العربة استعارة عامة لعالم جديد من العمل لتحقيق الثراء. وكثير من المستثمرين الذين يبحثون عن أهداف بالمال يشترون هذه العبارة، وبعض الناس لا يفعلون ذلك. لا أعتقد ذلك، على سبيل المثال، لقد وضعوا الأساس للتعلم العميق، والآن يشعر الإنجليزي جيفري هينتون بالقلق.
لكن الإبداع الأكثر مباشرة الآن هو صانع بيانات النماذج الكبيرة مثل دينغ يانغ.
قبل عام 2022، كانت حدود الذكاء الاصطناعي لا تزال محددة من خلال السيارات ذاتية القيادة التي لا تستطيع التحكم في نفسها. وهناك استعارة باردة لواضعي البيانات:
"إذا كنت تفكر في الذكاء الاصطناعي كحيوان، فإن وظيفة مُلصق البيانات تعادل تقريبًا إعداد العلف."
الوظيفة رخيصة ومتكررة - وليست قريبة بما يكفي لتكون مغذية.
كملصق بيانات تقليدي، يقتصر العمل اليومي على مراقبة كل صورة مستلمة بعناية، ووضع دائرة حول الخطوط العريضة لسيارة أو كلب، ووضع علامة عليها، وسحبها وإسقاطها في مجلدات مختلفة؛ أو استخدام مصفوفة نقطية تحدد الأداة العوائق في كل إطار من مقطع فيديو للقيادة، مع ترك "منطقة صالحة للقيادة" كاملة.
يمكن تنفيذ مثل هذا الإجراء 2000 مرة يوميًا بواسطة مُصنف البيانات.
يمكن تعلم البيانات المصنفة فقط بواسطة الذكاء الاصطناعي. صرح أحد موردي بيانات القيادة الذاتية ذات مرة أن درجة أتمتة تصنيف البيانات لا تزال 5% فقط منذ تطوير تصنيف البيانات، بينما لا تزال نسبة 95% الأخرى من أعمال وضع العلامات تتم يدويًا.
بعد وصول النموذج الكبير، بدأ نوع تصنيف البيانات نفسه يتغير. لا يقتصر الأمر على رسم المربعات أو رسم النقاط أو رسم الخطوط على الشاشة فحسب، بل يصبح العمل الرئيسي لواضع بيانات النماذج الكبيرة هو تقييم المحتوى الذي تم إنشاؤه وفرزه وتسجيله. وإذا كان ذلك يتضمن جولات متعددة من الحوار أو إنشاء محتوى متعدد الوسائط، الصعوبة زيادة حادة أخرى.
إذا قيل أن التعليقات التوضيحية النموذجية في عصر السيرة الذاتية التقليدية والبرمجة اللغوية العصبية تميل إلى العمل وفقًا لقواعد موضوعية، فإن قواعد التعليقات التوضيحية للنماذج الكبيرة تكون أكثر ذاتية، كما أنها تختبر جودة موظفي التعليقات التوضيحية. ولهذا السبب، فإن فرق وضع العلامات الكبيرة التابعة لشركة بايدو في هايكو وشانشي جميعها من الطلاب الجامعيين أو أعلى.
يتمتع واضعو العلامات العاديون في قاعدة هايكو بفرصة الترقية إلى مفتشي جودة، وبعد ذلك يمكنهم أن يصبحوا مدربين، ثم مشرفين، وأخيراً مديري مشاريع. هذه هي القناة التي تم إنشاؤها في غضون بضعة أشهر. قال الوكيل الذي قدم تعليقات توضيحية للبيانات لـ Wenxin Yiyan في Haikou إنه بعد فترة الاختبار، يمكن ترقية الشخص إذا كانت هناك مناصب داخلية، ولا يوجد جدول زمني.
هذه صناعة جديدة تتشكل بسرعة. وقال دينغ يانغ "كل رابط هو وافد جديد".
بعد انتهاء مفتش الجودة من المراجعة الأولى، يقوم بتسليم بنك الأسئلة إلى المراجعة الثانية. تم إجراء المراجعة الثانية داخليًا بواسطة Baidu، وكانت بيانات التدريب خارج أيدي فريق وضع العلامات في Ding Yang.
دينغ يانغ، الذي يعمل لدى Wen Xinyiyan، وأكثر من 200 شخص في القاعدة بأكملها ليسوا موظفين في Baidu.
تنتمي العلامات الموجودة في قاعدة هايكو إلى أربع وكالات مختلفة. يتم توقيع عقود عملهم مع شركات تصنيف البيانات التابعة لجهات خارجية. هذه هي ممارسة هذا المنصب، إن تاريخ بايدو الطويل في الذكاء الاصطناعي، بدءًا من البحث إلى القيادة الذاتية إلى النماذج واسعة النطاق، يقف خلف أكثر من 600 وكيل في جميع أنحاء البلاد و200 ألف مُصنِّف بيانات في أكثر من 300 مدينة.
وتفترض بايدو أن حجم فريقها النموذجي واسع النطاق الذي يعمل بدوام كامل يقترب من 10000 شخص. وسيتم تنفيذ هذه الخطة باعتبارها "قاعدة" جديدة في أكثر من عشر مدن في جميع أنحاء البلاد في المستقبل.
يعتقد Hu Chi، مدير المنتج في Baidu Intelligent Cloud Data Annotation Base، أن معلقي البيانات النموذجية الكبيرة سيكونون مهنة طويلة الأمد. ومع تعميق قدرات النماذج الضخمة في سيناريوهات مختلفة، سوف تظهر مشاكل جديدة، وهو ما يعني أيضا ظهور متطلبات جديدة لوضع العلامات. وسوف يحتاج البشر دائما إلى مثل هذه المواءمة الدؤوبة.
قال دينغ يانغ إنه سيغادر هنا.
كان هناك أكثر من 20 من مسئولي البيانات المبتدئين الذين جاءوا في نفس الوقت الذي جاء فيه، وغادر معظمهم قريبًا - معظمهم غادروا طوعًا. المحتوى الممل للعمل، وطريقة كسب المال عن طريق الأجور بالقطعة، واستهلاك الأشخاص، ليس من الصعب أن نتخيل أن هذا سيكون منصبًا عالي السيولة. وبغض النظر عن مدى استحسان الناس، فإن الشعور بعدم الأمان المتمثل في استبدال الآلات بالآلات موجود، وهو ما يحب الجميع رؤيته.
يرى دينغ يانغ أن هذه فرصة للنمو مع هذه الصناعة. وقال: "حاول أن ترى ما إذا كان بإمكانك أن تصبح مشرفاً"، قبل أن تجد منصباً أقرب إلى موجة الذكاء الاصطناعي.
(دينغ يانغ هو اسم مستعار في النص)