في الآونة الأخيرة، اشتدت "معركة مئات النماذج". وفي ازدهار النماذج الكبيرة، أصبحت "الموهبة" محور المنافسة الشرسة بين شركات التكنولوجيا الكبرى وفرق رواد الأعمال والمؤسسات البحثية. ومع ذلك، لا تزال هناك فجوة كبيرة في المواهب المتطورة في مجال AIGC.
ما نوع المواهب التي ينبغي توظيفها لتسهيل تطوير النموذج؟
أين يمكن توظيف المواهب النموذجية الكبيرة؟
كيفية تنمية مواهب البحث والتطوير النموذجية الكبيرة؟
من أجل الإجابة على الأسئلة المذكورة أعلاه، يدعو Qubit Think Tank بشكل خاص الممارسين والخبراء والباحثين في مجال نماذج الذكاء الاصطناعي الكبيرة لمشاركة الفرص والتحديات وآفاق التطوير المستقبلية لمواهب النماذج الكبيرة مع فرق الشركات. والباحثين عن عمل.
هذه المقالة عبارة عن عمود مقابلة متعمق في سلسلة "Large Model Talent" الصادرة عن Qubit Think Tank. لمزيد من المعلومات، يرجى الانتباه إلى "التقرير البانورامي القادم لتنمية المواهب ذات النماذج الكبيرة لعام 2023 AIGC"
مقدمة عن شخصية المقابلة
قاد فانغ هان، رئيس مجلس الإدارة والرئيس التنفيذي لشركة Kunlun Wanwei، أحد مؤسسي Linux الصيني، تطوير أول برنامج محلي لتنزيل برنامج P2P DUDU.
** **###### △فانغ هان، رئيس مجلس الإدارة والرئيس التنفيذي لشركة كونلون وانوي
انضم إلى Kunlun Wanwei في عام 2008 وقاد تطوير لعبة "Three Kingdoms" ولعبة RPG على الويب "Martial Arts"، وفاز بالعديد من الجوائز.
مناظر رائعة
في غضون سنة أو سنتين، سيتم تخفيف النقص في المواهب الخوارزمية بشكل كبير.
يشير الوعي الابتكاري للمواهب الذي أفهمه إلى كيفية حل المشكلات بشكل مبتكر وتحسين المؤشرات من منظور تقني وهندسي.
"الاختيار" أكثر أهمية من "الزراعة"، والتعلم المستقل أهم من المعلم الذي يقود المتدرب.
في مجال جديد مثل النماذج الكبيرة، يمكن لطلاب الدكتوراه المتخرجين حديثًا أن يصبحوا خبراء في هذا المجال بعد نصف عام من التدريب.
من منظور العرض، المواهب النموذجية الكبيرة حاليًا في مرحلة نقص، وسيتم تخفيف الوضع بشكل كبير خلال 3-5 سنوات.
من منظور كلي، ومقارنة بالصناعات التقليدية، تكمن صعوبة تنمية المواهب النموذجية واسعة النطاق في القوة الحاسوبية غير الكافية للجامعات حاليًا.
الشركات التي تنشئ نماذج أعمال جديدة على مستوى التطبيق تعتمد على الذكاء الاصطناعي والنماذج الكبيرة ستجني أكبر الأرباح.
سجل المقابلة
**كيفية تحديد موهبة النموذج الكبير؟ **
**Qubit Think Tank: كيف يقوم Kunlun Wanwei بتقسيم المواهب النموذجية الكبيرة؟ **
فانغ هان: أعتقد أنه يجب تقسيم التدريب النموذجي إلى قسمين رئيسيين، الاستدلال التدريبي و تطوير التطبيقات. وفقًا لعملية التدريب النموذجية، نقوم بتقسيم المواهب إلى مواهب من جانب الخوارزمية، ومواهب من جانب الهندسة المعمارية، ومواهب من جانب تطوير التطبيقات، وتنقسم مواهب الخوارزمية الأساسية إلى تدريب مسبق، ومعالجة البيانات، وتحسين الاستدلال الدقيق، وما إلى ذلك.
**Qubit Think Tank: ما هو نوع المواهب الأكثر ندرة في نظرك بين مواهب الخوارزميات، ومواهب الهندسة المعمارية، ومواهب تطوير التطبيقات؟ ومن المرجح أن تظل نادرة لفترة طويلة قادمة. **
فانغ هان: في الوقت الحالي، الموهبة الأكثر ندرة هي بالتأكيد موهبة الخوارزمية الأساسية، ولكن سيتم تخفيف حالة العرض والطلب بسرعة. لأن هناك ظاهرة مثيرة للاهتمام للغاية. في الوقت الحاضر، القوة الحاسوبية للجامعات المختلفة غير كافية بشكل خطير، والاتجاه المتعلق بالنماذج الكبيرة يعد حاليًا موضوعًا ساخنًا. هناك العديد من المواهب التي يمكنها اللجوء إلى هذا المجال البحثي، مثل البرمجة اللغوية العصبية جميع مواهب البرمجة اللغوية العصبية تتجه إلى النماذج الكبيرة.
لذلك، رأيي الشخصي هو أنه في غضون عام أو عامين، سيتم تخفيف النقص في المواهب الخوارزمية بشكل كبير، ونظرًا لوجود الكثير من المواهب الخوارزمية ذات الرواتب المرتفعة، أعتقد أن الصين لا تزال موجهة نحو السوق للغاية من حيث تخصيص المواهب.
عناصر الكفاءة التي يجب أن تمتلكها المواهب النموذجية الكبيرة
**Qubit Think Tank: عند توظيف المواهب، ما هي صفات المواهب نفسها الأكثر أهمية؟ **
فانغ هان: فيما يتعلق بـ الإنجازات الأكاديمية والخبرة العملية والخلفية الأكاديمية والوعي بالابتكار التي ذكرتها، فإن أولويتنا هي الخبرة العملية والوعي بالابتكار: أولاً وقبل كل شيء، يعد التدريب على النماذج الكبيرة مشكلة هندسية في الأساس، لذا فإن الخبرة العملية مهمة جدًا بالتأكيد. ثانيًا، النماذج الكبيرة هي مشاريع مبتكرة، لأن جميع شركات النماذج الكبيرة تتنافس جنبًا إلى جنب، وإذا لم يكن هناك شعور بالابتكار، فسيكون من الصعب البقاء في صدارة الآخرين، لأن هذا اتجاه هندسي جديد تمامًا.
**Qubit Think Tank: ما رأيك في هذا الشعور بالابتكار؟ **
فانغ هان: الابتكار الذي أفهمه يختلف عن الابتكار الذي يحدده الجمهور. في الماضي، كان الابتكار يعتمد على الخوارزميات. "ما أعنيه بالابتكار هو، أولاً وقبل كل شيء، مواكبة التقدم المتطور للنماذج الكبيرة. هناك العديد من الأشخاص الذين يدرسون التدريب على النماذج الكبيرة حول العالم. وهذا الاتجاه يتقدم بسرعة كبيرة. ويتم نشر مئات الأوراق الجديدة كل يوم. ، وإجراء تحسينات في مختلف الاتجاهات والمجالات. والثاني هو أن تكون قادرًا على استخدام أساليب جديدة لحل المشكلات التي تتم مواجهتها في الهندسة بناءً على الاحتياجات الفعلية. الابتكار هنا يركز بشكل أكبر على كيفية حل المشكلات بشكل مبتكر وتحسين المؤشرات من منظور تقني وهندسي.
**Qubit Think Tank: هل تعتقد أنه يمكن الحكم على الوعي الابتكاري للمواهب واسعة النطاق من خلال الإنجازات الأكاديمية، وإنجازات براءات الاختراع، وما إلى ذلك؟ **
فانغ هان: أعتقد أنه من غير المعقول الحكم على الوعي الابتكاري للمواهب بناءً على نتائج براءات الاختراع. **لا تولي شركة OpenAI اهتمامًا كبيرًا لأداء المواهب في التقدم بطلب للحصول على براءات الاختراع. فالابتكار الأفضل يعتمد في الواقع على تراكم الخبرات الداخلية. ومن غير المعقول الحكم من منظور براءات الاختراع فقط.
ومع ذلك، ** يمكن استخدام النتائج الأكاديمية كأساس أكثر أهمية للحكم. **على سبيل المثال، أول من صنع نموذج Vicuna وأول من صنع ControlNet كانا من طلاب الدكتوراه، ومن هذا المنظور، يمكن استخدام النتائج الأكاديمية كمرجع معين.
ومع ذلك، في عملية التشغيل الفعلية، بالإضافة إلى الابتكار الكبير لنشر الأوراق، هناك عدد لا يحصى من الابتكارات الصغيرة في الهندسة التي يتعين تحقيقها. **لذلك، لا يزال يتعين الحكم على الوعي الابتكاري بناءً على سرعة المواهب وقدرتها على حل المشكلات في الممارسة العملية.
#### كيفية تنمية المواهب النموذجية الكبيرة
**Qubit Think Tank: عند ترقية نموذج Tiangong من 1.0 إلى 3.5، ما هي مجالات المواهب التي سيتم التركيز عليها في مراحل مختلفة؟ **
فانغ هان: في المراحل المبكرة، نحتاج حقًا إلى مواهب خوارزمية تكون أكثر دراية بالبنية الأساسية للنماذج الكبيرة، وCNN، وTransformer. وبالطبع، يتضمن ذلك أيضًا تنظيف البيانات ومعالجتها. عندما تنضج النماذج الكبيرة تدريجيًا وتحتاج إلى التحول إلى الوسائط المتعددة، ستكون هناك حاجة إلى مجموعة من المواهب التي تقوم بـ رؤية الكمبيوتر. وإذا كان سيتم إصدار نماذج كبيرة للعالم الخارجي، فستكون مواهب التدقيق الأمني ضروري.
**Qubit Think Tank: كيف تعمل شركة Kunlun Wanwei على تنمية مواهبها النموذجية الكبيرة؟ **
فانغ هان: بدأت شركة Kunlun Wanwei في إجراء تدريب على النماذج الكبيرة في عام 2020. في ذلك الوقت، كان هناك عدد قليل جدًا من المواهب في السوق للتدريب على النماذج الكبيرة. كان هناك عدد أكبر من الأشخاص الذين يسلكون مسار BERT وعدد أقل من الأشخاص يسلكون مسار GPT ، لذلك نحن** في ذلك الوقت، اخترنا تنمية المواهب النموذجية الكبيرة بأنفسنا. **
تتمثل طريقة التدريب في السماح للمواهب ذات الخلفية الخوارزمية بتعلم اتجاه التدريب النموذجي، ثم عند التوظيف، يجب أن نفكر في اختيار المواهب التي هي على دراية بالتعلم الآلي والتعلم العميق، والذين لديهم قوة دفع ذاتية قوية وسرعة تعلم سريعة. المواهب، المواهب ذات الخلفية الخوارزمية: كان لدينا في الأصل بعض المواهب الذين كانوا يدرسون الاتجاهات التقنية مثل CNN، لكنهم الآن سيتحولون أكثر إلى تدريب GPT.
**Qubit Think Tank: ما رأيك في نموذج التدريب هذا الذي يقول "البقرة الكبيرة تقود العجل"؟ **
فانغ هان: ستختار كل شركة تعتمد على التكنولوجيا في الواقع طريقة تدريب "الأبقار الكبيرة التي تقود الأبقار الصغيرة"، ولكن **اختيار المواهب أكثر أهمية من تنمية المواهب، والتعلم المستقل أكثر أهمية من قيادة المتدربين المحترفين، ** لذلك عند التوظيف، فإننا نولي أيضًا أهمية كبيرة لقدرة المواهب على التعلم المستقل.
بالنسبة للاتجاهات التقنية التقليدية، مثل Java، تحتاج إلى الاعتماد على الخبرة الغنية، ويحتاج الخريجون الجدد إلى فترة تدريب أطول لينمووا ليصبحوا خبراء في المجال. ومع ذلك، يعد التدريب على النماذج الكبيرة مجالًا ناشئًا، والتراكم في الصناعة ليس أعمق بكثير من ذلك في الأوساط الأكاديمية. **ما لدينا أكثر من الأوساط الأكاديمية هو القوة الحاسوبية. **في الواقع، على مستوى الخوارزميات، ليس لدينا الكثير قبل الجامعات.
**Qubit Think Tank: ما الوقت الذي سيستغرقه الخريجون الجدد ليصبحوا خبراء في النماذج الكبيرة؟ **
فانغ هان: هناك عدد كبير من طلاب الدكتوراه الذين يمكنهم نشر أبحاث نموذجية كبيرة ومتطورة للغاية، ويمكن ملاحظة أيضًا أن العديد من الأبحاث المبتكرة واسعة النطاق يتم نشرها من قبل طلاب الدكتوراه في السنة الثانية والثالثة. د- الطلاب. نجد المواهب في المدرسة التي يمكنها البدء بمجرد وصولها، ويمكنها أن تنمو لتصبح خبراء في هذا المجال في غضون بضعة أشهر.
تتمثل فكرتنا في اختيار أفضل المواهب من طلاب الدكتوراه حديثي التخرج الذين أظهروا القدرة الابتكارية و **الرؤية التقنية أثناء وجودهم في المدرسة. يمكننا زراعة "العجل" في فترة زمنية أقصر. يمكن أن يصبح ما تسميه "بقرة كبيرة".
** مركز أبحاث Qubit: في غضون بضعة أشهر إلى عام، يمكن لطلاب الدكتوراه الجدد أن يصبحوا "أبقارًا كبيرة" في هذا المجال. وأنا أفهم أن "الأبقار الكبيرة" التي تشير إليها هي تلك التي لديها قدرات بحثية وتطويرية أساسية. **
فانغ هان: نعم، نحن نمنح الشباب الكثير من الفرص. في الواقع، ربما لا يوجد سوى بضع عشرات من الأشخاص الذين يقومون بتدريب GPT في OpenAI، وعدد كبير منهم من الموهوبين الذين تخرجوا للتو قبل بضع سنوات. أعتقد أن هذا هو الحال بالنسبة للفرق النموذجية الكبيرة في الصين، فهذا مجال جديد تمامًا، والفرص المتاحة للقادمين الجدد كبيرة بشكل خاص. ** لا توجد مشكلة بالنسبة لطالب الدكتوراه حديث التخرج أن يصبح خبيرًا تقنيًا في هذا المجال بعد العمل لمدة نصف عام تقريبًا، لكن قدرته الإدارية مفقودة بالتأكيد. **هذا المجال الفني جديد جدًا، والجميع يركضون إلى الأمام على نفس خط البداية، وليس بالضرورة أن يكون لدى الخريجين الجدد عيب.
**Qubit Think Tank: هل معظم الخريجين الجدد الذين ذكرتهم يتخصصون في معالجة اللغات الطبيعية؟ ما هي المجالات المحددة التي سيتم تقسيمها إليها؟ **
فانغ هان: الأمر لا يتعلق تمامًا بمعالجة اللغة الطبيعية. أعتقد أنه في مرحلة حياة النموذج الكبير بأكملها، بالإضافة إلى معالجة البيانات، فإنه يحتاج إلى الاعتماد على التراكم الهندسي، في *ما قبل- التدريب، RLHF، SFT، تحسين المشغل * والجوانب الأخرى، لديهم اتجاهات بحث أكاديمية مقابلة، لذلك أعتقد أن لديهم القدرة على تطوير وتدريب 70-80٪ من النماذج الكبيرة.
من السهل جدًا على الموهوبين الذين يدرسون التعلم الآلي والتعلم المعزز والتعلم العميق التحول إلى النماذج الكبيرة. ونظرًا لوجود العديد من النماذج مفتوحة المصدر الآن، وهناك العديد من الأشخاص في الأوساط الأكاديمية الذين يقومون بأوراق بحثية بناءً على نماذج مفتوحة المصدر، فلا أعتقد أن هناك فجوة مطلقة في تقسيم العمل بين المواهب الجامعية.
#### تطوير سوق المواهب المحلية الكبيرة
**Qubit Think Tank: ما رأيك في التطور الشامل الحالي لسوق المواهب النموذجية الكبيرة؟ **
فانغ هان: أعتقد أن مواهب النماذج الكبيرة في حالة ندرة عالية ككل، وسيكون هناك المزيد من الأشخاص الذين يقومون بأعمال المخزون. ومع ذلك، مع تزايد عدد الممارسين في النماذج الكبيرة، سيصبح تقسيم العمل أكثر تفصيلاً، وهذه عملية تمايز طبيعية. إن عملية تطوير أي تقنية جديدة هي على هذا النحو: بدءًا من المهندسين الأوائل وحتى قادة الفريق والقادة على مستوى المدير، سيصبح التمييز بين التوجيه الفني لأعضاء الفريق أكثر وضوحًا.
**Qubit Think Tank: هل تأتي معظم المواهب التي عينتها شركة Kunlun Wanwei من الجامعات، أم أنها تأتي أكثر من هذه الصناعة؟ **
فانغ هان: نحتاج حاليًا إلى مواهب ذات تراكم عملي، لذلك سنختار المزيد من المواهب من الصناعة، الذين يتمتعون بخبرة هندسية غنية. ومع ذلك، سيتم أيضًا تعيين الخريجين الجدد كاحتياط، لذلك هناك المزيد من التعيينات في المدارس، وتبلغ نسبة التوظيف في المدارس إلى التوظيف الاجتماعي حوالي 1:5.
**Qubit Think Tank: ما هي المرحلة التي تعتقد أن تطوير المواهب الحالية لهذا النموذج الكبير قد وصل إليها؟ **
فانغ هان: انطلاقًا من العدد الإجمالي للإنجازات الأكاديمية للمواهب، تحتل الصين المرتبة الأولى في عدد الأوراق البحثية المنشورة في مجال الذكاء الاصطناعي في العالم، وتحتل الولايات المتحدة المرتبة الثانية. وعدد الأوراق البحثية في الولايات المتحدة أكبر من في الصين.
أعتقد أنه فيما يتعلق بعناصر القدرة في المواهب، فإن المواهب ذات الخبرات المختلفة تحتاج إلى نماذج كبيرة، ويجب أن يكون هناك هؤلاء الثلاثة، بما في ذلك الخريجون الجدد والخبراء الميدانيون والقادة. **ولكن من منظور العرض فهو حاليا في مرحلة غير كافية، وسوف يتحسن وضع العرض بشكل كبير في حوالي 3-5 سنوات، **لأن الأمر يستغرق 5 سنوات من إعداد المواد إلى تخرج الطالب.
صعوبات في تنمية المواهب النموذجية الكبيرة
**Qubit Think Tank: ما هي الجوانب التي تعتقد أنه يمكن تحسين تدريب المواهب فيها؟ **
فانغ هان: سأشاركها بشكل أساسي من منظورين، منظور الشركة والمنظور الكلي.
من منظور المؤسسة، سوف تنمو المواهب بشكل أسرع إذا شاركوا في المشاريع الهندسية. وهذه طريقة واضحة وعملية للغاية. بالنسبة للشركات الكبيرة التي تكون أكثر صبرًا مع المواهب، ستكون مواهبها أكثر احترافية فيما تفعله، أما في الشركات الصغيرة، فستنمو مواهب الفرق النموذجية الكبيرة بشكل أكثر شمولاً، ويجب أن تمتلك جميع إمكانيات المجموعة الكاملة من الفرق الكبيرة عارضات ازياء.
من منظور عياني، **مقارنة بالصناعات التقليدية الأخرى، تكمن صعوبة تنمية المواهب النموذجية واسعة النطاق في القوة الحاسوبية غير الكافية للجامعات حاليًا، مما يجعل من الصعب على المدارس تدريب المواهب المعمارية، وهذه المواهب لا يمكن الذهاب إلا إلى المؤسسات للتدريب. وهذه معضلة تواجهها جميع الجامعات في جميع أنحاء العالم. وبعد تقاسم القدرة الحاسوبية على المستوى الوطني مع الجامعات، نعتقد أن هذا الوضع سوف يتحسن.
**Qubit Think Tank: أي أنه يعتمد بشكل أكبر على الروابط بين الصناعة والأوساط الأكاديمية والبحث والسياسة لتنمية المواهب على نطاق واسع. **
فانغ هان: أعتقد أننا يجب أن نبذل قصارى جهدنا لتوفير نفس ظروف الأجهزة في المدارس مثل تلك الموجودة في المؤسسات، وإلا فإن ما نتعلمه في المدارس سيكون بالتأكيد محدودًا نسبيًا.
#### اتجاهات التطوير المستقبلية للمواهب النموذجية الكبيرة وشركات الذكاء الاصطناعي
**Qubit Think Tank: من وجهة نظرك، ما هو اتجاه التطوير المستقبلي لصناعة النماذج الكبيرة ككل؟ **
فانغ هان: أعتقد أنه لا ينبغي أن يطلق عليها صناعة النماذج الكبيرة، بل صناعة الذكاء الاصطناعي بأكملها، ويجب ألا تقل الفرص التي تواجهها صناعة الذكاء الاصطناعي عن فرص الإنترنت والإنترنت عبر الهاتف المحمول. أنا متفائل جدًا بشأن اتجاه تطوير صناعة الذكاء الاصطناعي، وأعتقد أن الذكاء الاصطناعي سيغير الإنترنت بالكامل بشكل عميق، وستتأثر حياة الإنسان بأكملها وتتغير بشكل كبير، وأعتقد أن الصناعة بأكملها ستشهد تغييرًا اتجاهيًا.
**Qubit Think Tank: بناءً على هذا الاتجاه، ما هو نوع المواهب النموذجية الكبيرة التي تعتقد أنها ستحظى بتفضيل أكبر من قبل الشركات؟ **
فانغ هان: أولاً وقبل كل شيء، تشكلت "معركة مئات النماذج". الجميع يصنع قواعد نماذج كبيرة. في المستقبل، سيتم بالتأكيد تقليل قواعد النماذج الكبيرة إلى عدد قليل من الشركات المصنعة الكبيرة والمزيد يجب أن تكون العديد من الشركات في وضع يسمح لها باستخدام نماذج كبيرة للتطبيقات، لذلك أعتقد أنه سيكون هناك المزيد والمزيد من المواهب التي تعمل على تطوير التطبيقات بناءً على النماذج الكبيرة. **
المواهب المسؤولة عن التدريب الأساسي وخوارزميات التحسين وهندسة النماذج الكبيرة ستنتقل إلى الشركات المصنعة الكبيرة أو فرق النماذج الكبيرة. ومع ذلك، نعتقد أن أكبر العمالقة ليسوا بالضرورة شركات النماذج الكبيرة نفسها، ولكن أولئك الذين يصنعون تطبيقات قوية تعتمد على على نماذج كبيرة من هذه الشركات. وبمجرد أن تكبر هذه الشركات، فإنها ستقوم أيضًا ببناء نماذجها الكبيرة الخاصة بها.
نحن نؤمن بأن "التطبيق هو الملك" يعني أن الشركات التي تطور نماذج أعمال جديدة تعتمد على الذكاء الاصطناعي والنماذج الكبيرة في التطبيقات ستجني أكبر الأرباح. **ثم نعتقد أنه في السنوات العشر القادمة ستظهر بالتأكيد شركات عملاقة جديدة مثل Byte وMeituan وDidi، ويجب أن تنمو من 0 إلى 100. والشركات التي تأسست هذا العام أو العام المقبل يجب أن يكون لديها هذه الإمكانية. فرصة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
المواهب في مجال النماذج واسعة النطاق نادرة للغاية، و"الاختيار" أكثر أهمية من "التنمية" |محادثة مع كونلون وانوي
المصدر: كيوبتس
في الآونة الأخيرة، اشتدت "معركة مئات النماذج". وفي ازدهار النماذج الكبيرة، أصبحت "الموهبة" محور المنافسة الشرسة بين شركات التكنولوجيا الكبرى وفرق رواد الأعمال والمؤسسات البحثية. ومع ذلك، لا تزال هناك فجوة كبيرة في المواهب المتطورة في مجال AIGC.
ما نوع المواهب التي ينبغي توظيفها لتسهيل تطوير النموذج؟
أين يمكن توظيف المواهب النموذجية الكبيرة؟
كيفية تنمية مواهب البحث والتطوير النموذجية الكبيرة؟
هذه المقالة عبارة عن عمود مقابلة متعمق في سلسلة "Large Model Talent" الصادرة عن Qubit Think Tank. لمزيد من المعلومات، يرجى الانتباه إلى "التقرير البانورامي القادم لتنمية المواهب ذات النماذج الكبيرة لعام 2023 AIGC"
مقدمة عن شخصية المقابلة
قاد فانغ هان، رئيس مجلس الإدارة والرئيس التنفيذي لشركة Kunlun Wanwei، أحد مؤسسي Linux الصيني، تطوير أول برنامج محلي لتنزيل برنامج P2P DUDU.
**
**###### △فانغ هان، رئيس مجلس الإدارة والرئيس التنفيذي لشركة كونلون وانوي
انضم إلى Kunlun Wanwei في عام 2008 وقاد تطوير لعبة "Three Kingdoms" ولعبة RPG على الويب "Martial Arts"، وفاز بالعديد من الجوائز.
مناظر رائعة
سجل المقابلة
**كيفية تحديد موهبة النموذج الكبير؟ **
**Qubit Think Tank: كيف يقوم Kunlun Wanwei بتقسيم المواهب النموذجية الكبيرة؟ **
فانغ هان: أعتقد أنه يجب تقسيم التدريب النموذجي إلى قسمين رئيسيين، الاستدلال التدريبي و تطوير التطبيقات. وفقًا لعملية التدريب النموذجية، نقوم بتقسيم المواهب إلى مواهب من جانب الخوارزمية، ومواهب من جانب الهندسة المعمارية، ومواهب من جانب تطوير التطبيقات، وتنقسم مواهب الخوارزمية الأساسية إلى تدريب مسبق، ومعالجة البيانات، وتحسين الاستدلال الدقيق، وما إلى ذلك.
**Qubit Think Tank: ما هو نوع المواهب الأكثر ندرة في نظرك بين مواهب الخوارزميات، ومواهب الهندسة المعمارية، ومواهب تطوير التطبيقات؟ ومن المرجح أن تظل نادرة لفترة طويلة قادمة. **
فانغ هان: في الوقت الحالي، الموهبة الأكثر ندرة هي بالتأكيد موهبة الخوارزمية الأساسية، ولكن سيتم تخفيف حالة العرض والطلب بسرعة. لأن هناك ظاهرة مثيرة للاهتمام للغاية. في الوقت الحاضر، القوة الحاسوبية للجامعات المختلفة غير كافية بشكل خطير، والاتجاه المتعلق بالنماذج الكبيرة يعد حاليًا موضوعًا ساخنًا. هناك العديد من المواهب التي يمكنها اللجوء إلى هذا المجال البحثي، مثل البرمجة اللغوية العصبية جميع مواهب البرمجة اللغوية العصبية تتجه إلى النماذج الكبيرة.
لذلك، رأيي الشخصي هو أنه في غضون عام أو عامين، سيتم تخفيف النقص في المواهب الخوارزمية بشكل كبير، ونظرًا لوجود الكثير من المواهب الخوارزمية ذات الرواتب المرتفعة، أعتقد أن الصين لا تزال موجهة نحو السوق للغاية من حيث تخصيص المواهب.
عناصر الكفاءة التي يجب أن تمتلكها المواهب النموذجية الكبيرة
**Qubit Think Tank: عند توظيف المواهب، ما هي صفات المواهب نفسها الأكثر أهمية؟ **
فانغ هان: فيما يتعلق بـ الإنجازات الأكاديمية والخبرة العملية والخلفية الأكاديمية والوعي بالابتكار التي ذكرتها، فإن أولويتنا هي الخبرة العملية والوعي بالابتكار: أولاً وقبل كل شيء، يعد التدريب على النماذج الكبيرة مشكلة هندسية في الأساس، لذا فإن الخبرة العملية مهمة جدًا بالتأكيد. ثانيًا، النماذج الكبيرة هي مشاريع مبتكرة، لأن جميع شركات النماذج الكبيرة تتنافس جنبًا إلى جنب، وإذا لم يكن هناك شعور بالابتكار، فسيكون من الصعب البقاء في صدارة الآخرين، لأن هذا اتجاه هندسي جديد تمامًا.
**Qubit Think Tank: ما رأيك في هذا الشعور بالابتكار؟ **
فانغ هان: الابتكار الذي أفهمه يختلف عن الابتكار الذي يحدده الجمهور. في الماضي، كان الابتكار يعتمد على الخوارزميات. "ما أعنيه بالابتكار هو، أولاً وقبل كل شيء، مواكبة التقدم المتطور للنماذج الكبيرة. هناك العديد من الأشخاص الذين يدرسون التدريب على النماذج الكبيرة حول العالم. وهذا الاتجاه يتقدم بسرعة كبيرة. ويتم نشر مئات الأوراق الجديدة كل يوم. ، وإجراء تحسينات في مختلف الاتجاهات والمجالات. والثاني هو أن تكون قادرًا على استخدام أساليب جديدة لحل المشكلات التي تتم مواجهتها في الهندسة بناءً على الاحتياجات الفعلية. الابتكار هنا يركز بشكل أكبر على كيفية حل المشكلات بشكل مبتكر وتحسين المؤشرات من منظور تقني وهندسي.
**Qubit Think Tank: هل تعتقد أنه يمكن الحكم على الوعي الابتكاري للمواهب واسعة النطاق من خلال الإنجازات الأكاديمية، وإنجازات براءات الاختراع، وما إلى ذلك؟ **
فانغ هان: أعتقد أنه من غير المعقول الحكم على الوعي الابتكاري للمواهب بناءً على نتائج براءات الاختراع. **لا تولي شركة OpenAI اهتمامًا كبيرًا لأداء المواهب في التقدم بطلب للحصول على براءات الاختراع. فالابتكار الأفضل يعتمد في الواقع على تراكم الخبرات الداخلية. ومن غير المعقول الحكم من منظور براءات الاختراع فقط.
ومع ذلك، ** يمكن استخدام النتائج الأكاديمية كأساس أكثر أهمية للحكم. **على سبيل المثال، أول من صنع نموذج Vicuna وأول من صنع ControlNet كانا من طلاب الدكتوراه، ومن هذا المنظور، يمكن استخدام النتائج الأكاديمية كمرجع معين.
ومع ذلك، في عملية التشغيل الفعلية، بالإضافة إلى الابتكار الكبير لنشر الأوراق، هناك عدد لا يحصى من الابتكارات الصغيرة في الهندسة التي يتعين تحقيقها. **لذلك، لا يزال يتعين الحكم على الوعي الابتكاري بناءً على سرعة المواهب وقدرتها على حل المشكلات في الممارسة العملية.
**Qubit Think Tank: عند ترقية نموذج Tiangong من 1.0 إلى 3.5، ما هي مجالات المواهب التي سيتم التركيز عليها في مراحل مختلفة؟ **
فانغ هان: في المراحل المبكرة، نحتاج حقًا إلى مواهب خوارزمية تكون أكثر دراية بالبنية الأساسية للنماذج الكبيرة، وCNN، وTransformer. وبالطبع، يتضمن ذلك أيضًا تنظيف البيانات ومعالجتها. عندما تنضج النماذج الكبيرة تدريجيًا وتحتاج إلى التحول إلى الوسائط المتعددة، ستكون هناك حاجة إلى مجموعة من المواهب التي تقوم بـ رؤية الكمبيوتر. وإذا كان سيتم إصدار نماذج كبيرة للعالم الخارجي، فستكون مواهب التدقيق الأمني ضروري.
**Qubit Think Tank: كيف تعمل شركة Kunlun Wanwei على تنمية مواهبها النموذجية الكبيرة؟ **
فانغ هان: بدأت شركة Kunlun Wanwei في إجراء تدريب على النماذج الكبيرة في عام 2020. في ذلك الوقت، كان هناك عدد قليل جدًا من المواهب في السوق للتدريب على النماذج الكبيرة. كان هناك عدد أكبر من الأشخاص الذين يسلكون مسار BERT وعدد أقل من الأشخاص يسلكون مسار GPT ، لذلك نحن** في ذلك الوقت، اخترنا تنمية المواهب النموذجية الكبيرة بأنفسنا. **
تتمثل طريقة التدريب في السماح للمواهب ذات الخلفية الخوارزمية بتعلم اتجاه التدريب النموذجي، ثم عند التوظيف، يجب أن نفكر في اختيار المواهب التي هي على دراية بالتعلم الآلي والتعلم العميق، والذين لديهم قوة دفع ذاتية قوية وسرعة تعلم سريعة. المواهب، المواهب ذات الخلفية الخوارزمية: كان لدينا في الأصل بعض المواهب الذين كانوا يدرسون الاتجاهات التقنية مثل CNN، لكنهم الآن سيتحولون أكثر إلى تدريب GPT.
**Qubit Think Tank: ما رأيك في نموذج التدريب هذا الذي يقول "البقرة الكبيرة تقود العجل"؟ **
فانغ هان: ستختار كل شركة تعتمد على التكنولوجيا في الواقع طريقة تدريب "الأبقار الكبيرة التي تقود الأبقار الصغيرة"، ولكن **اختيار المواهب أكثر أهمية من تنمية المواهب، والتعلم المستقل أكثر أهمية من قيادة المتدربين المحترفين، ** لذلك عند التوظيف، فإننا نولي أيضًا أهمية كبيرة لقدرة المواهب على التعلم المستقل.
بالنسبة للاتجاهات التقنية التقليدية، مثل Java، تحتاج إلى الاعتماد على الخبرة الغنية، ويحتاج الخريجون الجدد إلى فترة تدريب أطول لينمووا ليصبحوا خبراء في المجال. ومع ذلك، يعد التدريب على النماذج الكبيرة مجالًا ناشئًا، والتراكم في الصناعة ليس أعمق بكثير من ذلك في الأوساط الأكاديمية. **ما لدينا أكثر من الأوساط الأكاديمية هو القوة الحاسوبية. **في الواقع، على مستوى الخوارزميات، ليس لدينا الكثير قبل الجامعات.
**Qubit Think Tank: ما الوقت الذي سيستغرقه الخريجون الجدد ليصبحوا خبراء في النماذج الكبيرة؟ **
فانغ هان: هناك عدد كبير من طلاب الدكتوراه الذين يمكنهم نشر أبحاث نموذجية كبيرة ومتطورة للغاية، ويمكن ملاحظة أيضًا أن العديد من الأبحاث المبتكرة واسعة النطاق يتم نشرها من قبل طلاب الدكتوراه في السنة الثانية والثالثة. د- الطلاب. نجد المواهب في المدرسة التي يمكنها البدء بمجرد وصولها، ويمكنها أن تنمو لتصبح خبراء في هذا المجال في غضون بضعة أشهر.
تتمثل فكرتنا في اختيار أفضل المواهب من طلاب الدكتوراه حديثي التخرج الذين أظهروا القدرة الابتكارية و **الرؤية التقنية أثناء وجودهم في المدرسة. يمكننا زراعة "العجل" في فترة زمنية أقصر. يمكن أن يصبح ما تسميه "بقرة كبيرة".
** مركز أبحاث Qubit: في غضون بضعة أشهر إلى عام، يمكن لطلاب الدكتوراه الجدد أن يصبحوا "أبقارًا كبيرة" في هذا المجال. وأنا أفهم أن "الأبقار الكبيرة" التي تشير إليها هي تلك التي لديها قدرات بحثية وتطويرية أساسية. **
فانغ هان: نعم، نحن نمنح الشباب الكثير من الفرص. في الواقع، ربما لا يوجد سوى بضع عشرات من الأشخاص الذين يقومون بتدريب GPT في OpenAI، وعدد كبير منهم من الموهوبين الذين تخرجوا للتو قبل بضع سنوات. أعتقد أن هذا هو الحال بالنسبة للفرق النموذجية الكبيرة في الصين، فهذا مجال جديد تمامًا، والفرص المتاحة للقادمين الجدد كبيرة بشكل خاص. ** لا توجد مشكلة بالنسبة لطالب الدكتوراه حديث التخرج أن يصبح خبيرًا تقنيًا في هذا المجال بعد العمل لمدة نصف عام تقريبًا، لكن قدرته الإدارية مفقودة بالتأكيد. **هذا المجال الفني جديد جدًا، والجميع يركضون إلى الأمام على نفس خط البداية، وليس بالضرورة أن يكون لدى الخريجين الجدد عيب.
**Qubit Think Tank: هل معظم الخريجين الجدد الذين ذكرتهم يتخصصون في معالجة اللغات الطبيعية؟ ما هي المجالات المحددة التي سيتم تقسيمها إليها؟ **
فانغ هان: الأمر لا يتعلق تمامًا بمعالجة اللغة الطبيعية. أعتقد أنه في مرحلة حياة النموذج الكبير بأكملها، بالإضافة إلى معالجة البيانات، فإنه يحتاج إلى الاعتماد على التراكم الهندسي، في *ما قبل- التدريب، RLHF، SFT، تحسين المشغل * والجوانب الأخرى، لديهم اتجاهات بحث أكاديمية مقابلة، لذلك أعتقد أن لديهم القدرة على تطوير وتدريب 70-80٪ من النماذج الكبيرة.
من السهل جدًا على الموهوبين الذين يدرسون التعلم الآلي والتعلم المعزز والتعلم العميق التحول إلى النماذج الكبيرة. ونظرًا لوجود العديد من النماذج مفتوحة المصدر الآن، وهناك العديد من الأشخاص في الأوساط الأكاديمية الذين يقومون بأوراق بحثية بناءً على نماذج مفتوحة المصدر، فلا أعتقد أن هناك فجوة مطلقة في تقسيم العمل بين المواهب الجامعية.
**Qubit Think Tank: ما رأيك في التطور الشامل الحالي لسوق المواهب النموذجية الكبيرة؟ **
فانغ هان: أعتقد أن مواهب النماذج الكبيرة في حالة ندرة عالية ككل، وسيكون هناك المزيد من الأشخاص الذين يقومون بأعمال المخزون. ومع ذلك، مع تزايد عدد الممارسين في النماذج الكبيرة، سيصبح تقسيم العمل أكثر تفصيلاً، وهذه عملية تمايز طبيعية. إن عملية تطوير أي تقنية جديدة هي على هذا النحو: بدءًا من المهندسين الأوائل وحتى قادة الفريق والقادة على مستوى المدير، سيصبح التمييز بين التوجيه الفني لأعضاء الفريق أكثر وضوحًا.
**Qubit Think Tank: هل تأتي معظم المواهب التي عينتها شركة Kunlun Wanwei من الجامعات، أم أنها تأتي أكثر من هذه الصناعة؟ **
فانغ هان: نحتاج حاليًا إلى مواهب ذات تراكم عملي، لذلك سنختار المزيد من المواهب من الصناعة، الذين يتمتعون بخبرة هندسية غنية. ومع ذلك، سيتم أيضًا تعيين الخريجين الجدد كاحتياط، لذلك هناك المزيد من التعيينات في المدارس، وتبلغ نسبة التوظيف في المدارس إلى التوظيف الاجتماعي حوالي 1:5.
**Qubit Think Tank: ما هي المرحلة التي تعتقد أن تطوير المواهب الحالية لهذا النموذج الكبير قد وصل إليها؟ **
فانغ هان: انطلاقًا من العدد الإجمالي للإنجازات الأكاديمية للمواهب، تحتل الصين المرتبة الأولى في عدد الأوراق البحثية المنشورة في مجال الذكاء الاصطناعي في العالم، وتحتل الولايات المتحدة المرتبة الثانية. وعدد الأوراق البحثية في الولايات المتحدة أكبر من في الصين.
أعتقد أنه فيما يتعلق بعناصر القدرة في المواهب، فإن المواهب ذات الخبرات المختلفة تحتاج إلى نماذج كبيرة، ويجب أن يكون هناك هؤلاء الثلاثة، بما في ذلك الخريجون الجدد والخبراء الميدانيون والقادة. **ولكن من منظور العرض فهو حاليا في مرحلة غير كافية، وسوف يتحسن وضع العرض بشكل كبير في حوالي 3-5 سنوات، **لأن الأمر يستغرق 5 سنوات من إعداد المواد إلى تخرج الطالب.
صعوبات في تنمية المواهب النموذجية الكبيرة
**Qubit Think Tank: ما هي الجوانب التي تعتقد أنه يمكن تحسين تدريب المواهب فيها؟ **
فانغ هان: سأشاركها بشكل أساسي من منظورين، منظور الشركة والمنظور الكلي.
من منظور المؤسسة، سوف تنمو المواهب بشكل أسرع إذا شاركوا في المشاريع الهندسية. وهذه طريقة واضحة وعملية للغاية. بالنسبة للشركات الكبيرة التي تكون أكثر صبرًا مع المواهب، ستكون مواهبها أكثر احترافية فيما تفعله، أما في الشركات الصغيرة، فستنمو مواهب الفرق النموذجية الكبيرة بشكل أكثر شمولاً، ويجب أن تمتلك جميع إمكانيات المجموعة الكاملة من الفرق الكبيرة عارضات ازياء.
من منظور عياني، **مقارنة بالصناعات التقليدية الأخرى، تكمن صعوبة تنمية المواهب النموذجية واسعة النطاق في القوة الحاسوبية غير الكافية للجامعات حاليًا، مما يجعل من الصعب على المدارس تدريب المواهب المعمارية، وهذه المواهب لا يمكن الذهاب إلا إلى المؤسسات للتدريب. وهذه معضلة تواجهها جميع الجامعات في جميع أنحاء العالم. وبعد تقاسم القدرة الحاسوبية على المستوى الوطني مع الجامعات، نعتقد أن هذا الوضع سوف يتحسن.
**Qubit Think Tank: أي أنه يعتمد بشكل أكبر على الروابط بين الصناعة والأوساط الأكاديمية والبحث والسياسة لتنمية المواهب على نطاق واسع. **
فانغ هان: أعتقد أننا يجب أن نبذل قصارى جهدنا لتوفير نفس ظروف الأجهزة في المدارس مثل تلك الموجودة في المؤسسات، وإلا فإن ما نتعلمه في المدارس سيكون بالتأكيد محدودًا نسبيًا.
**Qubit Think Tank: من وجهة نظرك، ما هو اتجاه التطوير المستقبلي لصناعة النماذج الكبيرة ككل؟ **
فانغ هان: أعتقد أنه لا ينبغي أن يطلق عليها صناعة النماذج الكبيرة، بل صناعة الذكاء الاصطناعي بأكملها، ويجب ألا تقل الفرص التي تواجهها صناعة الذكاء الاصطناعي عن فرص الإنترنت والإنترنت عبر الهاتف المحمول. أنا متفائل جدًا بشأن اتجاه تطوير صناعة الذكاء الاصطناعي، وأعتقد أن الذكاء الاصطناعي سيغير الإنترنت بالكامل بشكل عميق، وستتأثر حياة الإنسان بأكملها وتتغير بشكل كبير، وأعتقد أن الصناعة بأكملها ستشهد تغييرًا اتجاهيًا.
**Qubit Think Tank: بناءً على هذا الاتجاه، ما هو نوع المواهب النموذجية الكبيرة التي تعتقد أنها ستحظى بتفضيل أكبر من قبل الشركات؟ **
فانغ هان: أولاً وقبل كل شيء، تشكلت "معركة مئات النماذج". الجميع يصنع قواعد نماذج كبيرة. في المستقبل، سيتم بالتأكيد تقليل قواعد النماذج الكبيرة إلى عدد قليل من الشركات المصنعة الكبيرة والمزيد يجب أن تكون العديد من الشركات في وضع يسمح لها باستخدام نماذج كبيرة للتطبيقات، لذلك أعتقد أنه سيكون هناك المزيد والمزيد من المواهب التي تعمل على تطوير التطبيقات بناءً على النماذج الكبيرة. **
المواهب المسؤولة عن التدريب الأساسي وخوارزميات التحسين وهندسة النماذج الكبيرة ستنتقل إلى الشركات المصنعة الكبيرة أو فرق النماذج الكبيرة. ومع ذلك، نعتقد أن أكبر العمالقة ليسوا بالضرورة شركات النماذج الكبيرة نفسها، ولكن أولئك الذين يصنعون تطبيقات قوية تعتمد على على نماذج كبيرة من هذه الشركات. وبمجرد أن تكبر هذه الشركات، فإنها ستقوم أيضًا ببناء نماذجها الكبيرة الخاصة بها.
نحن نؤمن بأن "التطبيق هو الملك" يعني أن الشركات التي تطور نماذج أعمال جديدة تعتمد على الذكاء الاصطناعي والنماذج الكبيرة في التطبيقات ستجني أكبر الأرباح. **ثم نعتقد أنه في السنوات العشر القادمة ستظهر بالتأكيد شركات عملاقة جديدة مثل Byte وMeituan وDidi، ويجب أن تنمو من 0 إلى 100. والشركات التي تأسست هذا العام أو العام المقبل يجب أن يكون لديها هذه الإمكانية. فرصة.