خيبة الأمل منظمة العفو الدولية: نموذج نصف عام ، لا يزال يطير في السماء

المصدر: "فوتون بلانيت" (المعرف: TMTweb) ، المؤلف: وو كونيان ، المحرر: وو زيانزي

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI

كانت حريق النموذج الكبير مشتعلة على هذه الأرض منذ نصف عام. نظرًا لأن المؤتمرات الصحفية لشركة Huawei و JD.com و Ctrip تلاحق الحلقات المسائية ، وفقًا لنموذج الإنترنت المتسق ، فإن "الشيء الجديد" للنماذج المحلية واسعة النطاق قد بدأ أيضًا في اختبار نصف عام خاص به.

الأمر مختلف تمامًا عن الاختبارات نصف السنوية للأنشطة التجارية الأخرى. يتم دعم الفحوصات نصف السنوية لأشكال الأعمال مثل مركبات الطاقة الجديدة والهواتف المحمولة ومنصات التجارة الإلكترونية بمعلومات كافية عن البيانات العامة لتسهيل التحليل النصي. الصندوق الأسود "، لا يوجد نموذج عمل واضح ، لذا فإن ما يسمى بمعلومات البيانات والحجج الأخرى غير وارد.

من المثير للسخرية أنه حتى من منظور وظيفة المنتج ، فإن النموذج الكبير لم ينتج بعد طريقة تقييم عامة. في مواجهة الهدف النهائي للذكاء الاصطناعي العام ، توجد طرق تقييم مختلفة بشكل طبيعي ، مثل "طريقة أسماك اليوسفي السنجاب" الكلاسيكية التي يعتمد عليها المستخدمون المحليون في "تقييم" النماذج الكبيرة.

أو لهذا السبب ، تفشل معظم الشركات المصنعة المحلية في فتح نماذجها الكبيرة للاستخدام مثل OpenAI ، ولكنها تنفذ آليات اختبار داخلية.

يركز استكشاف النماذج الكبيرة بشكل أكبر على الجانب B والجانب G ، مثل النماذج الكبيرة الحجم الرائدة في الصناعة من Tencent ، و Pangu 3.0 من Huawei ، و Jingdong Lingxi ، وما إلى ذلك. باعتباره المسار الحالي الذي يركز عليه كبار اللاعبين ، يركز نموذجه الكبير على إظهار أشكال المنتجات الناضجة قدر الإمكان ، مع التسويق باعتباره الهدف الأساسي. على سبيل المثال ، من أجل الترويج السريع لهذا النوع من النماذج الكبيرة وتعزيزه تجاريًا ، بالإضافة إلى توجيه هبوط الأعمال ، أصبحت قدرات النشر المحلية أيضًا مؤشرات مرجعية مهمة.

ومع ذلك ، في نظر المطلعين على الصناعة ، لا يزال نموذج الصناعة واسع النطاق الذي "يسلم الوعاء إلى المقدمة" يفتقر إلى الشركات التي تشتريه. كانت رياح نموذج الصناعة تهب منذ شهر منذ يونيو ، وكان هناك لم يكن هناك تعاون تجاري واسع النطاق حتى الآن.

لذلك ، ليس من الصعب أن نرى أنه في سوق الاستثمار اليوم ، تتركز الاستثمارات المتعلقة بالنماذج الكبيرة في السوق الثانوية بدلاً من السوق الأولية. حتى لو دخل مستوى البقرة الكبيرة لـ Wang Huiwen إلى السوق ، تقول المصادر العامة أن تمويلها من الدرجة الأولى أعلى بكثير من 230 مليون دولار أمريكي ، وقدرتها التمويلية ليست مماثلة لتلك الخاصة بـ OpenAI ، التي تتلقى عشرات المليارات من الدولارات. من Microsoft من وقت لآخر.

سوق الاستثمار هو مقياس مؤهل. من الواضح أن أوراق الإجابة التي قدمتها النماذج المحلية واسعة النطاق في عقدة الامتحان نصف السنوية ليست مرضية ، وسوف يستغرق الأمر فترة من السكون والتلميع لجعل "القصة" حقيقة.

** نموذج كبير بدون نموذج عمل؟ **

عندما تحتاج النماذج المحلية واسعة النطاق إلى الاستجابة لشكوك السوق ، يجب وضع نماذج الأعمال التجارية في المقام الأول.

شهدت ChatGPT ، التي احتلت بالفعل المرتبة الأولى في أذهان المستخدمين ، انخفاضًا كبيرًا في شعبيتها. كما أن Baidu و Ali ، أول طرازات كبيرة للأغراض العامة تم إصدارها محليًا ، سقطت أيضًا في "الصمت" بعد اتباع عدد كبير من اللاعبين أعلى. والسبب هو أن نموذج العمل الخاص بالنموذج العام الكبير فشل في العمل. على الرغم من حصولها على موافقة المستخدمين في مجال الرأي العام ، إلا أن الحلقة التجارية المغلقة لم تظهر أبدًا.

بأخذ نموذج Baidu واسع النطاق مع مجموعة واسعة من الاختبارات كمثال ، يعتمد نموذج الدفع لتطبيقها التجاري Wenxin Qianfan على عدد الرموز التي تم إنشاؤها عن طريق الاتصال ، والمعيار هو 0.012 يوان لكل ألف رمز ، ويكلف 0.12 يوان لإخراج مخطوطة من ألف حرف.

بغض النظر عن سرعة تكلفة الاسترداد ، فإن رسم 0.012 يوان / ألف رمز يبدو رخيصًا ، لكن إنشاء النص غالبًا ما يتطلب تفاعلات متعددة للحصول على النتائج المرجوة. ستؤدي التفاعلات المتعددة إلى زيادة التكلفة المخفية بشكل لا نهائي. بعد كل شيء ، Wenxin Qianfan ليس هو نوع من الموظفين الذين يأتون ويذهبون.

سيناريو مشابه هو مجتمع الأسئلة والأجوبة. أخبر Sun Quan (اسم مستعار) ، وهو أكاديمي ، Photon Planet أن تجربة استخدام التطبيقات النموذجية تشبه البحث عن إجابات عالية الجودة في مجتمع الأسئلة والأجوبة. تفكير المستخدم هو دقة السؤال ، وغالبًا ما يتم العثور على الرغبة في الدفع فقط في الإجابات عالية الجودة. سيتم تقديم إجابات عالية الجودة بعد ذلك. لذلك ، اختارت Baidu عدد نصوص الاستدلال كمعيار للدفع ، لكنها لا تزال غير قادرة على تغطية التكاليف المخفية للاستخدام التجاري.

إذا اعتمدت الدفعة الشهرية التي يحب الجانب B رؤيتها ، فسيؤدي ذلك فقط إلى تحويل نفقات التكلفة من المستخدمين إلى نفسك ، وهو من الواضح أنه ليس حلاً طويل الأجل. أفضل دليل على ذلك هو أن ChatGPT لا يزال يشتبه في قيامه بقطع زوايا أقل من سعر 20 دولارًا شهريًا لمستخدمي C-end.

في الوقت الحالي ، يصعب تسويق النماذج الكبيرة للأغراض العامة لتحقيق توازن التعادل سواء كان ذلك على الجانب B أو الجانب C. وفي الوقت نفسه ، من المحتمل أن تواجه مخاطر الامتثال مثل أخلاقيات الذكاء الاصطناعي والإشراف. لذلك ، أصبح تصنيع النماذج الكبيرة ورأسيتها نقلة نوعية في ظل طلب الهبوط.

على عكس نموذج الصناعة واسع النطاق ، على الرغم من أن شكل منتجها يبدأ بطلب الهبوط ، إلا أن المشكلات التي تنشأ في الهبوط الفعلي لا تزال بحاجة إلى حل.

أحد أنواع الحالات التي تستحق الإشارة إليها هو النموذج الرأسي إلى C الذي تم إنشاؤه على أساس بيئة المنتج الخاصة به ، مثل Zhihaitu AI ، الذي أعلن Zhihu سابقًا لإجراء اختبار داخلي في المنتج ، و Ctrip.com ، الذي تم إصداره لفترة ليست طويلة منذ.

إن مزايا الاثنين اللذان يدخلان مسار النموذج واسع النطاق هي نفسها ، والتي تكمن في البيئة المجتمعية الخاصة بهما ومحتوى المجتمع عالي الجودة المستمد من ذلك. يمكن أن يصبح المحتوى ، كبيانات الصناعة ، مجموعة تدريب للنماذج الكبيرة بعد التنظيف البسيط. الفرق الدقيق بين الاثنين هو أن Zhihu كان مجتمع محتوى منذ البداية ، في حين أن Ctrip بدأت فقط في التركيز على المحتوى في السنوات الأخيرة.

ولكن من وجهة النظر الحالية ، سواء كانت Zhihu أو Ctrip ، يبدو أن شكل المنتج لنموذجها الكبير قد فشل في تلبية نقاط الألم لدى المستخدمين ، كما أنه لم يحسن الوظائف الحالية بشكل كافٍ.

يستخدم منتج Zhihaitu AI المعلن عنه حاليًا "ملخص القائمة الساخنة" AI لالتقاط أسئلة وإجابات عالية الجودة وصقل وإعادة كتابة الملخص لتقديمه إلى المستخدمين ، بينما يقوم تطبيق آخر "Search Aggregation" بتجميع الآراء من الإجابات الذاتية لتحسين معلومات اكتساب المستخدمين و الكفاءة في اتخاذ القرارات.

وظائف التجميع مثل التوصية الذاتية والقائمة الساخنة هي "المهارات الفنية التقليدية" لـ Zhihu ، ولم يتسبب أداء تمكين النموذج الكبير في حدوث دفقة على مستوى المستخدم. علاوة على ذلك ، فإن عملية إعادة كتابة وتلميع الذكاء الاصطناعي تغطي أيضًا الميزات الشخصية للإجابات الشائعة.بالنسبة للمستخدمين ، فإن وظيفة هذا التطبيق هي فقط لفهم المعلومات بسرعة ، وهو ما يتعارض مع التواصل المميز والشخصي الذي يدعو إليه مجتمع المحتوى.

بناءً على OTA ، سأل كتريب ، في رأي Liang Jianzhang ، رئيس مجلس إدارة Ctrip ، أنها "مكتبة إجابات موثوقة" لصناعة السياحة. سيستغرق اختبار فعالية منتجاتها وقتًا ، ولكن من منظور تحديد المواقع ، يُشتبه أيضًا في "التضحية بالأساسيات ومطاردة الأخير".

في نظر المستخدمين الشباب ، لا توجد إجابة معيارية للسياحة ، وظهور أشكال سياحة متنوعة مثل "القوات الخاصة" و "التثقيب" و "الانغماس" يثبت ذلك. على سبيل المثال ، بافتراض أن عددًا كبيرًا من المستخدمين يستخدمون الذكاء الاصطناعي لصياغة تخطيط طريق السفر ، فإن تخطيط المسار نفسه سيؤثر فعليًا على التواصل المجتمعي والجو ، وحتى يتسبب في تقليل وقت إقامة المستخدم.

بشكل عام ، محاولة الهبوط للنموذج العمودي عند الطرف C ليست سلسة ، وقد تصبح "تكلفة باهظة". ربما تتأثر أسطورة "تحسين الكفاءة" للنموذج الكبير نفسه ، حيث يقتصر تحديد موضع المنتج في الغالب على كلمة "الكفاءة" ، ولكن الكفاءة ليست سوى بُعد غير أساسي في تجربة المستخدم.

كما تم إثبات نفس النموذج في المجال B ، وعلى الجانب B الذي يسعى لتحقيق الكفاءة ، تم توضيح نموذج العمل وقضايا التنفيذ الخاصة بالنموذج الكبير للصناعة بشكل أكثر عمقًا.

** الصندوق الأسود غير واضح **

"الذكاء الاصطناعي ليس فيزياء. هناك القليل من الاختراقات التكنولوجية الرئيسية من الناحية النظرية ، ولكن المزيد من الضبط الدقيق والتحسين الصغير في أبعاد بنية النموذج وجودة البيانات. في كثير من الحالات ، يكون إخراج النموذج أفضل ، لكن الفريق لا يستطيع ابحث عن السبب ".

في رأي أحد المطلعين على الصناعة ، هناك تحيز معرفي كبير في النماذج الكبيرة خارج الصناعة ، والسبب هو أن التدريب على النماذج الكبيرة وصناعة الذكاء الاصطناعي هما "الصندوق الأسود" للعالم الخارجي ، وهو أمر صعب لفحص النماذج الكبيرة عملية التفكير التي تنتج المخرجات غير مرئية وغير ملموسة.

وقد أدى ذلك بالعالم الخارجي إلى اتخاذ موقف حذر تجاه "الصندوق الأسود" للنموذج الكبير بمجرد أن يهدأ بعد فترة الجنون التي جلبتها ChatGPT. سيؤدي هذا إلى معضلة النموذج الكبير على الأرض ، وهذه الظاهرة أكثر وضوحًا في عملية التغيير إلى المسار B.

خذ المنتجات التي تنتجها كبرى الشركات المصنعة التي حددت الآن بوضوح الطريق إلى B كأمثلة ، بما في ذلك حل تكنولوجيا MaaS الذي أطلقته Tencent Cloud ، ونموذج Pangu الكبير الذي أطلقته Huawei Cloud. نشر السحابة ، والنشر المحلي السريع ، إلخ. هناك أيضًا إنجازات في التفاعل والتشغيل والإضافة اللاحقة للتحسين التكراري الجديد لبيانات الصناعة.يمكن القول أنه من أجل الهبوط ، تم تقليل عتبة النماذج الكبيرة إلى مستوى منخفض للغاية.

ومع ذلك ، فإن الجدار المعرفي الذي أحدثته "الحكمة" لم يتم كسره.على الرغم من أن ChatGPT كانت تهب لمدة نصف عام ، إلا أن العديد من الشركات ليس لديها دافع أو اهتمام لدراسة كيفية استيراد النماذج الكبيرة.

يمكن رؤية منطق مماثل في صناعة الحوسبة السحابية قبل بضع سنوات. الحوسبة السحابية هي خدمة ومشتقة تعتمد على الاعتراف بقيمة البيانات ، أما بالنسبة لقيمة النماذج الكبيرة للمؤسسات ، فمن المعروف نسبيًا أن قيمة البيانات قد قفزت. إنها أيضًا القدرات التقنية التي يفتقر إليها عملاء المؤسسات ، وحتى تعميم الحوسبة السحابية في المؤسسات المحلية لا يزال بعيدًا عن النهاية ، ناهيك عن النموذج الكبير.

سواء كان نموذج الصناعة مفيدًا أم لا ، لم يعد مهمًا في الواقع ، بعد كل شيء ، يجب أن يكتشف المستخدم قيمة استخدام المنتج في النهاية. علاوة على ذلك ، سيقيس العالم الخارجي تقريبًا مستوى النموذج من خلال اختبارات وعروض معينة ، مثل "طريقة سمك اليوسفي السنجابي" أو Huawei Pangu ، والتي تم استجوابها مؤخرًا بسبب أخطاء في التنبؤ بموقع الهبوط وشدة الإعصار الفائق "Dusuri" نموذج الطقس.

ربما لهذا السبب ، اختار نموذج Jingdong Lingxi واسع النطاق الذي تم إصداره مؤخرًا إعطاء الأولوية لتشغيل سيناريوهات الأعمال الخاصة به ، ومن المتوقع أن يكون مفتوحًا "لسيناريوهات العمل الخارجية الجادة" في أوائل العام المقبل.

والجدير بالذكر أنه في ظل "الاتجاه الصناعي" ، حل ما يسمى بنموذج الصناعة الموجه من خلال التسويق محل السرد "العالمي" الأصلي للنموذج الكبير ، وفي الوقت نفسه ، تسبب أيضًا في خسارة العديد من الأشخاص ".

تعريف نموذج الصناعة المزعوم غامض. لا تكمن دلالة النموذج الكبير (نموذج الأساس) في عدد المعلمات ولكن في القدرات العامة التي تظهر من التدريب العام على البيانات. إذا تم اعتماد نفس بنية النموذج ، ولكن تم استخدام بيانات مجال واحد على البيانات ، فلن يتم فقدان القدرة العامة فحسب ، ولكن حتى مشاكل المجال لا يمكن حلها بسبب الخصومات الناشئة.

إذا تم استخدام بيانات الصناعة للتدريب المسبق الثانوي على أساس النموذج الكبير الأصلي ، فهذا يعادل ضبط النموذج الأصلي ، فإن المنتج نفسه لا يزال في طبقة النموذج ، والتي يمكن تسميتها بالنموذج الكبير للصناعة ؛ إذا تمت إضافة معرفة المجال من خلال أو قاعدة بيانات خارجية ، فهذا فقط لتحفيز قدرات النموذج الأصلي ، ويجب أن ينتمي المنتج أيضًا إلى طبقة التطبيق أعلى النموذج.

في الوقت الحاضر ، معظم نماذج الصناعة واسعة النطاق في المصانع الكبرى هي الأولى ، مثل Tencent و Jingdong و Huawei وما إلى ذلك. سيظهر الأخير بشكل أكبر في مجتمع المصادر المفتوحة بسبب الاستثمار الخفيف والتحسين السريع لأداء النموذج ، مثل ChatLaw ، وهو نموذج قانوني كبير أثار مناقشات ساخنة منذ بعض الوقت.

قال أحد المطلعين في الصناعة: "بالمقارنة مع السابق ، فإن الأخير أكثر نضجًا من حيث شكل المنتج ، مما يسهل البناء السريع لقدرات النموذج ، ولكن الأخير غالبًا ما يكون له حد أعلى بعد إكمال عملية غرس المعرفة بالمجال".

** تهديدات مفتوحة المصدر **

في الآونة الأخيرة ، قدمت Meta أحدث طراز كبير مفتوح المصدر Llama2 مجانًا بموجب ترخيص تجاري مفتوح ، وقدمته إلى منصة Microsoft Azure الأساسية. وقد تم الترحيب بهذه الخطوة باعتبارها معلمًا هامًا لـ LLM مفتوح المصدر ، وحتى بدأت في تهديد حالة المصدر المغلق الشركة الرائدة OpenAI.

من خلال Microsoft ، الراعي النموذجي الكبير ، تتحدى Meta شركة OpenAI بموقف أكثر انفتاحًا.

في الواقع ، صعد "فصيل المصادر المفتوحة" بهدوء كطرف ثالث قبل ذلك بوقت طويل. قال مستند داخلي لشركة Google تم تسريبه عن طريق الخطأ في مايو: "ليس لدينا خندق مائي ولا OpenAI". الفكرة العامة هي أنه ظاهريًا ، يتواصل برنامج OpenAI و Google مع بعضهما البعض في النموذج الكبير ، لكن الفائز الحقيقي قد لا يأتي من هذين النموذجين ، والسبب في هذا الحكم يكمن في بيئة المصدر المفتوح الغنية بشكل متزايد.

أصبحت البيئة مفتوحة المصدر أكثر نشاطًا ، وحتى Llama2 ، التي تمثل قدرة النموذج ، وظهرت LORA ، التكنولوجيا التمثيلية لنموذج Finetune (ضبط النموذج). كل هذا جعل الشركات المصنعة العملاقة يسعون جاهدين من أجل "الكفاح من أجل المعجزات" ليشعروا بالبرد الواضح.

عوامل مثل تقاسم التكنولوجيا مفتوحة المصدر ونقل المواهب تجعل الصندوق الأسود للنموذج الكبير أكثر "مزججًا". والنتيجة الحتمية لعدم وجود حواجز هي كونو كيف ، التي تستثمرها المصانع الكبيرة بمبالغ ضخمة من المال و الوقت ، يتم قلبه بسهولة من قبل مجتمع المصادر المفتوحة.

تستجيب معظم الشركات المصنعة المحلية الرائدة لهذا من خلال "الإمساك بكلتا يديه". اليد اليسرى "تغلق الباب لبناء سيارة" ، وتعمل باستمرار على تلميع شكل المنتج وقدراته في شكل اختبار داخلي على نطاق صغير ، و "العصف الذهني" في اليد اليمنى ، يبني مجتمعًا مفتوح المصدر داخل البيئة يعتمد على السحابة بيئة المطور ، ولكن هذا يتطلب فقط طبقة طاقة الحوسبة الخاصة بالشركة المصنعة وطبقة النموذج تخطيط مكدس كامل لطبقة التطبيق. أطلقت Alibaba Cloud مجتمع GPT مفتوح المصدر على نطاق واسع ، كما وضعت Huawei Cloud و Baidu Cloud و Tencent Cloud خططًا.

بشكل عام ، سواء كانت صناعة أو جنرال موتورز ، إلى C أو B ، يمنحنا اختبار نصف العام للنموذج الكبير شعورًا مباشرًا بصعوبة التنفيذ ، وتوقع الربح يتراجع باستمرار ؛ الخطر يزداد أقوى ، ومن الصعب تحديد الحاجز التقني. إذن ، أين السبيل إلى كسر الوضع الحالي؟

في الوقت الحالي ، هناك اتجاهان مثيران للاهتمام. أحدهما هو قاعدة بيانات المتجه المعروفة باسم "الذاكرة في عصر الذكاء الاصطناعي" ، والآخر هو العتاد الذكي الذي يمنحه ذكاء النموذج.

يشير ما يسمى بالمتجه إلى البيانات متعددة الأبعاد التي يمكن أن تمثل أي شيء ، بما في ذلك النصوص والصور ومقاطع الفيديو والأصوات الأكثر أهمية في تدريب LLM اليوم. يتم تمثيل هذه الأشكال من المحتوى بوضوح في قاعدة البيانات وتدعم الاسترجاع الدلالي ، أي الاسترجاع عن طريق التشابه ، على سبيل المثال رجل مقابل صبي. بمعنى آخر ، بالنسبة للنماذج الكبيرة ، فإن استرجاع المتجه هو تحسين محركات البحث للنماذج الكبيرة.

كما ذكر أعلاه ، يمكن أن تحسن المعرفة بالمجال بناء واستخدام نماذج الصناعة من خلال قدرات قاعدة بيانات المتجهات أو الضبط الدقيق أو المكونات الإضافية. منذ شهر مايو ، يتدفق رأس المال إلى المسارات المتعلقة ببيانات المتجه ، وكمنتج طبقة تطبيق مع احتمالية أكثر تأكيدًا ، تلقت بيانات المتجه أيضًا اهتمامًا وثيقًا من العديد من VCs.

أما بالنسبة للنموذج المدمج للأجهزة الذكية ، فهو قفزة في القدرات مقارنة بالمساعدات الذكية السابقة مثل "سيري" و "شياوواي" ، كما أنه امتداد للأجهزة الذكية الحقيقية (الهواتف المحمولة وأجهزة الكمبيوتر). في مجتمع المصادر المفتوحة ، كانت هناك محاولات لبناء نماذج ذات معلمات كبيرة في أجهزة MAC ، في حين أن الشركات المصنعة الكبرى قد تراكمت قدرًا معينًا من الطاقة الإنتاجية للأجهزة في عصر الإنترنت عبر الهاتف المحمول الماضي ، وبشكل نسبي ، فإن ميزة المحرك الأول لديهم أكثر وضوحًا .

بدون أسلوب الكتابة في الربيع والخريف على غرار العلاقات العامة ، لم تعد النماذج الكبيرة التي أصبحت المتطلبات الأساسية غامضة ، وأصبحت القصص أقل وأقل. ولا يزال لاعبو المضمار الذين بدأوا في "الغوص العميق" اعمل بجد. تحتاج الصناعة إلى لحظة "ChatGPT" التالية قبل أن نرى الغواصين يطفو على السطح ويواجههم بشكل مباشر.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت