النماذج الكبيرة ليست أليفة للعمالقة

مصدر المقال: النمر شم

المؤلف: كريك

مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود

تتصاعد حرب 100 نموذج ، لكن العديد من الممارسين لديهم المزيد والمزيد من الأسئلة حول النماذج الكبيرة.

في مجال النماذج الكبيرة الأساسية ، تدفقت Tencent و Alibaba و Baidu وغيرها من عمالقة الإنترنت ، وأصدرت Alibaba و Baidu و iFLYTEK وغيرها من الشركات المصنعة الكبيرة على التوالي أحدث إصدارات منتجات النماذج الكبيرة في الشهر الماضي ، كما تم تحسين قدراتها التقنية بشكل كبير ؛ الشركات الناشئة تكرر على الإصدار الجديد في نفس الوقت ، ولكن أيضا التمويل "المجنون" ، أعلنت Zhipu الذكاء الاصطناعي مؤخرا أن هذا العام قد تلقى ما مجموعه 2.5 مليار يوان في التمويل ، التي أنشئت ما يقرب من نصف عام تلقت Baichuan Intelligence 350 مليون دولار أمريكي في التمويل ، من بين مستثمري هذه الشركات الناشئة ، هناك أيضا Tencent و Alibaba و Meituan وغيرها من عمالقة الإنترنت.

هل تحتاج الصين حقا إلى العديد من النماذج الأساسية؟ جميع شركات النماذج الكبيرة الأساسية مجنونة بالمعايير التقنية "المتداولة" ، ولكن ما نوع النموذج الكبير الذي يحتاجه السوق؟ في حالة المعركة الحيوية والفوضوية ، يتم طرح هذه الأسئلة من قبل المزيد والمزيد من الناس.

للإجابة على هذا السؤال ، يجب أن نفهم أولا كيف يجني النموذج الكبير الأساسي المال في السوق الصينية. على الرغم من أن الغالبية العظمى من تصور الناس للنماذج الكبيرة هي روبوتات محادثة ، ويبدأ العديد من المستخدمين في استخدام هذه المنتجات عند البحث عن المعلومات وتنظيم المستندات ، إلا أنه من الصعب على الشركات ذات الصلة جني الأموال من منتجات C-end هذه ، وحتى كلما زاد حجم المستخدم ، زاد عدد الشركات التي تخسر المال. ** في الوقت الحاضر ، لا يزال الاتجاه الأكثر واقعية لتسويق النماذج الكبيرة الأساسية على الجانب B ، حيث يخدم الشركات في مجالات البيع بالتجزئة والتمويل والتصنيع وغيرها من المجالات لخفض التكاليف وتحسين الكفاءة ، من أجل الحصول على دخل تجاري ثابت. **

هناك ثلاثة أنواع فقط من الاحتياجات للنماذج الكبيرة الأساسية: ** اتصل مباشرة بواجهة برمجة تطبيقات النموذج الكبير للحصول على قدرات النموذج الكبير ذات الصلة ؛ بناء على النموذج الكبير ، يتم تنفيذ التطوير الثانوي بما يتماشى مع الأعمال الفعلية ؛ تطوير تطبيقات الذكاء الاصطناعي تعتمد على نماذج كبيرة. ** تختبر هذه المتطلبات القدرات التقنية لمنصة النموذج الكبير الأساسية ، وتختبر أيضا قدرات خدمة المؤسسة الخاصة بها.

من منظور قدرات الخدمة ، يجب أن تبدأ الشركات الناشئة النموذجية واسعة النطاق وعمالقة الإنترنت من الصفر ، ولا أحد لديه ميزة فطرية. يمكن أن تبرز المنصات التي يمكنها اكتساب نظرة ثاقبة أسرع لاحتياجات العملاء وتقديم خدمات مستقرة وموثوقة.

** النماذج الكبيرة ليست "في مهب" **

مع شعبية ChatGPT كنقطة ترسيم ، شهد تطوير النماذج الكبيرة المحلية يومين.

قبل أن تصبح ChatGPT شائعة ، كان عدد قليل فقط من الشركات المحلية تعمل في البحث والتطوير للنماذج الكبيرة الأساسية ، لأن التكنولوجيا وقدرات الخدمة للنماذج الكبيرة لم يتم قبولها على نطاق واسع من قبل السوق ، وتركز هذه الشركات بشكل أساسي على البحث والتطوير التكنولوجي وتراكم قدرات الخدمة. عندما أصبح ChatGPT شائعا ، تدفق عدد كبير من المستثمرين والممارسين ، وأصبحت النماذج الكبيرة منفذا جديدا.

من السهل أن يؤدي السوق الساخن إلى ظهور المضاربين ، الذين لا يتعمقون في التكنولوجيا ، ولكنهم يروون القصص ومفاهيم الضجيج ، بغض النظر عن التكنولوجيا وقدرات الخدمة ، أولا يروون القصة إلى السماء ، وبهذه الطريقة يكتسبون اعتراف سوق رأس المال والعملاء. أخبر ممارس نموذج كبير مازحا Tiger Sniff أن العديد من شركات النماذج الكبيرة في الصين تدعي أن الفجوة بينها وبين GPT-4 ليست سوى بضعة أشهر ، وهذا لأنهم قاموا ببعض التدريب على أساس GPT-2 الذي كان مفتوح المصدر ويخرج لرواية القصص.

في الواقع ، لا يمكن تحقيق تطور القدرات التقنية للنماذج الكبيرة من خلال التدريب لبضعة أشهر ، لأن هذا نظام معقد ، ومن المهم جدا أن يكون لديك نطاق واسع ، ومن المستحيل إنتاج تطور أكثر ذكاء بدون مقياس معين. ومع ذلك ، فإن زيادة نطاق التدريب للنماذج الكبيرة يتطلب الكثير من الوقت وتصحيح الأخطاء المتكرر. يفهم الفنيون الذين قاموا بتصحيح معلمات التدريب للنماذج الكبيرة هذه الصعوبة: لا أحد يخبرك بما يجب عليك فعله ، عليك معرفة ذلك بنفسك ، وتنشأ جميع أنواع المواقف غير المتوقعة في العملية التي تستغرق وقتا لحلها.

** في الصين ، تم تدريب النماذج الكبيرة الأساسية التي لديها ثقة حقيقية في القدرات التقنية قبل أن يصبح ChatGPT شائعا ** ، في ذلك الوقت ، لم يكن النموذج الكبير معروفا جيدا للجميع ، ولم يفهم الكثير من الناس ولم يكونوا متفائلين بشأن النموذج الكبير ، وكانت الشركات التي أصرت على الاستثمار في النموذج الكبير متأكدة جدا من التكنولوجيا الجديدة.

على سبيل المثال ، في عام 2020 ، أطلقت KLCII أول مشروع بحثي نموذجي واسع النطاق تم تدريبه مسبقا ، Wudao ، وأصبح نسخته 2.0 أكبر نموذج على مستوى تريليون في العالم. بعد الترقية هذا العام ، يغطي "Wudao" النماذج الكبيرة الأساسية مثل اللغة والرؤية والوسائط المتعددة ، وقد دخل مرحلة المصدر المفتوح الكامل.

طورت Zhipu الذكاء الاصطناعي أيضا بنية GLM قبل التدريب في عام 2020 ، كما دربت نموذجا GLM-10B بعشرات المليارات من المعلمات. في 27 أكتوبر ، أصدرت Zhipu الذكاء الاصطناعي نموذج الحوار المطور ذاتيا من الجيل الثالث ChatGLM3 ، والذي حسن بشكل كبير من أدائه وقدرته على الاستدلال وقدرته على السياق مقارنة بالجيل السابق. بالمقارنة مع ChatGLM2 ، احتل ChatGLM3 المرتبة الأولى بين 44 مجموعة بيانات عامة باللغتين الصينية والإنجليزية في الصين. من بينها ، زادت MMLU بنسبة 36٪ ، وزادت C بنسبة 33٪ ، وزادت GSM8K بنسبة 179٪ ، وزادت BBH بنسبة 126٪.

بالإضافة إلى ذلك ، من حيث الوظائف ، فإن عددا من النماذج الكبيرة المطورة محليا (ChatGLM و CodeGeeX و WebGLM و CogVLM وما إلى ذلك) التي أصدرتها Zhipu الذكاء الاصطناعي هي أيضا النماذج الكبيرة الأكثر اكتمالا في سلسلة OpenAI في الصين ، وهي قابلة للتطبيق على مساعد الذكاء الاصطناعي التوليدي "Zhipu Qingyan".

هذه الدفعة الأولى من الشركات التي تصنع نماذج كبيرة تختلف اختلافا جوهريا عن الشركات التي تتكهن بالمفاهيم وتطارد الريح. عندما لا تنفجر تقنية النموذج على نطاق واسع بعد ولم يكن السوق متقلبا بعد ، فإنهم يشاركون فيها لأنهم اكتشفوا القيمة التقنية ومنطق الأعمال للنموذج الأساسي واسع النطاق. هذا الاختلاف واضح جدا أيضا بعد شعبية النموذج الكبير ، حيث تشارك العديد من الشركات في منتجات C-end من أجل حركة المرور والموضوعية ، في حين أن الشركات الأولى مثل Zhipu الذكاء الاصطناعي تركز بشكل أكبر على مجال خدمات المؤسسات ، كما يتم وضع جميع قدرات البحث والتطوير وقدرات الخدمة حول هذه الفكرة ، وهي تتراكم بطريقة واقعية ، وتتطور في اتجاه خلق قيمة للعملاء.

** يحدد تعقيد النموذج الكبير أن الشركات التي تراكمت لديها قدرات التكنولوجيا والخدمات لفترة أطول تتمتع بميزة أقوى. عندما يدرك المزيد والمزيد من الناس في السوق مدى تعقيد النماذج الكبيرة والوقت اللازم لتطور النماذج الكبيرة ، فإن تلك الشركات النموذجية الكبيرة التي تعتمد على سرد القصص لقلي المفاهيم سيكون لديها مساحة أقل وأقل للبقاء ، ويمكن للشركات التي تجمع بجدية قدرات التكنولوجيا والخدمات أن تصمد أمام اختبار الموجة الأولى من المنافسة.

**لا يوجد نموذج كبير لبيئة مزدهرة ولا مستقبل **

** في عملية تسويق النماذج الكبيرة ، سيكون كل من يمكنه الهبوط في سيناريوهات التطبيق التي لها احتياجات جامدة للمجتمع أول من يشكل دائرة حميدة من تكون الدم الذاتي. **

يحتوي النموذج العام الكبير على مجموعة واسعة من التطبيقات ، ولكنه ليس متخصصا بما يكفي لحل مشكلات محددة في المجالات الرأسية. تتمتع النماذج الرأسية الكبيرة بقدرة أقوى على حل المشكلات الخاصة بالمجال ، لكن نطاق الخدمات محدود للغاية ، مما يجعل من الصعب على العديد من النماذج الكبيرة الرأسية تحقيق توازن بين التكلفة وفوائد الأعمال ، كما أن مساحة التطوير محدودة.

النقطة الأخيرة لتطبيق النماذج الكبيرة هي استخدامها في الحياة والإنتاج ، لحل المشكلات العملية في العمل والحياة ، وتحسين كفاءة العمل والإنتاجية. استنادا إلى مزايا وعيوب النموذج العام الحالي والنموذج الرأسي ، فإن الفكرة الأكثر ملاءمة في عملية التسويق الحالية للنموذج هي فتح قدرات التكنولوجيا والخدمات مفتوحة المصدر للبيع بالتجزئة والتمويل والتصنيع وغيرها من المجالات ، ويعمل النموذج العام والمؤسسات في المجالات ذات الصلة معا لبناء سيناريوهات التطبيق. **

مع مراعاة القيود مثل البيانات وقوة الحوسبة والسيناريوهات ، لا يوجد الكثير من النماذج الكبيرة التي يمكن تشغيلها حقا من خلال المصدر المفتوح. في الوقت نفسه ، كقاعدة تقنية أساسية ، فإن دور النموذج الكبير مشابه جدا لأنظمة تشغيل أجهزة الكمبيوتر والهواتف المحمولة ، وسيقدم نمطا تنافسيا "تحت الشجرة الكبيرة ، وليس بوصة واحدة من العشب" ، أي أن قاعدة تقنية واحدة أو اثنتين تحتل مكانة مهيمنة في الصناعة ، ويجب على جميع مطوري التطبيقات التطوير بناء على هاتين القاعدتين التقنيتين. إذا لم يتمكن نموذج القاعدة من تشكيل بيئة مزدهرة ، فلن تكون هناك قدرة على التنمية المستدامة.

انطلاقا من تاريخ تطوير أنظمة تشغيل أجهزة الكمبيوتر والهواتف المحمولة ، فإن ميزة المحرك الأول مهمة للغاية. عندما يهيمن Windows على سوق أجهزة الكمبيوتر الشخصية ، وينقسم iOS و Android إلى عالمين في مجال الهاتف المحمول ، يصعب على أنظمة التشغيل الأخرى أن يكون لديها مجال للتحول.

ويلاحظ نفس الاتجاه أيضا في مجال النماذج الكبيرة. ستفتح الطرز الكبيرة نظاما بيئيا مزدهرا لتطبيقات الذكاء الاصطناعي ، ويمكن أن تصبح البيانات أو القدرات أو التطبيقات الشخصية والمؤسسية مكونات إضافية الذكاء الاصطناعي بسرعة ، مما يعزز قدرات الطرز الكبيرة ويجعل النماذج الكبيرة أكثر عملية وسهولة في الاستخدام.

في الوقت الحاضر ، التزمت Baidu و iFLYTEK وغيرها من الشركات العملاقة بالبناء البيئي ، ومنصة Baidu الذكية الذكية Qianfan ذات النموذج الكبير 2.0 شهريا من الشركات النشطة لما يقرب من 10000 ، والتي تغطي أكثر من 400 سيناريو في التمويل والتعليم والتصنيع والطاقة والشؤون الحكومية والنقل وغيرها من الصناعات ، وقد تجاوز مقياس مطور منصة النموذج الكبير Spark من iFLYTEK 700000.

بعض الشركات الناشئة التي تراكمت لفترة طويلة في مجال النماذج الكبيرة هي أيضا أول من يأكل سرطان البحر. في الوقت الحاضر ، لدى Zhipu الذكاء الاصطناعي أكثر من 1000 عميل وأكثر من 100 شريك لبناء نظام بيئي ، يغطي سيناريوهات متعددة مثل وسائل الإعلام ، SaaS ، التعليم ، والمكتب. على سبيل المثال ، وراء قدرات إنشاء المستندات الذكية WPS لمحتوى العرض التقديمي وكتابة البيانات الصحفية ، هناك القدرة التقنية ل Zhipu الذكاء الاصطناعي كدعم.

في المنافسة البيئية لمختلف المنصات النموذجية واسعة النطاق ، فإن أهم اختبار للمنصة هو القيمة التي تجلبها للشركاء والقدرة على النمو مع الشركاء. بقدر ما يتعلق الأمر بسيناريو المكتب ، فإن إنشاء محتوى العروض التقديمية ، وكتابة محتوى المقالة ، وإعادة كتابة الأسلوب لها متطلبات عالية جدا للدقة وقدرات التفكير لمنصة النموذج الكبير ، وفقط النموذج الكبير الذي وصل إلى مستوى تقني معين يمكن أن يكون لديه القدرة على دعم هذه التطبيقات ، وتحتاج منصة النموذج الكبير أيضا إلى تصحيح الأخطاء والتكرارات وفقا لتعليقات المستخدمين في التطبيقات الفعلية.

** سواء كانت شركة عملاقة أو شركة ناشئة ، بغض النظر عن مدى قوة رأس المال والموارد ، فمن الضروري التجميع والتكرار خطوة بخطوة من الصفر. لذلك ، في عملية بناء نظام بيئي لمنصات النماذج الكبيرة ، فإن ميزة الوقت مهمة للغاية. هذا هو السبب أيضا في أن الشركات الناشئة التي تتمتع بمزايا المحرك الأول وعمالقة الإنترنت ذوي الموارد المالية الأقوى يمكن أن تتنافس على قدم المساواة.

** 100 نموذج الحرب ، من هو الأنسب للسوق الصينية؟ **

على الرغم من أن حالة المعركة في حرب 100 نموذج حية وفوضوية ، إلا أن اتجاه المنافسة وراءها واضح للغاية ، والقدرات الفنية والخدمية وقدرة المنصة النموذجية الكبيرة على بناء نظام بيئي تحدد اتجاه المنافسة بشكل مباشر.

يستغرق بناء هذه القدرات وقتا لتتراكم ، ومن الصعب تحقيقها بين عشية وضحاها ، لكن لا يكفي تجميعها بمرور الوقت. ميزة المحرك الأول ، بالإضافة إلى فارق التوقيت الناجم عن العمل المبكر ، لديها أيضا القدرة على إدراك طلب السوق بدقة ، أي التصرف بحزم وبسرعة وفقا لاستراتيجية صحيحة ، ويمكن أن يستهلك التأرجح الاستراتيجي والطرق الالتفافية بسهولة مزايا الوقت المتراكمة من خلال العمل المبكر.

عندما تحول المزيد والمزيد من المنصات النموذجية الكبيرة تركيزها إلى البناء البيئي ، سيصبح التحديد الاستراتيجي وتنفيذ المنصة أكثر أهمية في المنافسة البيئية. ** عندما تكمل بعض المنصات التغيير النوعي إلى المنصات الفائقة ، يتم تحديد المشهد التنافسي بشكل أساسي.

في السوق المحلية الكبيرة والمعقدة ، تكون شركات الخدمات B-end عرضة للتقلبات والطرق الالتفافية الاستراتيجية. من ناحية ، تختلف المناطق ومقاييس الأعمال للمؤسسات في السوق المحلية ، ويختلف تصور قيمة النماذج الكبيرة لذكاء المؤسسة تماما ، كما أن الموارد والتكاليف التي يرغبون في استثمارها مختلفة أيضا ، لذلك من الصعب إيجاد حل موحد ؛ من ناحية أخرى ، فإن الشركات في مختلف المجالات لديها احتياجات مختلفة لقدرات النماذج الكبيرة ، وحتى المؤسسات المختلفة في نفس المجال لديها احتياجات مختلفة للنماذج الكبيرة.

في مثل هذه البيئة ، مقارنة بخطة التسويق الخاصة ب OpenAI ، يتطلب تسويق منصات النماذج المحلية واسعة النطاق مزيدا من الاهتمام بالتفاصيل. نرى مثل هذا الاتجاه في أفكار التسويق لبعض المنصات.

على سبيل المثال ، بالإضافة إلى خدمات API للمنصة المفتوحة الشائعة ، توفر Zhipu الذكاء الاصطناعي أيضا حلين: الخصخصة السحابية والخصخصة المحلية. ** يمكن أن تساعد الخصخصة السحابية الشركات على بناء نماذجها الكبيرة الخاصة بناء على البيانات الخاصة بأمان أقوى، في حين أن الخصخصة المحلية هي حل فريد في السوق الصينية، بالإضافة إلى توفير نموذج أكثر قوة، فإنها توفر أيضا مصفوفة نموذجية كاملة لتلبية مختلف السيناريوهات والاحتياجات. **

استجابة لاحتياجات العملاء المختلفة مثل إنشاء المقالات وخدمة العملاء الذكية والتعليقات التوضيحية للبيانات ، بالإضافة إلى حجم المؤسسات الكبيرة والمتوسطة والصغيرة ، توفر Zhipu الذكاء الاصطناعي حلولا مختلفة ، والتي يمكن للعملاء دمجها بحرية وفقا لاحتياجاتهم الخاصة. يعتمد نموذج الخدمة الأكثر تفصيلا ومرونة هذا أيضا على رؤية دقيقة طويلة الأجل للسوق الصينية.

في مواجهة عدم اليقين في البيئة الخارجية ، أطلقت Zhipu الذكاء الاصطناعي أيضا خطة تكيف الرقائق المحلية ، بالتعاون مع مصنعي الأجهزة المحليين ومصنعي الرقائق لتوفير مستويات مختلفة من الشهادات والاختبار لأنواع مختلفة من المستخدمين وأنواع مختلفة من الرقائق ، وذلك لجعل خدمات النماذج الكبيرة أكثر أمانا وموثوقية. في الوقت الحاضر ، دعمت سلسلة ChatGLM أكثر من 10 أنواع من النظم الإيكولوجية للأجهزة المحلية ، بما في ذلك Ascend و Shenwei Supercomputer و Haiguang DCU و Haifeike و Muxi Xiyun و Computing Technology و Tiantian Zhixin و Cambrian و Moore Threads و Baidu Kunlun Core و Lingxi Technology و Great Wall Chaoyun ونموذج الاختبار النهائي القابل للنشر للهاتف المحمول الذي تم إصداره في وقت واحد ChatGLM3-1.5B و 3B يدعم Xiaomi و vivo و Samsung وغيرها من الهواتف المحمولة ومنصات المركبات.

كلما كانت المعركة أكثر شراسة في حرب نموذج 100 ، زادت أهمية هذه التفاصيل التي تبدو غير واضحة ، لأن هذه التفاصيل تحدد درجة الاعتراف بالشركاء الخارجيين ، وتؤثر أيضا على سرعة هبوط النماذج الكبيرة في سيناريوهات مختلفة. إن عتبة إطلاق نموذج كبير ببساطة ليست عالية كما يتخيل السوق ، ولكن من الممكن أن يكون لديك سيناريوهات بيانات عالية الجودة من أجل الاستمرار في التكرار وتشكيل حواجز تنافسية ، ويكمن مفتاح سيناريوهات البيانات عالية الجودة في الشركاء الخارجيين - النظام الأساسي الذي يرغب المزيد من الشركاء في اختياره يجعل من السهل تشغيله خلال دورة الأعمال هذه.

في هذه المسابقة ، يعتقد العديد من الممارسين أن الفائز يجب أن يكون الشركة العملاقة ذات الموارد والقدرات المالية الأقوى ، لكنها ليست كذلك. تحتاج الشركات الناشئة والعمالقة على حد سواء إلى السير في الحيل والوصول إلى الجزء السفلي من التفاصيل ، ولا توجد طرق مختصرة. أما بالنسبة للتمويل ، فهو ليس أصل المعركة الحاسمة ، لأن الشركات الناشئة ذات القدرة التنافسية الأساسية لن تعاني من نقص في المال - حتى لو تلقت Zhipu الذكاء الاصطناعي أكبر قدر من التمويل من الشركات الناشئة النموذجية واسعة النطاق ، فهناك المزيد من المستثمرين الجدد الذين يرغبون في دخول اللعبة.

إذا فكرت في الأمر من زاوية أخرى ، في الواقع ، فإن سوق رأس المال يصوت بالفعل بقدميه فيما يتعلق بمن هو أكثر ملاءمة لنموذج قاعدة التمثال للشركات الصينية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت