يبلغ حجم السوق لمدة 10 سنوات 1.3 تريليون دولار أمريكي ، وقد حان عصر القوة المعيارية

المصدر الأصلي: كيوبيتس

مصدر الصورة: تم إنشاؤه بواسطة الذكاء الاصطناعي غير محدود

هبت العاصفة النموذجية الكبيرة لمعظم العام ، وبدأ سوق AIGC في التغير مرة أخرى:

يتم استبدال العروض التوضيحية التقنية الرائعة بتجارب المنتج الكاملة. **

على سبيل المثال ، أحدث نموذج رسم الذكاء الاصطناعي من OpenAI DALL · بمجرد ظهور E 3 لأول مرة ، انضمت إلى ChatGPT لتصبح أداة الإنتاجية الجديدة الأكثر توقعا في ChatGPT Plus.

** **###### دال· E3 يعيد إنتاج كل تفاصيل إدخال النص بدقة

على سبيل المثال ، تم تسوية Copilot من Microsoft المستند إلى GPT-4 بالكامل في نظام التشغيل Windows 11 ، ليحل محل Cortana رسميا كجيل جديد من مساعدي الذكاء الاصطناعي في نظام التشغيل.

** **####### استخدم Copilot لتلخيص منشورات المدونة بنقرة واحدة

على سبيل المثال ، قامت السيارات المحلية مثل Jiyue 01 بتجهيز نماذج كبيرة رسميا في قمرة القيادة ، وهي غير متصلة بالإنترنت تماما ...

إذا كانت "النماذج الكبيرة تعيد تشكيل كل شيء" في مارس 2023 مجرد تنبؤ متفائل لرواد التكنولوجيا ، فإن الحرب التي لا تزال شرسة من 100 نموذج والتقدم العملي في التطبيق جعلت هذا الرأي أكثر صدى داخل وخارج الصناعة.

بمعنى آخر ، من طريقة إنتاج الإنترنت بأكملها إلى قمرة القيادة الذكية في كل سيارة ، يأتي عصر من الابتكار الذاتي مع نماذج كبيرة كقاعدة تقنية وقيادة آلاف الصناعات.

وفقا لطريقة تسمية عصر البخار والعصر الكهربائي ، يمكن تسميته "عصر القوة المعيارية".

في "عصر مولي" ، أحد أكثر السيناريوهات إثارة للقلق هو ** المحطة الذكية **.

السبب بسيط: صناعة المحطات الذكية ، ممثلة في الهواتف الذكية وأجهزة الكمبيوتر والسيارات الذكية وحتى أجهزة XR ، هي واحدة من الصناعات التكنولوجية الأكثر ارتباطا بحياة الناس المعاصرة ، وبطبيعة الحال أصبحت معيارا ذهبيا لاختبار نضج التقنيات المتطورة.

لذلك ، عندما تهدأ الموجة الأولى من الضجيج التي أحدثتها الطفرة التكنولوجية تدريجيا ، مع سيناريو المحطة الذكية كمرساة ، كيف ينبغي النظر إلى الفرص والتحديات الجديدة ل "عصر الطاقة المعيارية" وتفسيرها؟

الآن ، حان الوقت لتفكيكها وعجنها وتمشيطها.

**محطة ذكية ، ساحة معركة جديدة من الطراز الكبير **

قبل تحليل التحديات والفرص بالتفصيل ، دعنا نعود إلى السؤال الأساسي: لماذا تحظى الذكاء الاصطناعي التوليدية ممثلة بنماذج كبيرة بشعبية كبيرة ، وحتى تعتبر "الثورة الصناعية الرابعة"؟

استجابة لهذه الظاهرة ، تجري العديد من المؤسسات أبحاثا لمحاولة التنبؤ أو تلخيص تطور الذكاء الاصطناعي التوليدية في سيناريوهات مختلفة ، مثل "الذكاء الاصطناعي التوليدية: عالم جديد إبداعي" لشركة سيكويا كابيتال.

من بينها ، قامت العديد من الشركات الرائدة في الصناعة بتحليل سيناريوهات الهبوط واتجاهات التغيير المحتملة الذكاء الاصطناعي التوليدية في صناعات محددة بناء على تجربتها الخاصة.

على سبيل المثال ، يمثل الذكاء الاصطناعي الجانب الطرفي اللاعب Qualcomm ، وقد أصدر منذ بعض الوقت ورقة بيضاء حول حالة التطوير واتجاه الذكاء الاصطناعي التوليدية "Hybrid الذكاء الاصطناعي هو مستقبل الذكاء الاصطناعي".

من هذا ، قد يكون من الممكن تفسير الأسباب الرئيسية الثلاثة التي تجعل الذكاء الاصطناعي التوليدية شائعة في الصناعة.

بادئ ذي بدء ، التكنولوجيا نفسها صعبة بما فيه الكفاية.

سواء كان نموذجا كبيرا يظهر بذكاء أو لوحة الذكاء الاصطناعي تولد جودة مزيفة بجودة مزيفة ، فإن الأمر كله يتعلق باستخدام التأثيرات للتحدث ، وهي منطقة عمل حقيقية تتعلق بالنصوص والصور والفيديو والأتمتة ، مما يدل على قدرة مذهلة على تعطيل سير العمل التقليدي.

ثانيا ، هناك سيناريوهات هبوط محتملة غنية. إن اختراق الأجيال الذكاء الاصطناعي الذي جلبه النموذج الكبير قد جلب للناس خيالا لا نهائيا منذ البداية: سرعان ما أدركت الدفعة الأولى من ذوي الخبرة فوائد الذكاء الاصطناعي التوليدية للعمل.

يمكن رؤية الطلب الهائل من جانب المستخدم من معدل نمو المستخدم للتطبيقات التمثيلية مثل ChatGPT.

** **#### حطم ChatGPT الرقم القياسي لأكثر من 100 مليون مستخدم مسجل للتطبيقات الشعبية ، المصدر سيكويا كابيتال

من البحث الأولي على الإنترنت ، والبرمجة ، والمكتب ، إلى ظهور السياحة الثقافية ، والقانون ، والطب ، والصناعة ، والنقل وغيرها من تطبيقات المشهد ، وركوب رياح الذكاء الاصطناعي التوليدية ، أكثر بكثير من الشركات التي يمكنها توفير نماذج كبيرة أساسية ، ولكن أيضا عدد كبير من الشركات الناشئة تزدهر وتنمو.

يعتقد العديد من خبراء الصناعة أنه بالنسبة لرواد الأعمال ، فإن طبقة التطبيق التي تجلبها النماذج الكبيرة لديها فرص أكبر.

هناك اختراق للأجيال للتكنولوجيا في القاع ، وانفجار قوي في الطلب على التطبيق في الأعلى ، ويتم تحفيز ** التأثير البيئي **.

وفقا لتوقعات بلومبرج إنتليجنس ، فإن سوق الذكاء الاصطناعي التوليدية سوف ينفجر من 40 مليار دولار إلى 1.3 تريليون دولار ** بحلول عام 2032 ، ويغطي مجموعة واسعة من المشاركين في السلسلة البيئية ، بما في ذلك البنية التحتية والنماذج الأساسية وأدوات المطور ومنتجات التطبيقات والمنتجات الطرفية وما إلى ذلك.

وقد عزز تشكيل هذه السلسلة البيئية تغييرات جديدة في الصناعة ومن المتوقع أن يجعل الذكاء الاصطناعي تصبح الإنتاجية الأساسية الأساسية.

بناء على هذه الخلفية ، دعونا نلقي نظرة على ما يحدث في الصناعة الذكية اليوم.

من ناحية ، فإن عاصفة تطبيق AIGC التي تمثلها نماذج كبيرة تكون بسرعة ** من السحابة إلى المحطة ** في إيقاع التكرار للأيام.

ChatGPT هو أول من قام بتحديث الوظيفة متعددة الوسائط ل "الحديث السمعي البصري" على محطة الهاتف المحمول ، ويمكن للمستخدمين التقاط الصور وتحميلها ، ويمكنهم التحدث إلى ChatGPT لمحتوى الصورة.

على سبيل المثال ، "كيفية ضبط ارتفاع مقعد الدراجة":

** **#### وحوار رسومي GPT-4 ، قدم 5 اقتراحات في ثوان

أدركت كوالكوم أيضا بسرعة النموذج الكبير من Stable Diffusion و ControlNet الذي يشغل أكثر من مليار معلمة على الجانب الطرفي ، ولا يستغرق الأمر سوى أكثر من اثنتي عشرة ثانية لإنشاء صور الذكاء الاصطناعي عالية الجودة على الهواتف المحمولة.

كما أعلن العديد من مصنعي الهواتف المحمولة أنهم سيقومون بتثبيت "دماغ" الطرز الكبيرة لمساعديهم الصوتيين.

وهي ليست مجرد هواتف.

في المعارض واسعة النطاق في الداخل والخارج ، مثل معرض شنغهاي للسيارات ، معرض تشنغدو للسيارات ، معرض ميونيخ للسيارات ، وما إلى ذلك ، أصبح التعاون بين مصنعي النماذج الأساسية ومصنعي السيارات أكثر شيوعا ، وأصبح الطراز الكبير "الحصول على السيارة" نقطة منافسة جديدة في مجال قمرة القيادة الذكية.

** **####### جملة واحدة يمكن أن تجعل طراز السيارة يشتري المكونات في التطبيق ، ويمكنك الطهي عندما تعود إلى المنزل

من ناحية أخرى ، أدى اندلاع تطبيقات ** إلى تفاقم الوضع الذي تعاني منه قوة الحوسبة من نقص. **

ومن المتوقع أن تزداد تكلفة الاستدلال للنموذج مع زيادة عدد المستخدمين النشطين يوميا وتواتر استخدامهم، كما أن الاعتماد فقط على قوة الحوسبة السحابية وحدها لا يكفي لتعزيز نطاق الذكاء الاصطناعي التوليدية بسرعة.

يمكن ملاحظة ذلك أيضا من حقيقة أن جميع مناحي الحياة تزيد من اهتمامها بقوة الحوسبة الذكاء الاصطناعي الطرفية.

على سبيل المثال ، أصدر مشغل الذكاء الاصطناعي الطرفي Qualcomm جيلا جديدا من منصة حوسبة الكمبيوتر الشخصي لتحسين أداء رقاقة الكمبيوتر الشخصي ، باستخدام وحدة المعالجة المركزية Oryon المطورة ذاتيا من Qualcomm ، وخاصة NPU المجهزة بها ستوفر أداء أكثر قوة الذكاء الاصطناعي التوليدية ، والتي تسمى منصة سلسلة Snapdragon X.

من المتوقع أن يتم إصدار منصة الحوسبة الجديدة هذه في قمة Snapdragon لعام 2023.

من الواضح ، سواء من منظور التطبيق أو قوة الحوسبة ، أصبحت المحطات الذكية واحدة من السيناريوهات ذات إمكانات الهبوط الأكبر لشركة AIGC.

** AIGC الشعاب المرجانية تحت المد **

غالبا ما يكون للأشياء جانبان ، وكذلك النماذج الكبيرة من التطور السريع إلى الهبوط.

عندما ارتفعت الذكاء الاصطناعي التوليدية على طول الطريق إلى اليوم ، ظهر عنق الزجاجة الحقيقي في ظل الإمكانات الهائلة لصناعة المحطات الذكية.

** أحد أكبر القيود هو أدنى مستوى من الأجهزة. **

كما ذكر مستثمرو سيكويا سونيا هوانغ وبات جرادي في أحدث مقال لتحليل الذكاء الاصطناعي التوليدية "الفصل الثاني من الذكاء الاصطناعي التوليدي" ، فإن AIGC تنمو بسرعة ، لكن عنق الزجاجة المتوقع ليس طلب العملاء ، ولكن قوة الحوسبة من جانب العرض.

تشير قوة الحوسبة هنا بشكل أساسي إلى مسرعات أجهزة الذكاء الاصطناعي والتعلم الآلي ، والتي يمكن تقسيمها إلى خمس فئات من منظور سيناريوهات النشر:

أنظمة من فئة مراكز البيانات ، ومسرعات على مستوى الخادم ، ومسرعات للقيادة المساعدة وسيناريوهات القيادة الذاتية ، وحوسبة الحافة ، ومسرعات الطاقة المنخفضة للغاية.

** **###### **△ ** 5 أنواع من مسرعات الذكاء الاصطناعي ، مصدر ورقة معهد ماساتشوستس للتكنولوجيا "مسح واتجاهات مسرع الذكاء الاصطناعي و ML"

مع انفجار ChatGPT ، دفع النموذج الكبير AIGC الهائل خارج الدائرة ، مما جعل "** قوة الحوسبة السحابية **" مثل مراكز البيانات والمعالجات على مستوى الخادم تحظى بالكثير من الاهتمام على المدى القصير ، وحتى حالة نقص العرض.

ومع ذلك ، مع دخول الذكاء الاصطناعي التوليدية مرحلتها الثانية ، أصبحت بعض الأسئلة حول قوة الحوسبة أكثر بروزا.

** المشكلة الأولى والأكبر هي التكلفة. ** كما هو مذكور في الورقة البيضاء "Hybrid الذكاء الاصطناعي is the Future of الذكاء الاصطناعي" من Qualcomm ، فقد مر الآن أكثر من نصف عام ، مع تحول النماذج الكبيرة من مطاردة التكنولوجيا إلى هبوط التطبيق ، استقر النموذج الأساسي ** التدريب ** لكل شركة تدريجيا ، وسقطت معظم قوة الحوسبة على ** المنطق ** للنماذج الكبيرة.

على المدى القصير ، تكون تكلفة الاستدلال مقبولة ، ولكن نظرا لوجود المزيد والمزيد من التطبيقات للنماذج الكبيرة والمزيد والمزيد من سيناريوهات التطبيقات ، فإن تكلفة الاستدلال على المسرعات مثل الخوادم ستزداد بشكل حاد ، مما يؤدي في النهاية إلى تكلفة استدعاء نماذج كبيرة أعلى من تدريب النماذج الكبيرة نفسها.

بمعنى آخر ، بعد دخول النموذج الكبير المرحلة الثانية ، سيكون الطلب طويل الأجل على قوة الحوسبة للاستدلال أعلى بكثير من التدريب الفردي ، والاعتماد فقط على "قوة الحوسبة السحابية" المكونة من مراكز البيانات والمعالجات على مستوى الخادم غير كاف تماما للوصول إلى الاستدلال بتكلفة مقبولة للمستخدمين.

وفقا لإحصائيات كوالكوم في الورقة البيضاء ، مع أخذ محرك البحث بنموذج كبير كمثال ، يمكن أن تصل تكلفة كل استعلام بحث إلى 10 أضعاف تكلفة الطرق التقليدية ، وقد تزيد التكلفة السنوية في هذا المجال وحده بمليارات الدولارات.

هذا مقدر له أن يصبح قيدا رئيسيا أمام هبوط النماذج الكبيرة.

** إلى جانب ذلك ، هناك مشكلات في زمن الوصول والخصوصية والتخصيص. ** ذكرت كوالكوم أيضا في "Hybrid الذكاء الاصطناعي is the Future of الذكاء الاصطناعي" أن النماذج الكبيرة يتم نشرها مباشرة في السحابة ، بالإضافة إلى عدم كفاية كمية حوسبة الخادم الناتجة عن زيادة عدد المستخدمين ، والحاجة إلى "قائمة انتظار للاستخدام" وغيرها من الأخطاء ، فهي ملزمة أيضا بحل مشاكل خصوصية المستخدم والتخصيص.

إذا كان المستخدمون لا يرغبون في تحميل البيانات إلى السحابة ، فستخضع سيناريوهات استخدام النماذج الكبيرة ، مثل المكتب والمساعد الذكي ، للعديد من القيود ، ويتم توزيع معظم هذه السيناريوهات على الجانب الطرفي ؛ إذا كنت بحاجة إلى مزيد من السعي لتحقيق نتائج أفضل ، مثل تخصيص النماذج الكبيرة لاستخدامك الخاص ، فأنت بحاجة إلى استخدام المعلومات الشخصية مباشرة للتدريب على النماذج الكبيرة.

في ظل عوامل مختلفة ، بدأت "قوة الحوسبة الطرفية" التي يمكن أن تلعب دورا في التفكير ، أي عدة أنواع من المعالجات بما في ذلك القيادة التلقائية والقيادة المساعدة ، والحوسبة المتطورة (المضمنة) والمسرعات منخفضة الطاقة للغاية ، في دخول مجال رؤية الناس.

المحطات لديها قوة حوسبة ضخمة. وفقا لتوقعات IDC ، سيتجاوز عدد أجهزة إنترنت الأشياء العالمية 40 مليار بحلول عام 2025 ، مما يولد ما يقرب من 80 زيتابايت من البيانات ، ويحتاج أكثر من نصف البيانات إلى الاعتماد على قوة الحوسبة الطرفية أو الطرفية للمعالجة.

ومع ذلك ، فإن المحطة لديها أيضا مشاكل مثل الاستهلاك المحدود للطاقة وتبديد الحرارة ، مما يؤدي إلى قوة حوسبة محدودة.

في هذه الحالة ، أصبحت كيفية استخدام قوة الحوسبة الضخمة المخبأة في المحطة لاختراق عنق الزجاجة الذي يواجهه تطور قوة الحوسبة السحابية واحدة من أكثر المشكلات التقنية شيوعا في "عصر الطاقة المعيارية".

** ناهيك عن أنه بالإضافة إلى قوة الحوسبة ، يواجه تنفيذ النماذج الكبيرة أيضا تحديات مثل الخوارزميات والبيانات والمنافسة في السوق. **

بالنسبة للخوارزمية ، لا تزال بنية النموذج الأساسي غير معروفة. حققت ChatGPT نتائج جيدة ، لكن مسارها التقني ليس هو الاتجاه المعماري لنموذج الجيل التالي.

بالنسبة للبيانات ، لا غنى عن البيانات عالية الجودة للشركات الأخرى لتحقيق نتائج النموذج الكبير ل ChatGPT ، لكن القانون الثاني من Generative الذكاء الاصطناعي يشير أيضا إلى أن البيانات التي تم إنشاؤها بواسطة شركة التطبيق لا تخلق حاجزا حقا.

الميزة التي تبنيها البيانات هشة وغير مستدامة ، ومن المرجح أن يدمر الجيل القادم من النماذج الأساسية هذا "الجدار" بشكل مباشر ، في المقابل ، يمكن للمستخدمين المستمرين والمستقرين بناء مصادر البيانات حقا.

بالنسبة للسوق ، لا توجد حاليا تطبيقات قاتلة لمنتجات النماذج الكبيرة ، ولا يزال من غير المعروف نوع السيناريوهات المناسبة لها.

في هذا العصر ، ما نوع المنتجات التي يتم استخدامها فيها والتطبيقات التي يمكن أن تمارس أكبر قيمة لها ، لم يقدم السوق بعد مجموعة من المنهجيات أو الإجابات القياسية التي يمكن اتباعها.

** استجابة لهذه السلسلة من المشاكل ، هناك حاليا طريقتان رئيسيتان لحل المشكلات في الصناعة. **

الأول هو تحسين خوارزمية النموذج الكبير نفسه ، دون تغيير "جوهر" النموذج ، وتحسين حجمه بشكل أفضل ، وتعزيز قدرته على النشر على المزيد من الأجهزة ؛

بأخذ خوارزمية Transformer كمثال ، يجب تعديل هذه النماذج التي تحتوي على عدد كبير من المعلمات في الهيكل إذا كانت تريد تشغيلها على الجانب النهائي ، فقد ولدت العديد من الخوارزميات خفيفة الوزن مثل MobileViT خلال هذا الوقت.

تسعى هذه الخوارزميات إلى تحسين بنية وكمية المعلمات دون التأثير على تأثير الإخراج ، بحيث يمكن تشغيلها على المزيد من الأجهزة ذات الطرز الأصغر.

والآخر هو تحسين قوة الحوسبة الذكاء الاصطناعي للأجهزة نفسها ، بحيث يمكن للنماذج الكبيرة أن تهبط بشكل أفضل على الجانب النهائي.

وتشمل هذه الأساليب التصميم متعدد النواة على مكدسات برامج الأجهزة والتطوير ، والتي تستخدم لتحسين أداء حوسبة الأجهزة وتعدد استخدامات النماذج على الأجهزة المختلفة ، وذلك لتعزيز إمكانية هبوط النماذج الكبيرة على الجانب النهائي.

يمكن تسمية الأول بتكييف البرامج مع الأجهزة ، والأخير هو أن مصنعي الأجهزة يتكيفون مع تغير تيار العصر. ولكن في أي من الاتجاهين ، هناك خطر من تجاوزك من خلال المراهنة وحدها. **

في ظل "عصر القوة المعيارية" ، تتغير التكنولوجيا مع مرور كل يوم ، وقد تظهر اختراقات جديدة من أي من جانبي البرامج والأجهزة ، وبمجرد نقص الاحتياطيات التقنية اللازمة ، قد تتخلف عن الركب.

فهل يجب أن نتابع بشكل أعمى أو ببساطة نفوت تطور هذه الموجة من التكنولوجيا؟ ليس حقًا.

** بالنسبة للشركات التي اكتشفت قيمتها الخاصة في الإنترنت وعصر الذكاء الاصطناعي ، قد تكون قادرة أيضا على استكشاف فكرة حل ثالثة في عصر AIGC بناء على سيناريوهاتها الخاصة وتراكم التكنولوجيا. **

خذ كوالكوم ، وهي شركة الذكاء الاصطناعي مع كل من تقنيات البرامج والأجهزة ، كمثال.

في مواجهة تحديات تكنولوجيا النماذج الكبيرة في سيناريوهات مختلفة ، قفزت كوالكوم من هوية شركة رقائق واحتضنت موجة AIGC في وقت مبكر.

بالإضافة إلى التحسين المستمر لقوة الحوسبة الذكاء الاصطناعي للرقاقة الطرفية ، تضع كوالكوم أيضا تقنية الذكاء الاصطناعي الأساسية ، وتسعى جاهدة لتسريع سرعة صناعة المحطات الذكية بأكملها لاحتضان AIGC كمؤسسة تمكينية.

ومع ذلك ، هناك أيضا العديد من الصعوبات المتوقعة في هذا النهج:

بالنسبة لنماذج الذكاء الاصطناعي الأكبر والأكثر تعقيدا ، كيف تضمن الأداء مع جعلها تعمل بسلاسة على الجهاز؟

متى تستخدم نماذج مختلفة لتخصيص طاقة الحوسبة بشكل أفضل بين المحطات الطرفية والسحب؟

حتى إذا تم حل مشكلة النماذج الكبيرة التي يتم نشرها على جانب المحطة الطرفية ، فأي جزء يجب نشره في السحابة وأي جزء يجب نشره على المحطة الطرفية ، وكيفية ضمان عدم تأثر الاتصالات والوظائف بين الأجزاء المختلفة من النموذج الكبير؟

إذا كانت ميزة الأداء على الجانب الطرفي غير كافية ، فكيف يمكن حلها؟

......

لا تظهر هذه المشكلات في حالة واحدة ، ولكنها موجودة بالفعل في كل صناعة أو سيناريو يتأثر ب AIGC.

سواء كانت طريقة لكسر اللعبة أو تجربة هبوط فعلية ، لا يمكن استكشاف الإجابة إلا من سيناريوهات محددة وحالات صناعية.

**كيف نكسر ضباب "عصر الطاقة المعيارية"؟ **

دخلت AIGC المرحلة الثانية ، وأصبحت النماذج الكبيرة أكثر شعبية ، وبدأت الصناعة في استكشاف طرق للهبوط.

** ذكر المستند التقني "Hybrid الذكاء الاصطناعي is the Future of الذكاء الاصطناعي" من Qualcomm أنه بأخذ الهواتف الذكية وأجهزة الكمبيوتر كمثال ، كانت هناك العديد من حالات سيناريوهات هبوط AIGC في صناعة المحطات الذكية الجديدة في ساحة المعركة. **

تقوم الشركات بالفعل بنشر نماذج أصغر وأكبر على الجانب الطرفي لمزيد من المشكلات المخصصة ، بما في ذلك العثور على الرسائل وإنشاء رسائل الرد وتعديل أحداث التقويم والتنقل بنقرة واحدة.

على سبيل المثال ، "حجز مقعد مطعم مفضل" ، بناء على الطراز الكبير ، وفقا لتحليل بيانات المستخدم للمطاعم المفضلة والجداول الزمنية المجانية ، وتقديم توصيات الجدولة ، وإضافة النتائج إلى التقويم.

تعتقد كوالكوم أنه نظرا للكمية المحدودة من معلمات النموذج الكبيرة التي تنشرها المحطة الطرفية ونقص الشبكات ، فقد يكون هناك "وهم الذكاء الاصطناعي" عند الإجابة ، ومن ثم يمكن أن يعتمد على تقنية المنسق لتعيين حواجز الحماية عندما يفتقر النموذج الكبير إلى المعلومات لمنع المشاكل المذكورة أعلاه.

إذا لم تكن راضيا عن المحتوى الذي تم إنشاؤه بواسطة النموذج الكبير ، فيمكنك أيضا إرسال السؤال إلى السحابة للتنفيذ بنقرة واحدة ، ثم تقديم تعليقات على نتيجة إنشاء نموذج كبير مع إجابة أفضل على جانب المحطة الطرفية.

وبهذه الطريقة ، لا يمكنها فقط تقليل ضغط قوة الحوسبة للنماذج الكبيرة التي تعمل في السحابة ، ولكن أيضا ضمان إمكانية تخصيص النماذج الكبيرة مع حماية خصوصية المستخدم إلى أقصى حد.

** بالنسبة للاختناقات التقنية التي يجب اختراقها مثل قوة الحوسبة الطرفية والخوارزميات ، فقد طور بعض اللاعبين أيضا بعض "الطرق لكسر اللعبة". **

في المستند التعريفي التمهيدي ، قدمت كوالكوم فئة من التقنيات الجديدة التي تم استخدامها على نطاق واسع في الورقة البيضاء ، مثل فك التشفير التخميني ، الذي كان حريقا منذ بعض الوقت.

هذه طريقة اكتشفتها Google و DeepMind في نفس الوقت لتسريع الاستدلال على النماذج الكبيرة ، ويمكن تطبيق نموذج كبير أصغر لتسريع توليد النماذج الكبيرة.

ببساطة ، هو تدريب نموذج أصغر وإنشاء مجموعة من "الكلمات المرشحة" للنموذج الكبير مقدما ، بدلا من السماح للنموذج الكبير "بالتفكير" والتوليد من تلقاء نفسه ، واتخاذ "خيارات" مباشرة.

نظرا لأن سرعة توليد النموذج الصغير أسرع بعدة مرات من النموذج الكبير ، بمجرد أن يشعر النموذج الكبير أن الكلمات التي يمتلكها النموذج الصغير متاحة بالفعل ، يمكن أخذها مباشرة دون توليدها ببطء بنفسك.

تستفيد هذه الطريقة بشكل أساسي من حقيقة أن سرعة الاستدلال للنماذج الكبيرة تتأثر بعرض النطاق الترددي للذاكرة أكثر من الزيادة في الكمية الحسابية.

نظرا للعدد الهائل من المعلمات وتجاوز سعة ذاكرة التخزين المؤقت بكثير ، فمن المرجح أن تكون الطرز الكبيرة محدودة بعرض النطاق الترددي للذاكرة أكثر من أداء أجهزة الحوسبة أثناء الاستدلال. على سبيل المثال ، يحتاج GPT-3 إلى قراءة جميع المعلمات البالغ عددها 175 مليار في كل مرة يولد فيها كلمة ، وغالبا ما تكون أجهزة الحوسبة خاملة أثناء انتظار بيانات الذاكرة من DRAM.

بمعنى آخر ، عندما يقوم النموذج بالاستدلال على الدفعات ، يكون هناك فرق بسيط في الوقت بين معالجة 100 رمز مميز ورمز مميز واحد في كل مرة.

لذلك ، لا يمكن استخدام أخذ العينات المضاربة تشغيل نماذج كبيرة بسهولة مع عشرات المليارات من المعلمات فحسب ، بل يمكن أيضا وضع جزء من قوة الحوسبة على الجانب الطرفي ، مما يضمن سرعة الاستدلال مع الاحتفاظ بتأثير توليد النماذج الكبيرة.

......

ولكن سواء كان سيناريو أو تقنية ، في النهاية ، يجب أن نجد نقاط التكيف لبعضنا البعض من أجل إنتاج قيمة تطبيقية كبيرة ** ، تماما كما أن العلاقة بين البرامج والأجهزة لا تنفصل:

ستواجه اختراقات خوارزمية البرامج مثل الذكاء الاصطناعي التوليدية ، عند البحث عن سيناريوهات هبوط المحطة الطرفية الذكية ، حتما متطلبات فنية مقترنة بأجهزة الذكاء الاصطناعي المحمول مثل Qualcomm.

بما في ذلك الهواتف الذكية وأجهزة الكمبيوتر و XR والسيارات وإنترنت الأشياء ، كيف يمكن لقطاعات مختلفة من صناعة المحطات الذكية أن تجد لعبتها وقيمتها الخاصة بناء على نقاط اتصال AIGC؟

كيف يمكن للمؤسسات اغتنام هذه الموجة من الأوقات لتحفيز قيمة تطبيق هذا النوع من التكنولوجيا وعدم تفويت فرصة تحويل الإنتاجية في الصناعة بأكملها؟

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت