تشارك في النموذج الكبير ، السرد الجديد لمصنعي الهواتف المحمولة

2023-08-16 02:28:43

المؤلف ｜ وو جينغ جينغ

تحرير ｜ الكستناء

المصدر: Jiazi Guangnian

ظهر نموذج Xiaomi الكبير لأول مرة خلال خطاب Lei Jun السنوي لعام 2023.

ذكر Lei Jun أنه على عكس العديد من منصات الإنترنت ، فإن الاتجاه الرئيسي للاختراق لنموذج Xiaomi الكبير هو ** الوزن الخفيف والنشر المحلي ** ، والذي يمكن أن يعمل بسلاسة على جانب الهاتف المحمول.

وقال إنه في الوقت الحالي ، تم تشغيل نموذج MiLM1.3B بمقياس 1.3 مليار معلمة على الهواتف المحمولة ، والتأثير مماثل لنتائج النماذج الكبيرة مع 6 مليارات من المعلمات في الحوسبة السحابية. في بطاقة التقرير التي نشرها ، كان أداء نموذج Xiaomi الكبير من طرف إلى جانب أفضل من نموذج ChatGLM2-6B الخاص بـ Zhipu AI في موضوعات مختلفة من تقييم CMMLU الصيني ، وفجوة النتيجة مع نموذج Baichuan-13B الكبير من Baichuan Intelligent كان حوالي 5 دقائق.

(المصدر: Xiaomi)

في السابق ، وصل نموذج اللغة ما قبل التدريب واسع النطاق MiLM-6B / 1.3B الذي طورته Xiaomi إلى GitHub ، منصة استضافة الكود ، واحتلت المرتبة العاشرة في قائمة C العامة ، واحتلت المرتبة الأولى في نفس حجم المعلمة ، والمرتبة المرتبة الأولى في النموذج القياسي الصيني الكبير "CMMLU" ، احتلت "MiLM-6B" المرتبة الأولى.

بالطبع ، نظرًا لأن أبعاد قوائم الاختبار هذه كلها عامة ، فليس من الصعب على العديد من الشركات النموذجية الكبيرة أن تسجل وفقًا لمهام الاختبار. لذلك ، لا يمكن استخدام نتائج التقييم هذه إلا كمرجع ، ولا تعني أن النتائج ممتازة للغاية.

في الوقت نفسه ، أعلن Lei Jun أيضًا أن Xiao Ai ، كأول تطبيق تجاري لطراز Xiaomi الكبير ، قد خضع لترقية جديدة وافتتح رسميًا اختبار الدعوة.

هذا هو الإنجاز الكبير للنموذج الذي حققته Xiaomi في أربعة أشهر منذ الإعلان عن فريق النموذج الجديد واسع النطاق في أبريل من هذا العام.

ما هو التفكير الجديد الذي تجلبه ممارسة Xiaomi إلى تنفيذ النماذج الكبيرة؟ ماذا يعني ذلك لمصنعي الهواتف المحمولة الذين يعتمدون على التكرارات التكنولوجية الجديدة؟

1. لا تصنع Xiaomi نماذج كبيرة للأغراض العامة ، ويضم الفريق الأساسي حوالي 30 شخصًا

تنتمي Xiaomi إلى المدرسة العقلانية على مسار النماذج واسعة النطاق - ** لا تتابع مقياس المعلمات ، ولا تصنع نماذج واسعة النطاق للأغراض العامة. **

في وقت سابق في المكالمة الجماعية للأرباح ، قال Lu Weibing ، رئيس مجموعة Xiaomi ، إن Xiaomi ستتبنى بنشاط نماذج واسعة النطاق ، والاتجاه هو دمج المنتجات والشركات بعمق ، ولن تصنع نماذج واسعة النطاق للأغراض العامة مثل OpenAI .

وفقًا لتقارير Shenran السابقة ، قال الدكتور Wang Bin ، مدير مختبر AI لمجموعة Xiaomi ، ذات مرة أن Xiaomi لن تصدر منتجًا شبيهًا بـ ChatGPT بمفردها ، وسيتم طرح النموذج الكبير الذي تم تطويره ذاتيًا بواسطة المنتج ، و ستستثمر الحكومة المعنية عشرات الملايين من مستوى اليوان. **

قال: "بالنسبة للطرز الكبيرة ، نحن ننتمي إلى المدرسة العقلانية. تتمتع Xiaomi بمزايا في سيناريوهات التطبيق ، وما نراه هو فرصة كبيرة للجمع بين النماذج والسيناريوهات الكبيرة".

وكشف أنه قبل ولادة ChatGPT ، أجرت Xiaomi بحثًا داخليًا وتطويرًا وتطبيقًا للنماذج الكبيرة. في ذلك الوقت ، استخدمت التدريب المسبق + الإشراف على المهام النهائية والضبط الدقيق لإجراء حوار بين الإنسان والآلة ، باستخدام مقياس متغير من 2.8 مليار إلى 3 مليارات. يتم تحقيق ذلك بشكل أساسي من خلال ضبط بيانات الحوار على أساس النموذج الأساسي المدرب مسبقًا ، وليس النموذج الكبير للأغراض العامة كما يطلق عليه الآن.

وفقًا للمعلومات العامة ، فإن الرئيس الحالي لفريق Xiaomi النموذجي الكبير هو Luan Jian ، وهو خبير في اتجاه صوت AI ، يقدم تقاريره إلى Wang Bin ، نائب رئيس اللجنة الفنية ومدير مختبر الذكاء الاصطناعي. يضم فريق الطراز الكبير بأكمله حوالي ** 30 شخصًا **.

اعتاد Luan Jian أن يكون كبير علماء الصوت وقائد فريق الصوت في الروبوت الصوتي الذكي "Microsoft Xiaoice" ، وباحث في معهد أبحاث Toshiba (الصين) ، وكبير علماء الصوت في أكاديمية الهندسة في Microsoft (الصين). بعد انضمامه إلى Xiaomi ، كان Luan Jian مسؤولاً عن توليد الصوت و NLP والفرق الأخرى على التوالي ، وتنفيذ التقنيات ذات الصلة في منتجات مثل Xiao Ai. انضم Wang Bin إلى Xiaomi في 2018 وكان مسؤولاً عن مختبر الذكاء الاصطناعي منذ عام 2019. قبل انضمامه إلى Xiaomi ، كان باحثًا ومشرفًا على الدكتوراه في معهد هندسة المعلومات ، الأكاديمية الصينية للعلوم. لديه ما يقرب من 30 عامًا من البحث خبرة في مجالات استرجاع المعلومات ومعالجة اللغة الطبيعية.

يعتمد النموذج واسع النطاق أيضًا على فريق AI وراء Xiaomi. قال Lei Jun إنه بعد 7 سنوات و 6 توسعات ، يضم فريق AI في Xiaomi أكثر من 3000 شخص ، يغطون السيرة الذاتية ، و NLP ، والتصوير بالذكاء الاصطناعي ، والقيادة الذاتية ، والروبوتات وغيرها. المجالات.

(المصدر: Xiaomi)

2. دخلت Google و Qualcomm و Huawei اللعبة واحدًا تلو الآخر

بالإضافة إلى Xiaomi ، فإن صنع نماذج كبيرة تعمل على الهواتف المحمولة هو الهدف الرئيسي الحالي للعديد من شركات التكنولوجيا.

تتخيل شركات التكنولوجيا إمكانية وجود نماذج كبيرة: بغض النظر عن ما تفتحه هو WPS أو مستندات الجرافيت أو رسائل البريد الإلكتروني ، طالما قمت بإدخال أوامر مثل الكتابة ، يمكن للهاتف المحمول الاتصال بالإمكانيات المحلية لإنشاء مقالة كاملة أو بريد إلكتروني. على الهاتف المحمول ، يمكن لجميع التطبيقات الاتصال بالنموذج المحلي واسع النطاق في أي وقت للمساعدة في التعامل مع العمل وحل مشاكل الحياة.لم يعد التفاعل بين الأشخاص والتطبيقات المختلفة على الهاتف المحمول نقرات متكررة ، ولكن يمكن استدعاؤها بذكاء بالصوت.

تحاول العديد من الشركات ضغط حجم النموذج ، مما يجعل تشغيل الطرز الكبيرة محليًا على الهواتف المحمولة أكثر عملية واقتصادية. في مؤتمر Google I / O في مايو من هذا العام ، عندما أصدرت Google PaLM2 ، تم تقسيمها إلى أربعة مواصفات وفقًا للحجم ، من صغير إلى كبير بترتيب Gecko و Otter و Bison و Unicorn. ومن بينها ، أصغر أبو بريص يمكن يعمل على الهواتف المحمولة. وهو سريع ، يمكنه معالجة 20 رمزًا مميزًا في الثانية ، أي ما يعادل تقريبًا 16 أو 17 كلمة ، ويمكنه أيضًا دعم الهواتف المحمولة للتشغيل في وضع عدم الاتصال. لكن في ذلك الوقت ، لم تذكر Google الهاتف الذي سيُستخدم فيه الطراز.

في الوقت الحاضر ، كوالكوم هي التي توصلت إلى نتائج محددة. في 2023MWC في مارس من هذا العام ، قامت شركة Qualcomm بتشغيل Stable Diffusion ، وهو نموذج رسم بياني Wensheng يحتوي على أكثر من مليار معلمة ، على هاتف ذكي مزود بالجيل الثاني من Snapdragon 8. في العرض التوضيحي ، استخدم الموظفون Stable Diffusion لإنشاء صور على هاتف Android بدون اتصال بالإنترنت ، واستغرقت العملية برمتها ** 15 ثانية **.

في CVPR ، المؤتمر الأعلى لأكاديميين رؤية الكمبيوتر في يونيو ، عرضت شركة Qualcomm نموذج ControlNet الذي يعمل على هاتف Android بمقياس 1.5 مليار معلمة ، وكان وقت الرسم ** 11.26 ثانية فقط **. قال زياد أصغر ، نائب الرئيس الأول لإدارة المنتجات ورئيس الذكاء الاصطناعي في كوالكوم: ** من الناحية الفنية ، يستغرق الأمر أقل من شهر لنقل هذه الطرز الكبيرة التي تحتوي على أكثر من مليار معلمة إلى الهواتف المحمولة. **

أحدث إجراء هو إعلان Qualcomm عن التعاون مع Meta لاستكشاف التطبيقات والتطبيقات استنادًا إلى طراز Llama 2 على الهواتف الذكية وأجهزة الكمبيوتر وأجهزة العرض AR / VR المثبتة على الرأس والسيارات والأجهزة الأخرى القائمة على شريحة Qualcomm Snapdragon بدون شبكات. يخدم. وفقًا لشركة Qualcomm ، مقارنةً بـ LLM المستندة إلى مجموعة النظراء ، فإن تشغيل نماذج لغة واسعة النطاق مثل Llama 2 محليًا على الجهاز ليس فقط له تكلفة أقل وأداء أفضل ، ولكنه أيضًا لا يحتاج إلى الاتصال بالخدمات عبر الإنترنت ** ، والخدمة أكثر تخصيصًا وفعالية. أمانًا وخصوصية.

Apple ، التي لم تعلن رسميًا عن أي إجراءات نموذجية واسعة النطاق ، تستكشف أيضًا هبوط نماذج كبيرة الحجم على جانب الجهاز. وفقًا لتقرير "Financial Times" ، تقوم Apple بتجنيد المهندسين والباحثين بالكامل ** لضغط نماذج اللغات الكبيرة ** حتى يتمكنوا من العمل بكفاءة على iPhone و iPad ، والفريق المسؤول بشكل أساسي هو Machine Intelligence and Neural Design ( MIND) فريق.

في الوقت الحالي ، على Github ، يمكن لمشروع MLC LLM ذو المصدر المفتوح الشائع أن يدعم النشر المحلي ، فهو يحل قيود الذاكرة عن طريق التخطيط بعناية للتخصيص وضغط معلمات النموذج بفعالية ، ويمكنه تشغيل نماذج الذكاء الاصطناعي على أجهزة مختلفة مثل iPhone. تم تطوير المشروع بالاشتراك مع أستاذ مساعد CMU ، CTO OctoML Chen Tianqi وباحثين آخرين.يستخدم الفريق تقنية تجميع التعلم الآلي (MLC) كأساس لنشر نماذج الذكاء الاصطناعي بكفاءة. بعد أقل من يومين من دخول MLC-LLM على الإنترنت ، اقترب عدد النجوم على GitHub من 1000. اختبر شخص ما تشغيل نموذج لغة كبير محليًا في وضع الطائرة في iPhone.

على عكس Google و Qualcomm الأجنبيين اللذين يؤكدان أنه يمكن نشر الطرز الكبيرة محليًا على جانب الجهاز ويمكن تشغيلها في وضع عدم الاتصال ، تعطي الشركات المصنعة للهواتف المحمولة المحلية الأولوية حاليًا لنشر نماذج كبيرة على المساعدين الصوتيين للهاتف المحمول أو وظائف البحث عن الصور الحالية. جوهر هذه الترقية لاستدعاء المزيد من إمكانيات السحابة لاستخدام النماذج الكبيرة.

هذه المرة ، استخدم Xiaomi النموذج الكبير على المساعد الصوتي Xiao Ai. ومع ذلك ، نظرًا لأنه لم يتم الكشف عن المعلومات ذات الصلة حول النموذج الكبير من طرف إلى طرف Xiaomi ، فمن المستحيل الحكم بدقة على مسار تطوير طراز Xiaomi الكبير في المستقبل. انطلاقًا من اتجاه النشر المحلي والوزن الخفيف الذي أكده Lei Jun ، قد تحاول Xiaomi تشغيل الطراز الكبير دون اتصال بالإنترنت على الهاتف المحمول في المستقبل.

تحاول Huawei أيضًا تنفيذ نماذج واسعة النطاق على الهواتف المحمولة ، لكن التركيز لا يزال على ** المساعدين الصوتيين للهاتف المحمول ومشاهد البحث عن الصور **. في وقت سابق من شهر أبريل ، على الهاتف المحمول P60 الذي تم إصداره حديثًا من Huawei ، كانت وراء الوظيفة الجديدة للبحث الذكي عن الصور هي تقنية النموذج متعدد الوسائط واسع النطاق ، وتم تصغير النموذج على جانب الهاتف المحمول أثناء العملية. في الآونة الأخيرة ، قام المساعد الذكي Xiaoyi الذي تمت ترقيته حديثًا من Huawei بتحسين التجربة استنادًا إلى النموذج الكبير ، ويمكنه التوصية بالمطاعم وفقًا للمطالبات الصوتية ، وأداء وظائف جديدة مثل الملخصات.

تبذل OPPO و vivo جهودًا في هذا الاتجاه. في 13 أغسطس ، أعلنت OPPO أن مساعد Xiaobu الجديد المستند إلى AndesGPT سيبدأ قريبًا في التجربة.يمكن أن نرى من البيانات أنه بعد دمج Xiaobu Assistant قدرات النماذج الكبيرة ، سيكون أكثر فاعلية في الحوار وكتابة الإعلانات ، وسيتم تعزيز القدرة على الكتابة والجوانب الأخرى. AndesGPT هو نموذج لغوي كبير يعتمد على بنية السحابة المختلطة التي أنشأها فريق OPPO Andes Intelligent Cloud Team.

بالنسبة لمصنعي الهواتف المحمولة ، سواء كان النشر محليًا أو استدعاء القدرات السحابية ، فإن الطراز الكبير للهواتف المحمولة يمثل فرصة جديدة لا يمكن تفويتها.

3. النموذج الكبير يعمل على الهاتف المحمول ، أين المشكلة الرئيسية؟

ليس من السهل إنشاء نموذج كبير يعمل على هاتف محمول.

القوة الحاسوبية هي القضية الأساسية. لا يتطلب استخدام النموذج الكبير على الهاتف المحمول فقط استدعاء قوة الحوسبة للسحابة ولكن أيضًا قوة الحوسبة للجهاز الطرفي.بسبب الاستهلاك الكبير للموارد للنموذج الكبير ، فإن كل مكالمة تعني تكلفة عالية. ذكر رئيس شركة Alphabet John Hennessy ذات مرة أن تكلفة البحث باستخدام نموذج لغة كبير أعلى بعشر مرات من تكلفة البحث عن الكلمات الرئيسية السابقة. في العام الماضي ، كان لدى Google 3.3 تريليون طلب بحث ، بتكلفة خمس سنت لكل منها. يتوقع محللو وول ستريت أنه إذا استخدمت Google نماذج لغوية كبيرة للتعامل مع نصف استعلامات البحث الخاصة بها ، حيث يقدم كل منها إجابة من حوالي 50 كلمة ، ** قد تواجه Google زيادة قدرها 6 مليارات دولار في الإنفاق بحلول عام 2024. **

(المصدر: رويترز)

يواجه تشغيل الطرز الكبيرة على الهاتف المحمول مشاكل تكلفة مماثلة. تم ذكره في تقرير "Hybrid AI is the Future of AI" الصادر عن Qualcomm ، تمامًا كما تطورت الحوسبة التقليدية من حاسب مركزي وعميل إلى مزيج من السحابة الطرفية الطرفية . في نفس الوضع ، يتطلب تشغيل نموذج كبير على جانب الجهاز أيضًا بنية هجينة للذكاء الاصطناعي للسماح بتوزيع أعباء عمل الذكاء الاصطناعي وتنسيقها بين المحطات الطرفية والسحابية ، ** مما يسمح لمصنعي الهواتف المحمولة باستخدام قوة الحوسبة للأطراف الطرفية لتقليل التكاليف. ومن منطلق اعتبارات التكلفة هذه ، يمكن نشر النماذج الكبيرة محليًا.

بالإضافة إلى ذلك ، مثل المتعلقات الشخصية للجميع ، فإن الهاتف المحمول هو المكان الذي يتم فيه إنشاء البيانات ، ويتم أيضًا تخزين كمية كبيرة من البيانات الخاصة محليًا. إذا أمكن تحقيق النشر المحلي ، فسيوفر الحماية للأفراد من حيث الأمان والخصوصية .

هذا يطرح المشكلة الثانية.إذا كنت ترغب في استخدام المزيد من الإمكانات الجانبية لتشغيل الطرز الكبيرة ، فكيف يمكنك جعل استهلاك الطاقة للهاتف المحمول منخفضًا للغاية وفي نفس الوقت تجعل النموذج أكثر فاعلية؟

صرحت شركة Qualcomm ذات مرة أن القدرة الرئيسية على نشر نماذج كبيرة للأجهزة المحلية مثل الهواتف المحمولة تكمن في تحسين Qualcomm الكامل للذكاء الاصطناعي للأجهزة والبرامج ، بما في ذلك Qualcomm AI Model Enhancement Toolkit (AIMET) ، Qualcomm AI Engine و Qualcomm ذات الصلة التقنيات مثل يمكن لمجموعة برامج AI ضغط حجم النموذج ، وتسريع التفكير ، وتقليل تأخير وقت التشغيل واستهلاك الطاقة. ذكر هوو جيلي ، نائب الرئيس العالمي لشركة Qualcomm ورئيس أبحاث Qualcomm AI ، ذات مرة أن جزءًا مهمًا من بحث وتطوير الذكاء الاصطناعي عالي الكفاءة في Qualcomm هو بحث كفاءة النموذج الشامل. والغرض من ذلك هو تقليل نموذج الذكاء الاصطناعي في اتجاهات متعددة بحيث يمكن تشغيله بكفاءة على الأجهزة.

ضغط نموذج واحد ليس صعوبة صغيرة. سيتسبب ضغط بعض النماذج في خسارة في أداء النماذج الكبيرة ، ويمكن لبعض الطرق التقنية تحقيق ضغط بلا خسارة ، وكلها تتطلب محاولات هندسية في اتجاهات مختلفة بمساعدة أدوات مختلفة.

تمثل إمكانات البرامج والأجهزة الرئيسية هذه تحديًا كبيرًا لمصنعي الهواتف المحمولة. اليوم ، اتخذ العديد من مصنعي الهواتف المحمولة الخطوة الأولى لتشغيل طرازات كبيرة على الهواتف المحمولة. بعد ذلك ، تعد كيفية جعل نموذجًا كبيرًا أفضل يقع في كل هاتف محمول أكثر اقتصادية وكفاءة خطوة أكثر صعوبة وأكثر أهمية.

المغامرة قد بدأت للتو.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.