Dachang يتفوق على ChatGPT

** الأصل: Luozhi Magnolia **

** المصدر: ** New Excerpt Business Review

* مصدر الصورة: تم إنشاؤه بواسطة أداة Unbounded AI *

في المائة يوم منذ إطلاق ChatGPT ، بدأ تطوير النماذج المحلية واسعة النطاق في وضع "الإعصار".

يُقال أنه تم إصدار 79 نموذجًا واسع النطاق بمقياس يزيد عن مليار عامل في الصين.

يركز مجال تطور النموذج واسع النطاق على معركة من مائة نموذج: تطور نموذج بايدو وينكسين الواسع النطاق إلى 3.5 ؛ قام علي تونجي تشيان ون ببناء نموذج عائلي ؛ نموذج جي دي يانشي واسع النطاق هو نموذج صناعي واسع النطاق "مصمم خصيصًا" لنفسه ؛

نظرية التطور للنماذج الكبيرة للمصانع الكبرى قاسية وواقعية ، ويجب إما اللحاق بالركب أو القضاء عليها.

أعلن Baidu Wenxin Big Model 3.5 ، الذي يتقدم ويتدرب بقوة ، مؤخرًا أن أحدث إصدار من قدرة Yiyan Wenxin قد تجاوز ChatGPT 3.5.

لقد تجاوز الانتقاء الطبيعي ، والبقاء للأصلح ، وكبار الشركات المصنعة والنماذج الكبيرة ChatGPT.

طراز المصنع الكبير ، أكثر من ChatGPT3.5

مرتديًا سترة بدلة بيضاء داخلية وخارجية سوداء بشعر قصير أنيق ، ظهر في مؤتمر تقرير تقييم القدرات الفنية للنموذج الكبير لمنظمة العفو الدولية.

كان الموضوع لا يزال قيد المراجعة في الليلة السابقة.وقال وو تيان ، نائب رئيس Baidu Group ، الذي عاد لتوه من رحلة عمل ، في الاجتماع: "الإصدار الجديد من Wenxin Yiyan تجاوز ChatGPT 3.5. وهذا أيضًا معلم مهم بالنسبة لنا لتنفيذ الأعمال الفنية ذات الصلة في الصين."

هذه شركة مصنعة رئيسية أخرى تؤكد رسميًا أن النموذج الكبير يفوق ChatGPT بعد أن ذكر Liu Qingfeng من HKUST Xunfei أن نموذج Spark الكبير على وشك تجاوز ChatGPT.

في شهر مارس من هذا العام ، تمت دعوة نموذج اللغة واسع النطاق "Wenxin Yiyan" من الجيل التالي من Baidu للاختبار ، ويستند هذا النموذج إلى الإصدار 3.0 من نموذج Wenxin واسع النطاق. بعد أكثر من 3 أشهر ، تمت ترقية طراز Wenxin إلى الإصدار 3.5 ، وتم تحسين آثاره ووظائفه وأدائه بشكل شامل.

لقد تجاوز Wenxin Yiyan 3.5 ChatGPT3.5 ، على الأرجح بسبب آلية المكونات الإضافية الجديدة من حيث الوظائف. لقد وسع Wenxin Large Model 3.5 حدود القدرة للنموذج الكبير من خلال المكونات الإضافية.

يؤكد النموذج الكبير على القوة التقنية والقدرة الأساسية للنموذج الكبير. في مايو من هذا العام ، النموذج الأساسي الكبير الجديد الذي أطلقته Baidu هو Wenxin Large Model 3.5. هذا النموذج هو النموذج الأساسي لنظام Wenxin Yiyan.

من الجدير بالذكر أنه في تدريب النموذج الأساسي ، يتبنى الإصدار 3.5 أيضًا أكثر تقنيات التدريب المتوازي الهجين التكيفي تقدمًا وإستراتيجية حساب الدقة المختلطة لـ Paddle ، والتي تعمل على تسريع سرعة التكرار للنموذج بشكل كبير.

كما نعلم جميعًا ، تعمل Baidu على تنمية البحث والتطوير لتقنية الذكاء الاصطناعي الكاملة ، مع ما مجموعه أربع طبقات: طبقة الرقاقة وطبقة الإطار وطبقة النموذج وطبقة التطبيق.

تحتوي طبقة الرقاقة على Kunlun Core ؛ تحتوي طبقة الإطار على منصة التعلم العميق Paddle ، والتي تدعم بقوة التدريب الفعال والاستدلال على النماذج الكبيرة ؛ تحتوي طبقة النموذج على نموذج Wenxin الكبير ؛ في طبقة التطبيق ، تتقدم 150.000 شركة حاليًا للوصول إلى اختبار Wenxin Yiyan.

من بينها ، تضم منصة Flying Paddle 7.5 مليون مطور ، مقارنة بـ8 ملايين إلى 10 ملايين ممارس برمجيات في الصين. على الرغم من أن ممارسي البرمجيات ومطوري التعلم العميق ليسوا متماثلين تمامًا ، فإن الميزة في عدد المواهب توفر أيضًا مركزًا فكريًا ذا قدرة كبيرة لـ Wenxin 3.5 للحاق بـ ChatGPT ، على غرار وجود Ultrain.

بالمقارنة مع الشركات الأجنبية ، تتمتع الشركات الصينية بمزايا طبيعية في الحصول على المعلومات الصينية وفهم الثقافة الصينية.تتمتع الصناعة التحويلية في الصين بالفئات الأكثر اكتمالا ، ولديها ظروف مواتية لتدريب AIGC للصناعات الحقيقية.

ساهمت العديد من العوامل في الترويج. تم إصدار Wenxin Big Model 3.0 استنادًا إلى Wenxinyiyan منذ أكثر من 100 يوم. في ظل التحسين التعاوني لـ FlyPaddle و Wenxin ، نما Wenxin Big Model 3.5 بسرعة. زاد تأثير النموذج الأخير بنسبة 50٪ ، وزادت سرعة التدريب مرتين ، وزادت سرعة التفكير بمقدار 30 مرة. لقد تجاوزت ItGPT بنجاح.

علاوة على التكنولوجيا الأساسية ، طورت Baidu ثلاث تقنيات تحسين إضافية: تعزيز المعرفة ، وتعزيز الاسترجاع ، وتعزيز الحوار.

بمقارنة النموذج الكبير بالبشر ، إذا تعلم الناس بطريقة هيكل المعرفة ونظام المعرفة ، تكون كفاءة التعلم أعلى. ثم تعلم كيفية استخدام الأدوات للبحث ، وتحقيق استرجاع مبسط للغاية من طرف إلى طرف ، وتحسين التوقيت.

بعد أن ينتهي النموذج الكبير من التعلم من تلقاء نفسه ، يجب أن يتعلم تدريبًا مكثفًا على التغذية الراجعة. يشبه تحسين الحوار السماح للنموذج الكبير بإجراء الأسئلة باستمرار ، وإخبار النموذج الكبير بما هو صحيح وما هو الخطأ في الحوار ، ومن خلال طريقة التحفيز ، دع النموذج الكبير يقوي آلية الذاكرة ، ودعه يجيب على الأسئلة بالطريقة التي نريدها بشكل فعال ، وتعليم الطفل كيفية الإجابة بشكل أفضل.

بالإضافة إلى القوة التقنية ، يجب تأريض النماذج الكبيرة.

فيما يتعلق بالتطبيقات الصناعية ، نشأ نموذج Baidu Wenxin الواسع النطاق من الممارسة الصناعية ويخدمها. وقد استكشف بالفعل المسار الرئيسي لتنفيذ صناعة النماذج على نطاق واسع ، وأصدر أيضًا نماذج واسعة النطاق تغطي العديد من الصناعات والمجالات لتسريع التحول الذكي للصناعات.

في الوقت الحاضر ، تتعاون شركات مثل State Grid و Pudong Development و Taikang و Geely و Harbin و Shenzhen Gas و TCL و Baidu Wenxin مع بعضها البعض.

بالإضافة إلى ذلك ، استثمرت Baidu أكثر من 100 مليار يوان في البحث والتطوير في السنوات العشر الماضية ، وسيشكل استثمارها الأساسي في البحث والتطوير أكثر من 23٪ في عام 2021. وقد احتل عدد الطلبات والتراخيص لتخصصات الذكاء الاصطناعي المرتبة الأولى في الصين لمدة خمس سنوات متتالية ، واحتل عدد طلبات براءات الاختراع الخاصة بالتعلم العميق المرتبة الأولى في العالم. إن اختراق Baidu في مجال نماذج الذكاء الاصطناعي واسعة النطاق يرتبط ارتباطًا وثيقًا باستثمار Baidu القوي في موارد العناصر.

يمكن ملاحظة أن الوقت قد حان للمصانع الكبيرة والنماذج الكبيرة للقتال من أجل البحث والتطوير.

أي من المصانع الكبيرة والموديلات الكبيرة أفضل؟

في النصف الأول من هذا العام ، كان هناك ما يقرب من مائة شركة أعلنت رسميًا عن تصنيع نماذج كبيرة الحجم ، وكان كل نموذج كبير الحجم في معركة شرسة. من بينهم ، هناك لاعبون رئيسيون على الإنترنت مثل Ali و Baidu و Tencent و JD.com و ByteDance ، بالإضافة إلى شركات الذكاء الاصطناعي مثل HKUST Xunfei و SenseTime وغيرها من "القوات بدون اسم" مختلطة أيضًا.

في نصف عام ، أكمل المسار النموذجي واسع النطاق العملية من الفكرة إلى الهبوط ، وهو أمر شديد الانفجار على أي مسار.

ومع ذلك ، حتى الآن ، لا توجد مؤشرات أو إرشادات واضحة للتحقق من نموذج المقياس الكبير الذي هو الأفضل. واحدًا تلو الآخر ، التقييم الذاتي لـ "Wang Po يبيع البطيخ ويبيع البطيخ ويفتخر" مبهر ، وليس هناك الكثير من الموضوعية.

إذن ، في معركة مئات العارضين ، من هو الأفضل؟

في أحدث "تقرير تقييم القدرات الفنية للنموذج واسع النطاق للذكاء الاصطناعي ، 2023" الصادر عن IDC ، تم اقتراح إطار تقييم القدرات التقنية لنموذج الذكاء الاصطناعي واسع النطاق لأول مرة.

هناك ثلاثة أبعاد في نموذج التقييم: تكنولوجيا المنتج ، وبيئة الخدمة ، وتطبيق الصناعة.

يوجد ما يصل إلى 12 مؤشر تقسيم فرعي محدد: نموذج الخوارزمية ، والقدرة على الخدمة ، والقدرة العامة ، والقدرة على الابتكار ، وقدرة النظام الأساسي ، والأمن وإمكانية الشرح ، والتعاون البيئي ، وتغطية الصناعة ، والتمويل ، والصناعة ، والرعاية الطبية ، والطاقة.

من بينها ، نموذج الخوارزمية وتغطية الصناعة هما أهم مؤشرين لقياس قدرة النماذج الكبيرة ، على وجه الخصوص ، يمكن أن يشكل الاثنان دولاب الموازنة للتحسين التكراري المستمر.

من بين القدرات التقنية للمنتجات ، يعد بُعد "نموذج الخوارزمية" العنصر الأساسي لقدرة النموذج الكبير ، كما أن الجذر هو الذي يحدد تأثير التطبيق للنموذج الكبير.

والسبب هو أنه فقط من خلال اختراق تقنية نموذج الخوارزمية وإدراك قاعدة نموذجية كبيرة مع مزايا التأثير العام ، يمكن أن تدعم تغطية صناعية أوسع ، وتمكين جميع مناحي الحياة من الاستمتاع الكامل بالأرباح الناتجة عن الاختراقات التكنولوجية ، وحل معضلة العتبة العالية لتطبيق الذكاء الاصطناعي.

فيما يتعلق بقدرات تطبيقات الصناعة ، فإن اتساع نطاق تغطية التطبيق هو المؤشر الأكثر اهتمامًا بمصنعي النماذج على نطاق واسع ، وهو انعكاس شامل للقيادة العالمية لتأثيرات النماذج واسعة النطاق وقدرات الجمع بين الصناعة.

لذلك ، تعكس "تغطية الصناعة" قوة النموذج الكبير في التنفيذ الصناعي من خلال عدد العملاء على مستوى المؤسسة وعدد صناعات الهبوط.

شاركت في هذا التقييم النماذج المحلية السائدة واسعة النطاق ، بما في ذلك 14 مصنعًا بما في ذلك Baidu و Ali و Tencent و Huawei و iFlytek و 360 و SenseTime و 4Paradigm.

تتمتع الشركات المصنعة الكبرى والنماذج الكبيرة بدرجة عالية من المنافسة. تتمتع Baidu بميزة فريدة تتمثل في التصميم الكامل لمجموعة التكنولوجيا المكونة من أربع طبقات لـ "تطبيق إطار الرقاقة": طبقة رقاقة - جوهر Kunlun ، مجداف يطير بطبقة الإطار ، نموذج Layer-Wenxin الكبير ، وتطبيقات الذكاء الاصطناعي المختلفة. ومن بينها ، منصة التعلم العميق Flying Paddle من Baidu المطورة ذاتيًا والتي توفر دعمًا قويًا لنماذج التدريب الفعالة.

Aliyun أيضًا ملفت للنظر للغاية ، حيث حصل 6 من أصل 12 مؤشرًا على العلامات الكاملة ، وهو البائع الوحيد الذي حصل على درجات كاملة لـ "قدرة الخدمة". كمزود نموذج أساسي ، تعد قدرة المنصة وقدرة الخدمة ومستوى التعاون البيئي لمصنعي النماذج الكبيرة مهمة جدًا لتطوير الصناعة. سجلت Alibaba Cloud علامات كاملة في جميع المؤشرات الثلاثة.

في الوقت الحالي ، تتمتع عائلة النماذج الكبيرة للأغراض العامة في Alibaba Cloud بالقدرة على معالجة أو إنشاء نص وصوت وصور وطرائق أخرى. في الأشهر الثلاثة الماضية ، أطلقت Alibaba Cloud على التوالي النموذج الأساسي "Tongyi Thousand Questions" ، ونموذج المنتج السمعي والبصري واسع النطاق "Tongyi Tingwu" ، ونموذج إنشاء لوحات الذكاء الاصطناعي على نطاق واسع "Tongyi Wanxiang". ولا تزال عائلة نموذج Tongyi الكبيرة في تكرار وتطور مستمرين.

اختارت Tencent Cloud و JD Cloud ، وهما شركتا إنترنت رئيسيتان ، التركيز على جانب الصناعة وإطلاق نماذج واسعة النطاق للصناعة بناءً على خصائصها الخاصة.

على أساس بناء نموذج صناعي كبير ، تستخدم Tencent Cloud بياناتها الخاصة للضبط الدقيق لإنشاء نموذج حصري بدقة بيانات أعلى وخصوصية وأمان أقوى.

بالنسبة لـ JD.com ، التي تعمل على تنمية سلسلة التوريد لعدة سنوات ، فمن الأفضل التركيز على سلسلة التوريد من خلال التركيز على أعمال التجارة الإلكترونية والأعمال اللوجستية لفترة طويلة. كما قال موقع JD.com في المؤتمر الصحفي لنموذج Yanxi واسع النطاق ، "فقط من خلال جعل سلسلة التوريد حقيقية يمكن أن يصبح النموذج الكبير حقيقيًا."

الشركات المصنعة للذكاء الاصطناعي مثل HKUST iFLYTEK سجلوا أيضًا علامات كاملة في المسار العمودي. يتمتع هؤلاء اللاعبون بفرصة اختراق الصناعة الرأسية.في المنافسة بين الشركات المصنعة ، ستقود الشركات ذات المزايا الواضحة في المجال الرأسي.

خذ IFLYTEK كمثال. لقد ركزت IFLYTEK على مجال الذكاء الاصطناعي لأكثر من 20 عامًا ، والعديد من التقنيات الأساسية على المستوى الدولي الرائد. يجمع Spark Big Model بين القدرة على فهم اللغة والقدرة على التعبير العام للنموذج الكبير مع مكون البحث الإضافي ، والذي يحل بشكل فعال مشاكل الصناعة مثل صعوبة تحديث المعرفة الجديدة وحقيقة أن أسئلة وأجوبة الحقائق "سهلة" لإحداث فرق.

نظرًا للتكلفة الباهظة لتدريب النماذج الكبيرة ، ليس لدى المطورين العاديين والمؤسسات الصغيرة والمتوسطة الحجم أي طريقة للبدء. ويمكن أيضًا ملاحظة ذلك من نتائج التقرير: تعمل المصانع الأخرى بجد أيضًا ، لكن المستقبل طويل. وبصورة قاسية ، قد تكون هناك فرص قليلة لتناول الطعام على الطاولة.

أين يتجه النموذج الكبير في المستقبل؟

في مؤتمر WAIC منذ وقت ليس ببعيد ، قام اللاعبون الذين دخلوا النموذج الكبير بالفعل برسم النقاط الرئيسية: أولاً حل المشكلات الفنية ، ثم تنفيذ المشهد ، وأخيراً إدراك الأعمال والنطاق.

في الوقت الحالي ، رأينا أن النماذج الكبيرة قد بدأت تتكامل بشكل عميق مع السيناريوهات والصناعات. على سبيل المثال ، أثبتت النماذج الكبيرة في مجالات مثل إنشاء الكود والتنبؤ بهيكل البروتين أن النماذج الكبيرة لم يتم تطبيقها في شركات التكنولوجيا فحسب ، بل اتخذت أيضًا خطوات نحو جميع مناحي الحياة.

قفز النموذج المحلي واسع النطاق بسرعة فوق مرحلة مخزونات المفاهيم واسعة النطاق ، وتطور نموذج الذكاء الاصطناعي واسع النطاق من منافسة المعلمات إلى منافسة التطبيقات.

على سبيل المثال ، تم تنفيذ نموذج Pangu الكبير من Huawei في مجالات مثل الأرصاد الجوية ، والبحث والتطوير الطبي ، والطاقة الكهربائية ، واللغات ، وقد تم تقديم نماذج كبيرة متعددة بمئات المليارات من المعلمات. سيتم تطبيق قدرات نموذج الصناعة واسعة النطاق لـ Tencent Cloud على سيناريوهات مثل التحكم في المخاطر المالية ، والترجمة التفاعلية ، وخدمة العملاء الذكية الرقمية ، مما يحسن كفاءة التطبيقات الذكية ، وتقلل خدمة MaaS الشاملة العبء على المؤسسات.

تحديدًا لسيناريو التطبيق ، مع الأخذ في الاعتبار المجال المالي كمثال ، يمكن أن يدعم نموذج الصناعة واسع النطاق حلول التحكم في المخاطر المالية ، والتي زادت في الكفاءة بمقدار 10 أضعاف مقارنة بالسابق.

يجمع النموذج واسع النطاق بين سنوات من الخبرة المتراكمة في مكافحة الاحتيال وآلاف من سيناريوهات الأعمال الحقيقية. وبالمقارنة مع النموذج التقليدي ، فقد زاد التأثير العام لمكافحة الاحتيال بنحو 20٪. يمكن للمؤسسات تكرار قدرات التحكم في المخاطر استنادًا إلى النماذج ، بدءًا من جمع العينات ، والتدريب على النموذج وحتى النشر والإطلاق ، لتحقيق المشاركة اليدوية الصفرية في العملية بأكملها ، ويتم تقليل وقت النمذجة من أسبوعين إلى يومين فقط.

حتى مع تراكم العينات المحدود ، يمكن إتمام البناء السريع ويمكن تخطي عملية "البداية الباردة".

أصبحت كيفية الهبوط والتسويق التجاري محور اهتمام الشركات المصنعة.

وهذا يعني أن الذكاء الاصطناعي قد دخل مرحلة التنفيذ الصناعي القابل للتكرار على نطاق واسع ، ولا يمكن تحقيق نتائج جيدة إلا باستخدام عينة صغيرة أو التعلم بعينة صفرية ، وبالتالي تقليل تكلفة تطوير الذكاء الاصطناعي. بعد ترقية نموذج Baidu Wenxin الكبير ، تم تخفيض التكلفة بنجاح إلى 10 ٪ من الماضي.

ستشكل أي صناعة في نهاية المطاف احتكارًا للقلة ، والنماذج الكبيرة ليست استثناءً.

في الأشهر القليلة الماضية ، ظهر عدد كبير من النماذج الجديدة واسعة النطاق. سواء كانت رغبة مجنونة في اغتنام الفرصة والخوف من التخلف عن الركب ، أو تخطيط طويل المدى للمسار والبحث المخصص ، فإن كل لاعب يعرف ذلك جيدًا فقط.

لن يكون اشتباك مائة نموذج سوى ظاهرة مرحلية ، والنتيجة النهائية لا تزال مركزة على عدد صغير من النماذج الكبيرة. الأسباب ليست أكثر من ما يلي:

أولاً ، في عملية التطور ، وجدت العديد من المؤسسات والمؤسسات تدريجياً مواقعها الخاصة ، وتتجه تدريجياً نحو التقسيم الفرعي ، وأخيراً يتم تضمينها في النموذج الواسع النطاق الأكثر اكتمالاً.

ثانيًا ، يستغرق الأمر سنوات من التراكم. إن النموذج واسع النطاق الذي تم بناؤه بالفعل من الأسفل مكلف للغاية ، ويتطلب قدرات شاملة للغاية ، ويجب أن يكون لديه عقلية مطلقة طويلة المدى ، مما يعني أن اللاعبين الذين ليس لديهم قوة اقتصادية مطلقة سيتركون في منتصف الطريق أو "يموتون" على الطريق إلى النور.

ثالثًا ، هناك مجال كبير للخيال في مستقبل النماذج الكبيرة على مستوى التطبيق. بافتراض أن كل صناعة لديها مساحة كبيرة للتطوير ، يمكن استخدام تقنية الذكاء الاصطناعي الجديدة لتحسين الكفاءة ، وسيتم بالتأكيد تحويل القيمة على مستوى التطبيق.الاعتماد على العديد من نماذج الرأس الكبيرة سيكون له بيئة تطبيق واسعة للغاية.

لا يمكن إنكار أنه في المستقبل ستعتمد جميع المؤسسات بشدة على نماذج كبيرة ، وسيتم تطوير جميع المنتجات على أساس نماذج كبيرة.

أصبح معدل اختراق الصناعة وحصة السوق من أهم عناصر التحدي لنموذج المؤسسة الكبيرة ليصبح احتكارًا للقلة.

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت