معركة نموذجية كبيرة على قدم وساق؟ قد يكون "النموذج الصغير" هو المخرج

2023-08-03 05:42:34

النص: Qingcheng Finance ، المؤلف: Qing Mu المحرر: Liu Zi

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI

في 26 يوليو ، أطلقت شركة OpenAI إصدار Android من ChatGPT. وعلى الرغم من توفره حاليًا في الولايات المتحدة والهند وبنغلاديش والبرازيل فقط ، قالت شركة OpenAI أيضًا إنها ستروج لإصدار Android من ChatGPT في المزيد من البلدان الأسبوع المقبل. هذا أعاد ChatGPT ، التي كانت أقل شعبية مؤخرًا ، إلى أعين الجمهور.

في بداية إطلاق ChatGPT ، استغرق الأمر شهرين فقط ليصبح أسرع تطبيق في التاريخ لاختراق 100 مليون مستخدم.سوق التكنولوجيا العالمية التي ظلت صامتة لفترة طويلة تغلي مرة أخرى.المستثمرون المحليون ورجال الأعمال يسافرون إلى السيليكون سأل الوادي.

في مواجهة هذه الموجة المضطربة للذكاء الاصطناعي ، تصرف رواد الأعمال والمستثمرون الصينيون بسرعة. بعد بضعة أشهر ، أظهرت صناعة التكنولوجيا في الصين وضعية مذهلة تتمثل في "حرب المائة نموذج". في النصف الأول من عام 2023 ، ظهر أكثر من 80 منتجًا نموذجيًا واسع النطاق في الصين.وفقًا لأحدث البيانات ، تقوم 130 شركة بالفعل بصنع نماذج كبيرة الحجم في السوق المحلية. على المستوى العالمي ، تم إطلاق أكثر من 400 طراز كبير حديثًا في النصف الأول من هذا العام.

بينما يطارد اللاعبون الصينيون النموذجيون على نطاق واسع المصالح التجارية ومستقبل التكنولوجيا ، يُطلق عليهم أيضًا اسم المشاعر الوطنية: ليكونوا النسخة الصينية من OpenAI.

وفقًا للأخبار الصادرة في 24 يوليو ، قبل إطلاق إصدار Android من ChatGPT ، أصدرت IDC تقريرًا لتقييم القدرة التقنية على نطاق واسع يوضح أن نموذج Baidu Wenxin واسع النطاق 3.5 سجل 7 من أصل 12 مؤشرًا ، ليحتل المرتبة الأولى في النتيجة الشاملة. قال Wu Tian ، نائب رئيس Baidu ، إن قدرة الإصدار الجديد من Wenxin Yiyan 3.5 قد تجاوزت قدرة ChatGPT 3.5 ، والتي تعد معلمًا هامًا في تطوير الأعمال الفنية ذات الصلة في بلدنا.

أعلنت HKUST Xunfei سابقًا أنها ستنفذ التكرار الثالث لنموذج Xinghuo الكبير في 24 أكتوبر ، مع قياس ChatGPT بالكامل ، وقد تجاوزت القدرة الصينية GPT3.5 ، والقدرة الإنجليزية تعادل GPT3.5.

01 مشهد ، مشهد

في الواقع ، كما قال Li Zhifei ، العالم السابق في Google والمؤسس والرئيس التنفيذي لشركة Mobvoy ، قد لا تكون هناك منظمة مثل OpenAI في الصين.

بالمقارنة مع النماذج واسعة النطاق للأغراض العامة مثل ChatGPT ، تولي منتجات النماذج المحلية واسعة النطاق مزيدًا من الاهتمام للتطبيقات والسيناريوهات ، أي النماذج العمودية واسعة النطاق ، والنماذج الصناعية واسعة النطاق ، والنماذج الصناعية واسعة النطاق. في هذا الصدد ، فإن آراء كبار الشخصيات في دائرة رأس المال الاستثماري التكنولوجي تعبر تقريبًا عن نفس المعنى.

صرح Robin Li ، مؤسس Baidu ، علنًا منذ فترة طويلة: "ليس من المنطقي أن تقوم شركة ناشئة بإعادة إنشاء ChatGPT. أعتقد أن هناك فرصة عظيمة لتطوير التطبيقات بناءً على نموذج اللغة الكبير هذا. هناك لا حاجة لإعادة اختراع العجلة. بعد امتلاك العجلة ، من الممكن صنع سيارة. "، الطائرات ، قد تكون القيمة أكبر بكثير من العجلة."

كتب Zhu Xiaohu ، العضو المنتدب لشركة GSR Venture Capital ، في Moments: "لا تكن مؤمنًا بالخرافات بشأن النموذج العام ، لأن GPT-3.5 في العام المقبل ستصبح سلعة (بنية أساسية عامة) ، وبعد ثلاث سنوات ، ستصبح GPT-4 أيضًا . بالنسبة لمعظم رواد الأعمال ، السيناريوهات أولاً ، البيانات هي الملك! "

يعتقد فو شنغ ، رئيس مجلس الإدارة والرئيس التنفيذي لشركة Cheetah Mobile ، أنه سيكون هناك طريقان للطرازات الكبيرة. نموذج كبير يسمى التحسن هو "بناء آينشتاين". لكن العديد من الوظائف لا تتطلب "أينشتاين" ، يمكن لخريجي الجامعات القيام بذلك. هذه طريقة أخرى. أعتقد أنه يجب أن يكون هناك عدد كبير من الناس يصنعون "نماذج مدنية كبيرة".

قال Zhang Pingan ، الرئيس التنفيذي لشركة Huawei Cloud ، في المؤتمر الصحفي Pangu Large Model 3.0: "لا يتوفر لدى Pangu Large Model وقت لكتابة القصائد والدردشة. بغض النظر عن عدد المعلمات الموجودة ومدى جودة القدرة على الحوار ، إذا كان ذلك ممكنًا لن يحل المشاكل العملية ، ولن يكون ذا فائدة كبيرة ".

تهدف معظم النماذج الكبيرة التي تم إصدارها في الصين مؤخرًا إلى الصناعات العمودية ، مثل نموذج Yanxi واسع النطاق الذي أصدرته JD. النموذج العمودي واسع النطاق "Ziyue" في مجال التعليم الذي أصدرته Dao.

لقد تراكمت لدى نموذج JD Yanxi الكبير المعرفة المتراكمة لدى JD في البيع بالتجزئة واللوجستيات والصحة والتمويل وغيرها من الصناعات لسنوات عديدة. إنه يدمج 70٪ من البيانات العامة و 30٪ من بيانات سلسلة التوريد الأصلية لـ JD للتدريب وتقديم توصيات المنتج والسياسات المالية ، القدرات في مجالات مثل قواعد الإدارة المالية والخبرة اللوجستية. يعتقد Cao Peng ، رئيس قسم JD Cloud ، أن تقنية نموذج واحد واسع النطاق لا يمكن أن تولد قيمة مباشرة ، ولا يمكن للتقنية توليد قيمة فعلية إلا عند وضعها في المشهد.

يطلب نموذج السفر الخاص بشركة Ctrip فحص 20 مليار من بيانات السياحة غير المهيكلة ، والجمع بين البيانات الهيكلية الحالية في الوقت الفعلي من Ctrip ، وروبوتات Ctrip المدربة تاريخيًا وخوارزميات البحث لإجراء تدريب نموذجي رأسي مطور ذاتيًا ، واستثمار الكثير من القوى العاملة. توليد والتحقق من الاستجابة العامة محتوى السفر. قال Liang Jianzhang ، مؤسس ورئيس مجلس إدارة Ctrip ، إن Ctrip لن تدخر جهدًا للاستثمار في النماذج الكبيرة ، وليس هناك حد لمبلغ الاستثمار.

فيما يتعلق بالتطبيقات ، توصلت Baidu مؤخرًا إلى تعاون مع Lenovo في مجال AIGC. قدمت شركة Lenovo الخاصة للتخصيص بشكل كامل Baidu Wenxin Yige. يمكن للمستهلكين تخصيص مظهر أجهزة الكمبيوتر المحمولة من خلال أنشطة الرسم التي تحمل عنوان AIGC على الموقع الرسمي. أطلقت Huawei Cloud Pangu Large Model و Meitu Visual Large Model MiracleVision بالاشتراك مع وظيفة تركيب نموذج AI ، والتي يمكن أن تحسن بشكل فعال كفاءة التجارة الإلكترونية لمنتجات الملابس.

على الرغم من أن النموذج العمودي الكبير لا يحتوي على متطلبات عالية للمعلمات وقوة الحوسبة مثل النموذج الكبير العام ، إلا أنه يحتوي على متطلبات أعلى للسيناريوهات والبيانات ، مما يتطلب من المطورين امتلاك المعرفة المهنية ، وتراكم ممارسات التطبيقات الصناعية الغنية ، والتسامح مع الأخطاء. أقل أيضًا ، مما يتطلب أن يتمتع الذكاء الاصطناعي باستقرار وموثوقية فائقين. لذلك ، كلما اقتربنا من الصناعة الرأسية ، زادت مزايا النموذج الرأسي.

"يمكن للنموذج العام واسع النطاق حل 70٪ إلى 80٪ من المشكلات في 100 سيناريو ، ولكنه قد لا يكون قادرًا على تلبية احتياجات سيناريو معين للمؤسسة بنسبة 100٪. إذا قامت المؤسسة بضبطها استنادًا إلى نموذج الصناعة واسع النطاق وبياناته الخاصة ، يمكنه إنشاء نموذج مخصص لإنشاء خدمة ذكية عالية التوفر ، ومعلمات النموذج أقل من النموذج العام الكبير ، وتكلفة التدريب والاستدلال أقل ، وتحسين النموذج هو أسهل. "قال تانغ Daosheng نائب الرئيس التنفيذي الأول لمجموعة Tencent Group ، والرئيس التنفيذي لمجموعة Cloud and Smart Industry Business Group.

من هذا المنظور ، قد تكون "العارضات الصغيرة" أكثر جاذبية وقدرة على حل مشكلات معينة بشكل أفضل.

أطلقت SenseTime نموذجًا كبيرًا يحتوي على 100 مليار معلمة ، كما أنها تطلق نموذجًا صغيرًا يحتوي على 10 مليارات معلمة لحقول رأسية مختلفة. تتمثل ميزة النموذج الكبير في أنه يمكنه إيجاد حلول جديدة والمساعدة في حل المشكلات الجديدة ، وبمجرد حله ، يمكنه إنشاء كمية كبيرة من البيانات في حقل ضيق وإعادة تدريب نموذج صغير. يمكن تشغيل بعض الطرز الصغيرة على الجهاز بتكلفة أقل. لكن النموذج الصغير لم يكن ليوجد بدون النموذج الكبير.

02 يأخذ كبار المصنّعين جميع الفائزين ، ما هي الفرص المتاحة للشركات المبتدئة؟

هناك وجهة نظر في الصناعة مفادها أن الإصدار الصيني من ChatGPT سيتم إنتاجه في خمس شركات فقط: Baidu و Ali و Tencent و Byte و Huawei.

في عصر الإنترنت ، هو نموذجي "721" ، المركز الأول لذيذ وحار ، والمركز الثاني بالكاد باق ، والمركز الثالث في خطر.

في الوقت الحالي ، هناك مائة عارض يتقاتلون ، والجميع يريد أن يحصل على حصة من العارضة الكبيرة. ولكن هناك مشكلة حقيقية للغاية تتمثل في أن المصانع الكبرى تتمتع بمزايا لا يمكن للشركات الناشئة أن تضاهيها عندما تصنع نماذج كبيرة الحجم. بالنسبة لشركة ناشئة صغيرة وجميلة ، ربما يكون مجرد وهم أنها تريد الإطاحة بمصنع كبير يضم ثلاثة أو خمسة أشخاص فقط.

لا يمكن فصل النماذج الكبيرة عن النظام الأساسي السحابي. يتطلب هبوط النماذج الكبيرة ضبطًا وتدريبًا مستمرين ، وكلها تحتاج إلى تشغيلها على النظام الأساسي السحابي. تمتلك كل من Baidu و Ali و Tencent و Byte و Huawei شركاتها السحابية الخاصة. وقد أكملت Baidu و Huawei أيضًا التخطيط من الرقائق إلى التطبيقات. Baidu هي "Kunlun Core + Flying Paddle Platform + Wenxin Large Model" ، Huawei هي "Shengteng chip + إطار عمل MindSpore + نموذج Pangu الكبير "، وهي مزايا لا يمكن للشركات الناشئة مطابقتها.

بالإضافة إلى ذلك ، تتمتع الشركات الكبيرة بمزايا طبيعية من حيث احتياطي رأس المال والموارد البشرية وسيناريوهات الاستخدام وتراكم البيانات. بدون سيناريو هبوط للشركات الناشئة ، لا يمكن تكرار التكنولوجيا وتحسينها باستمرار ولا يمكن تكوين تأثيرات شبكة البيانات.

إذن الشركات الصغيرة ليس لديها فرصة على الإطلاق؟

دعنا نعيد النظر في استعارة عصر الاندفاع نحو الذهب: "هذا العصر مشابه جدًا لعصر اندفاع الذهب. إذا ذهبت إلى كاليفورنيا للبحث عن الذهب في ذلك الوقت ، سيموت الكثير من الناس. لكن الأشخاص الذين يبيعون الملاعق والمجارف يمكنهم دائما جني الأموال. " يأمل لو تشي في مساعدة رواد الأعمال الصينيين على التعرف على نقطة التحول التاريخية هذه ، وتحديد إحداثيات عصر اليوم ، والعثور على مواقعهم الخاصة.

في أوائل يوليو ، حذر ستيوارت راسل ، أستاذ علوم الكمبيوتر بجامعة كاليفورنيا ، بيركلي ومؤلف كتاب "الذكاء الاصطناعي - نهج حديث" ، من أن الروبوتات التي تعمل بالذكاء الاصطناعي مثل ChatGPT قد تنفد قريبًا من النص في الكون . "" ، وأسلوب تدريب الروبوتات من خلال جمع كميات كبيرة من النصوص "بدأ يواجه صعوبات."

في الأسبوع الماضي ، وقع أكثر من 8500 كاتب خطابًا يطلبون من قادة الشركات بما في ذلك OpenAI و Microsoft و Meta و Alphabet عدم استخدام عملهم لتدريب أنظمة الذكاء الاصطناعي دون إذن أو دفع ، ويطلبون من شركات الذكاء الاصطناعي هذه تعويض خسائر حقوق النشر الخاصة بهم.

مخزون بيانات الإنترنت على وشك النفاد ، وأصبحت البيانات عالية الجودة شحيحة على نحو متزايد. النموذج جيد أو سيئ ، 20٪ يتم تحديده بواسطة الخوارزمية ، و 80٪ يتم تحديده من خلال جودة البيانات. في "الترويكا" للبيانات ، وقوة الحوسبة ، والخوارزميات ، تكون البيانات هي العنصر الأساسي ، والأطول مدى ، والأكثر جوهرية. يجب تغذية النماذج الكبيرة بكميات هائلة من البيانات من أجل تحسينها وتكرارها باستمرار.

بعد ذلك ، ستصبح القيمة الحقيقية بيانات مستدامة عالية الجودة. ستصبح كيفية الحصول باستمرار على مصادر البيانات القانونية والمتوافقة والمتوافقة مع منطق الأعمال عاملاً رئيسياً في تحسين أداء النماذج الكبيرة. لذلك ، قد يصبح مشغلو البيانات دورًا مهمًا يقيد تطوير النماذج الكبيرة.

من الناحية المثالية ، يوفر النموذج باستمرار خدمات للمستخدمين ، ويقوم المستخدمون باستمرار بإنشاء بيانات جديدة للنموذج. بالنسبة للخطوة التالية ، سيتم توضيح البيانات الخاصة. تعني الخدمات الأكثر تخصيصًا المزيد من البيانات الخاصة ، ومن غير المرجح أن يعرض البشر البيانات الخاصة للنموذج الكبير دون تحفظ.

في أي عصر ، يكون "بائع الماء" دائمًا عملًا جيدًا. من المثير للاهتمام ، بغض النظر عما إذا كنت رائدًا أو مستكشفًا أو منقبًا عن الذهب ، لا يمكنك الاستغناء عن الماء. بالطبع ، يمكنك أيضًا بيع الملاعق والمجارف.

03 خاتمة

في الأشهر القليلة الماضية ، كان هناك منشور تم تداوله على نطاق واسع على منصات التواصل الاجتماعي:

فكر في الذكاء الاصطناعي كطفل. ينتمي الذكاء الاصطناعي في أوروبا والولايات المتحدة إلى مسار تعليم النخبة. وبعد ولادته ، أنفقت عائلته الأموال طوال الطريق حتى يدرس حتى حصل على الدكتوراه.

ينتمي الذكاء الاصطناعي في الصين إلى خط التعليم النفعي ، ويتم تربيته من أجل البقاء عند الولادة ، وعندما يبلغ 15 عامًا ، يضطر إلى إيجاد طرق لكسب المال للأسرة وتعلم كيفية تسويق المهارات.

بضع كلمات ، مذاق بعناية ، مليئة بالنكهات.

على الرغم من أن هذا ليس صحيحًا بالضرورة ، فقد يفسر هذا أيضًا إلى حد ما سبب عدم ظهور OpenAI و ChatGPT في الصين. في الواقع ، كان بعض المستثمرين المحليين ورجال الأعمال مليئين بالثقة في البداية وأرادوا أن يكونوا النسخة الصينية من OpenAI. بعد بضعة أشهر من القذف ، وجدت أنني ما زلت بحاجة إلى العثور على نموذج ربح ، واستكشاف سيناريوهات تطبيق الأعمال وقدرات التسويق.

ومن الجدير بالذكر أن بعض المستخدمين النهائيين C قد أدركوا مؤخرًا أن أداء ChatGPT-4 في مهام معينة ضعيف للغاية. ويعتبر هذا استخدامًا لنموذج خبير مختلط (MOE) من قبل OpenAI لتقليل التكاليف وزيادة الكفاءة ، وتحويل تركيزها إلى الخدمات على مستوى المؤسسة. أحد الإجراءات.

بالنظر حولك ، تعمل Apple أيضًا على تطوير نموذجها اللغوي الكبير Apple GPT ، وتدرس Qualcomm بالفعل كيفية تحقيقه بحلول نهاية هذا العام ، بحيث يمكن تشغيل النموذج بمستوى معلمة من 10 مليار إلى 15 مليارًا في وضع عدم الاتصال على الهاتف المحمول بدون معالجة سحابية.

النماذج الكبيرة هي إعادة تشكيل للإنتاجية ، نقلة نوعية. منذ 200 عام ، استخدم البشر المحركات البخارية لتحويل الطاقة الحرارية إلى طاقة حركية لأول مرة ، وبدأ عصر التصنيع. اليوم ، يستخدم البشر نماذج كبيرة لتحويل الطاقة الكهربائية إلى قوة دماغية وذكاء عام ، ويبدأ حقبة جديدة.

بالطبع لا نحتاج إلى الكثير من العجلات ، لكننا ما زلنا بحاجة إلى عجلات جيدة.

هناك طريق طويل لنقطعه.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
Gate 2025 Q2 Report Released
2224 درجة الشعبية
Gate Derivatives Volume Hits New High
4447 درجة الشعبية
CPI Data Incoming
32247 درجة الشعبية
4Join Gate VIP to Win MacBook
29439 درجة الشعبية
5MicroStrategy Buys More Bitcoin
496 درجة الشعبية
6BTC Hits New High
93263 درجة الشعبية
7My Gate Moments
26234 درجة الشعبية
8VIP Exclusive Airdrop Carnival
25187 درجة الشعبية
9Fed June Meeting Minutes
6045 درجة الشعبية
10Gate Alpha Trading Share
13483 درجة الشعبية

تثبيت

خريطة الموقع