في أوائل يونيو ، أصدرت وسائل الإعلام الأجنبية تعذيبا ل "من هو OpenAI في الصين" ، وبعد تجربة موجة ريادة الأعمال الكبيرة ، اندفعت الأمواج الكبيرة إلى الرمال ، ولم يتبق سوى عدد قليل من الناس في النهاية.
مبنى Xaar على بعد عدد قليل من التقاطعات خارج جامعة Tsinghua هو ذكاء Baichuan لرجل الأعمال النجم Wang Xiaochuan ، ومبنى شبكة Sohu هو طيف الحكمة الذي أرسلته الأكاديمية الذكاء الاصطناعي. بعد اجتياز اختبار السوق ، أصبحا أكثر المرشحين الواعدين.
يبدو أن المعركة على المبنيين قد بدأت بهدوء.
** من منظور التمويل ، أكملت Zhipu الذكاء الاصطناعي و Baichuan Intelligent جولات متعددة من التمويل واسع النطاق هذا العام. **
(رسم الخرائط الذكية لمخروط الضوء: منظم وفقا للمعلومات العامة)
هذا العام ، تجاوز إجمالي مبلغ التمويل التراكمي ل Zhipu الذكاء الاصطناعي 2.5 مليار يوان ، وبلغ إجمالي مبلغ التمويل لشركة Baichuan Intelligent 350 مليون دولار أمريكي (حوالي 2.3 مليار يوان). وفقا للمعلومات العامة ، تجاوز التقييم الأخير ل ** Zhipu الذكاء الاصطناعي 10 مليارات يوان ، وهو أعلى أو 15 مليار ، وهي واحدة من أسرع الشركات المحلية بتقييم يزيد عن 10 مليارات يوان ؛ ** بعد الجولة الأخيرة من التمويل ، تم تقييم Baichuan Intelligent بأكثر من 1 مليار دولار أمريكي (حوالي 6.6 مليار يوان).
من منظور تكوين الفريق ، يخرج كل من Zhipu الذكاء الاصطناعي و Baichuan Intelligent Master من نفس المنزل ، ووانغ شاولان ، رئيس Zhipu الذكاء الاصطناعي ، ووانغ شياو تشوان ، مؤسس Sogou ، كلاهما فريقان رياديان في قسم Tsinghua.
** من منظور سرعة اللحاق بالركب التكنولوجي ، لا يمكن التمييز بين الاثنين أيضا. ** هزم GLM-130B من Zhipu الذكاء الاصطناعي GPT-3 بمجرد ظهوره ، ويتقدم Baichuan 2 الذي تم إصداره حديثا على Llama 2 في جميع الأبعاد ، وهو رائد في تطوير النظام البيئي مفتوح المصدر في الصين.
تشير جميع المؤشرات إلى أن Zhipu الذكاء الاصطناعي و Baichuan Intelligence أصبحا "الخيول السوداء" لمسار النموذج الكبير في الصين ، وفي ظل المنافسة الشرسة ، من هو الغزلان الميتة؟
يمكن إرجاع العلاقة بين Zhipu الذكاء الاصطناعي و OpenAI إلى عام 2020 ، والذي اعتبره Zhang Peng ، الرئيس التنفيذي لشركة Zhipu الذكاء الاصطناعي ، "السنة الأولى الحقيقية لنموذج اللغة الكبيرة" الذكاء الاصطناعي قلبه.
يمكن إرجاع العلاقة بين Zhipu الذكاء الاصطناعي و OpenAI إلى عام 2020 ، والذي اعتبره Zhang Peng ، الرئيس التنفيذي لشركة Zhipu الذكاء الاصطناعي ، "السنة الأولى الحقيقية لنموذج اللغة الكبيرة" الذكاء الاصطناعي قلبه.
في ذكرى Zhipu الذكاء الاصطناعي ، في الجو البهيج ، يمكنك شم بعض القلق الناجم عن ولادة GPT-3 من وقت لآخر. GPT-3 ، الذي يصل إلى 175 مليار معلمة ، هو أول نموذج لغوي كبير بالمعنى الدقيق للكلمة.
في ذلك الوقت ، لم يصدم تشانغ بنغ بقدرة ظهور GPT-3 فحسب ، بل وقع أيضا في التفكير في "ما إذا كان يجب متابعة" ، سواء كان ذلك في ذلك الوقت أو الآن ، كل ذلك في اتجاه نموذج كبير المعلمة على نطاق واسع للغاية هو شيء محفوف بالمخاطر للغاية. بعد الموازنة ، قررت Zhipu الذكاء الاصطناعي اتخاذ OpenAI كمعيار لها والاستثمار في تطوير نماذج ما قبل التدريب على نطاق واسع للغاية.
(رسم الخرائط الذكية لمخروط الضوء: منظم وفقا للمعلومات العامة)
** من حيث اختيار مسار التكنولوجيا ، فإن Zhipu الذكاء الاصطناعي لديها نفس التفكير المستقل مثل OpenAI. **
في ذلك الوقت ، كان هناك العديد من أطر ما قبل التدريب النموذجية الكبيرة مثل BERT و GPT و T5. المسارات الثلاثة لها مزاياها وعيوبها من حيث هدف التدريب وهيكل النموذج ومصدر بيانات التدريب وحجم النموذج.
إذا تمت مقارنة عملية التدريب النموذجية الكبيرة بامتحان اللغة الإنجليزية ، فإن BERT جيد في الإجابة على الأسئلة من خلال العلاقة بين الكلمات والجمل ، وإجراء الاختبار من خلال الفهم ، وتأتي مواد المراجعة الخاصة به بشكل أساسي من الكتب المدرسية وويكيبيديا ؛ GPT جيدة في التنبؤ بالكلمة التالية للقيام بالأسئلة ، والتحضير للامتحان من خلال الكثير من ممارسة الكتابة ، وتأتي مواد المراجعة الخاصة بها بشكل أساسي من مجموعة متنوعة من صفحات الويب. تتبنى T5 استراتيجية إضفاء الطابع الرسمي على الأسئلة ، أولا ترجمة الأسئلة إلى اللغة الصينية ثم حل الأسئلة ، وعند المراجعة ، ليس فقط قراءة الكتاب المدرسي ، ولكن أيضا تنظيف عدد كبير من بنوك الأسئلة.
كما نعلم جميعا ، اختارت Google BERT ، واختار OpenAI GPT ، ولم يتبع Zhipu الذكاء الاصطناعي بشكل أعمى ، ** بناء على هذين الطريقين ، اقترح إطار خوارزمية GLM (نموذج اللغة العام). يدرك الإطار في الواقع المزايا والعيوب التكميلية ل BERT و GPT ، "والتي يمكن فهمها أثناء الاستمرار وملء الفراغات". **
وهكذا أصبحت GLM أكبر ثقة ل Zhipu الذكاء الاصطناعي لمتابعة OpenAI ، وفي ظل هذا الإطار ، نمت نماذج سلسلة GLM مثل GLM-130B و ChatGLM-6B و ChatGLM2-6B على التوالي. تظهر البيانات التجريبية أن النماذج الكبيرة من سلسلة GLM تتفوق على GPT من حيث دقة فهم اللغة وسرعة الاستدلال ونسبة الذاكرة وتطبيق تكييف النموذج الكبير.
(المصدر: الإنترنت)
تعد OpenAI حاليا المؤسسة الأكثر اكتمالا التي يمكنها تقديم خدمات نموذجية أساسية في الخارج ، وينقسم تسويقها بشكل أساسي إلى فئتين ، إحداهما رسوم جمع واجهة برمجة التطبيقات ، والأخرى هي رسوم اشتراك ChatGPT. من حيث التسويق ، تتبع Zhipu الذكاء الاصطناعي أيضا الفكرة العامة وهي في مستوى الشركات ذات التسويق الناضج نسبيا للنماذج المحلية الكبيرة.
وفقا للتمشيط الذكي للمخروط البصري ، جنبا إلى جنب مع هبوط الشركات الصينية ، ينقسم نموذج أعمال ** Zhipu الذكاء الاصطناعي إلى رسوم تحصيل API ووضع رسوم الخصخصة. **
الأنواع الإجمالية للنماذج المقدمة هي نماذج اللغة الكبيرة ، والنماذج الكبيرة فائقة التجسيم ، والنماذج الكبيرة المتجهة ، والنماذج الكبيرة المشفرة ، وتحت كل خيار نموذج كبير ، بما في ذلك التسعير القياسي والتسعير الخاص السحابي والتسعير الخاص المحلي. بالمقارنة مع OpenAI ، تفتقر Zhapu الذكاء الاصطناعي إلى توفير خدمات النماذج الكبيرة للصوت والصورة ، ولكنها تضيف نماذج كبيرة فائقة التجسيم ، والتي تلبي أيضا احتياجات الإنسان الرقمي والشخصيات الذكية في الصين وغيرها من الصناعات.
(رسم الخرائط الذكية لمخروط الضوء: منظم وفقا للمعلومات العامة)
علمت Light Cone Intelligence من المطور أنه "في الوقت الحاضر ، تعتبر خصائص منصة Baidu Wenxin Qianfan مثالية ، وخصائص Tongyi Qianwen مرنة ، و Zhipu الذكاء الاصطناعي هي واحدة من الشركات التي لديها أرخص رسوم API بين الشركات المصنعة الرئيسية في السوق."
تبلغ رسوم ChaGLM-Pro 0.01 يوان / ألف رمز ، ويتم منح 18 يوان ، ويتم تخفيض رسوم ChaGLM-Lite إلى 0.002 يوان / ألف رمز. كمرجع ، يتقاضى OpenAI GPT-3.5 0.014 يوان / ألف رمز ، ويتقاضى علي تونغيي تشيانوين-توربو 0.012 يوان / ألف رمز ، ويتقاضى Baidu Wenxin One Word emie-bot-turbo 0.008 يوان / ألف رمز.
كما قال Zhang Peng ، يمر Zhipu الذكاء الاصطناعي أيضا بمرحلة جديدة من "عدم اتباع OpenAI" مع OpenAI كهدف.
فيما يتعلق بأعمال المنتجات ، على عكس OpenAI ، الذي يركز فقط على ترقية وبناء ChatGPT ، اختار Zhipu الذكاء الاصطناعي الهجوم من ثلاثة جوانب.
وفقا لموقعها الرسمي على الإنترنت ، تنقسم الأعمال الحالية ل Zhipu الذكاء الاصطناعي بشكل أساسي إلى ثلاث كتل ، وهي منصة MaaS ذات الطراز الكبير ومنصة الذكاء التكنولوجي AMiner والإنسان الرقمي المعرفي. نتيجة لذلك ، تم تشكيل ثلاث مصفوفات رئيسية لمنتجات الذكاء الاصطناعي ، منتجات نموذجية كبيرة ، منتجات AMiner ومنتجات بشرية رقمية. من بينها ، لا تغطي المنتجات النموذجية الكبيرة روبوتات الحوار الأساسية فحسب ، بل تغطي أيضا البرمجة والكتابة وقسم روبوت قلادة الرسم.
(المصدر: Zhipu الذكاء الاصطناعي الموقع الرسمي)
في الوقت نفسه ، تواصل Zhipu الذكاء الاصطناعي استكشاف جانب التطبيق من خلال الاستثمار. حتى الآن ، استثمرت Zhipu الذكاء الاصطناعي في Lingxin Intelligence و Painting Wall Intelligence ، وزادت من حيازاتها من Lingxin Intelligent مرة أخرى في سبتمبر من هذا العام.
يتم احتضان Lingxin Intelligence أيضا من قسم علوم الكمبيوتر بجامعة Tsinghua ، على الرغم من أن القسم متماثل ، لكن Lingxin Intelligence أكثر ميلا للتطبيق ، والمجتمع التفاعلي AiU الذي طوره هو نموذج كبير مجسم للغاية يعتمد على Zhipu الذكاء الاصطناعي. تشبه فكرة تطوير منتجاتها الذكاء الاصطناعي الشخصيات الأجنبية ، من خلال إنشاء شخصيات الذكاء الاصطناعي بشخصيات وشخصيات مختلفة ، والتفاعل والدردشة معهم ، فهي أكثر ميلا إلى تطبيقات C-end وتؤكد على سمات الترفيه.
** الانتقال من OpenAI إلى LIama: ذكاء بايتشوان **
وجدت Light Cone Intelligence أنه بالمقارنة مع OpenAI ، فإن Baichuan Intelligence يشبه اللاما.
** بادئ ذي بدء ، على أساس التكنولوجيا والخبرة الأصلية ، فإن سرعة الإصدار والتكرار سريعة جدا. **
بعد نصف عام من إنشائها ، أصدرت Baichuan Intelligent على التوالي أربعة نماذج تجارية مفتوحة المصدر من baichuan-7B / 13B و Baichuan2-7B / 13B ونموذجين كبيرين مغلقي المصدر من Baichuan-53B و Baichuan2-53B. اعتبارا من افتتاح واجهة Baichuan2-53B API في 25 سبتمبر ، في الأيام ال 168 الماضية ، أصدرت Baichuan Intelligent نموذجا كبيرا بمعدل متوسط أشهر.
(رسم الخرائط الذكية لمخروط الضوء: منظم وفقا للمعلومات العامة)
تعتمد Meta على LLama2 لاستعادة المركز الذكاء الاصطناعي ، وتشتهر Baichuan Intelligent بهزيمة LLama2 بسلسلة Baichuan2 من النماذج مفتوحة المصدر.
وفقا لنتائج الاختبار ، يتفوق Baichuan2-7B-Base و Baichuan2-13B-Base على LLaMA2 في العديد من معايير التقييم الموثوقة مثل MMLU و CMMLU و GSM8K وما إلى ذلك ، كما أن أدائها مشرق جدا مقارنة بالموديلات الأخرى بكميات كبيرة من نفس المعلمات ، وأدائها أفضل بكثير من أداء منافسي LLaMA2 والنماذج الأخرى من نفس الحجم.
لقد أثبتت الحقائق أن نموذج Baichuan الذكي الكبير قد صمد بالفعل أمام الاختبار. وفقا للبيانات الرسمية ، تم تنزيل Baichuan أكثر من 5 ملايين مرة في مجتمع المصادر المفتوحة وأكثر من 3 ملايين مرة في الشهر.
وجدت Light Cone Intelligent أن نموذج سلسلة Baichuan الذكي يحتوي على أكبر عدد من التنزيلات في مجتمع Hugging Face مفتوح المصدر لأكثر من 110,000 ، والذي لا يزال قادرا على المنافسة بين النماذج الصينية والأجنبية مفتوحة المصدر.
(المصدر: الموقع الرسمي ل Hugging Face)
يرتبط السبب في أن مصدرها المفتوح له مزايا أيضا بتوافقه القوي ، وقد قدمت Baichuan Intelligent للجمهور أن هيكلها الأساسي الكبير بالكامل أقرب إلى هيكل LLAMA من Meta ، لذلك فهو ودود للغاية للشركات والمصنعين من تصميم المصدر المفتوح.
** "بعد المصدر المفتوح ، سيتم بناء البيئة حول LLaMA ، وهناك العديد من المشاريع مفتوحة المصدر في البلدان الأجنبية التي تتبع LLaMA للترويج لها ، وهذا هو السبب في أن هيكلنا أقرب إلى LLaMA." قال وانغ شياو تشوان.
وفقا لذكاء المخروط البصري ، تتبنى Baichuan Intelligent قابلية التوصيل الساخن في تصميم الهندسة المعمارية ، والتي يمكن أن تدعم التبديل العشوائي بين الوحدات المختلفة لنموذج Baichuan ونموذج LLAMA ونموذج Baichuan ، مثل تدريب نموذج مع LLAMA ، دون تعديل ، يمكن وضع النموذج مباشرة في Baichuan للاستخدام. وهذا يفسر أيضا سبب استخدام معظم مصنعي الإنترنت الآن لنموذج Baichuan ، ويقدم بائعو السحابة نموذج سلسلة Baichuan.
الطريق الذي سلكه التاريخ يؤدي إلى الماضي والمستقبل ، وريادة الأعمال الكبيرة لوانغ شياو تشوان هي مثل هذا.
استنادا إلى هوية مؤسس Sogou وتجربة تكنولوجيا البحث ، في الأيام الأولى لريادة الأعمال ، تلقى Wang Xiaochuan تقييمات العديد من الأشخاص ، "Xiaochuan ، هو الأنسب للنماذج الكبيرة."
** أصبح بناء نماذج كبيرة في تجربة البحث والأطر لون الخلفية لذكاء Baichuan. **
قال تشن وي بنغ ، المؤسس المشارك لشركة Baichuan Intelligent Technology ، ذات مرة إن البحث والتطوير في البحث لديه العديد من أوجه التشابه مع تطوير النماذج الكبيرة ، "تنقل Baichuan Intelligent بسرعة تجربة البحث إلى البحث والتطوير للنماذج الكبيرة ، وهو ما يشبه مشروع" بناء الصواريخ "المنهجي ، وتفكيك الأنظمة المعقدة ، وتعزيز تعاون الفريق وتحسين فعالية الفريق من خلال تقييم العملية ".
كما تحدث وانغ شياو تشوان في المؤتمر الصحفي: "نظرا لأن Baichuan Intelligence لديها جين بحث من قبل ، فإنها تعرف بطبيعة الحال كيفية اختيار أفضل الصفحات من وسط تريليونات من صفحات الويب ، والتي يمكن إلغاء تكرارها ومكافحة القمامة." في معالجة البيانات ، تعتمد Baichuan Intelligent أيضا على تجربة عمليات البحث السابقة ، ويمكنها إكمال تنظيف وإلغاء البيانات المكررة لمئات المليارات من البيانات في ساعة واحدة ".
يتم عرض جوهر البحث عن النموذج الكبير بوضوح في Baichuan-53B. في التعامل مع مشكلة "وهم" النماذج الكبيرة ، جنبا إلى جنب مع هطول الأمطار من تكنولوجيا البحث ، جعلت Baichuan Intelligent تحسينات في الحصول على المعلومات ، وتحسين جودة البيانات ، وتحسين البحث.
فيما يتعلق بتحسين جودة البيانات ، فإن الفكرة الأساسية ل Baichuan Intelligent هي "أخذ الأفضل دائما" ، وتصنيف البيانات ذات الجودة المنخفضة والجودة العالية كمعيار ، والتأكد من أن Baichuan2-53B يستخدم دائما بيانات عالية الجودة للتدريب المسبق ؛ فيما يتعلق بالحصول على المعلومات ، قامت Baichuan2-53B بترقية وحدات متعددة ، بما في ذلك المكونات الرئيسية مثل فهم نية التعليمات والبحث الذكي وتحسين النتائج ، من خلال الفهم المتعمق لتعليمات المستخدم ، ودفع البحث بدقة عن مصطلحات الاستعلام ، وأخيرا الجمع بين تقنية نموذج اللغة الكبيرة لتحسين موثوقية توليد نتائج النموذج.
على الرغم من أنها بدأت بالمصدر المفتوح ، إلا أن Baichuan Intelligent بدأت في استكشاف مسار التسويق. وفقا للمعلومات الرسمية ، فإن هدف Baichuan Intelligence هو "بناء أفضل قاعدة نموذجية كبيرة في الصين" ، والهدف من البعد الرأسي هو تعزيز البحث ، والوسائط المتعددة ، والتعليم ، والمجالات الطبية وغيرها.
يتركز تسويق اليوم في Baichuan2-53B ، ويظهر الموقع الرسمي أن استدعاء واجهة برمجة التطبيقات للنموذج يعتمد معيار شحن قائم على الوقت. 0: 00-8: 00 رسوم 0.01 يوان / ألف رمز ، 8: 00-24: 00 رسوم 0.02 يوان / ألف رمز ، بالمقارنة ، فإن سعر الرسوم النهارية أعلى من الليل.
(المصدر: الموقع الرسمي لبايتشوان الذكي)
النهاية
إن مناقشة من هو OpenAI في الصين ليس له معنى كبير في الأيام الأولى لتطوير النموذج الكبير. أدركت العديد من الشركات الناشئة مثل Zhipu الذكاء الاصطناعي و Baichuan Intelligent أن اتباع خطى OpenAI بشكل أعمى أمر غير مستحسن ، على سبيل المثال ، أوضحت Zhipu الذكاء الاصطناعي المسار التقني "لعدم القيام GPT الصيني". علاوة على ذلك ، في الوقت الذي أصبح فيه المصدر المفتوح شائعا ويشكل حصارا ، لا يبدو أن التفوق التكنولوجي المطلق ل OpenAI غير قابل للكسر.
ذكر Zhipu الذكاء الاصطناعي ، Baichuan Intelligent أن التطبيقات الفائقة هي سوق أوسع ، ولكن أيضا منطقة الراحة للشركات النموذجية الكبيرة في الصين ، لم تعد موجودة ، على سبيل المثال ، شخص قريب من Zhipu الذكاء الاصطناعي نشر الأخبار لوسائل الإعلام ، حدد فريق Zhipu الذكاء الاصطناعي بحزم طريق 2B ، الذي يهدف إلى سوق المعلومات والابتكار ، وفي غضون 5 أشهر ، وسع الفريق بسرعة ، من 200 إلى 500 شخص ، للقوى العاملة الاحتياطية التجارية اللاحقة 2B.
في مسار التسويق ، اختارت Baichuan Intelligent الإشارة إلى بيئة المصدر المفتوح ل Llama2 ، وبدأت أيضا في التكرار بخطوات صغيرة.
يمكن أن نرى بالعين المجردة أنه في نصف عام فقط ، مرت Baichuan Intelligent و Zhipu الذكاء الاصطناعي بالأرض الحرام التكنولوجية ووصلت إلى مرحلة التسويق للهبوط الصناعي. بالمقارنة مع ازدهار ريادة الأعمال في الذكاء الاصطناعي 1.0 ، فإن فترة تلميع التكنولوجيا تصل إلى 3 سنوات (2016-2019) ، وبسبب العوائق في الهبوط التجاري على وجه التحديد ، سينخفض عدد كبير من الشركات الذكاء الاصطناعي بشكل جماعي في عام 2022 وتسقط قبل الفجر.
التعلم من دروس المرحلة السابقة ، ولكن أيضا لأن تعدد استخدامات تكنولوجيا النماذج الكبيرة أكثر ملاءمة للهبوط ، تقوم الشركات الناشئة التي تمثلها Baichuan Intelligence و Zhipu الذكاء الاصطناعي بتربية القوات والخيول لإعداد التكنولوجيا والمنتجات واحتياطيات المواهب للمرحلة التالية.
ومع ذلك ، لم تسمع الطلقات النارية الأولى إلا في الماراثون ، وكان من السابق لأوانه القول إن النتيجة كانت مبكرة جدا. ولكن على الأقل تم تحلل المرحلة الأولى من المسار ، وبعد أن يكون الهدف واضحا ، تكون المنافسة أكثر صبرا ومثابرة. هذا هو نفسه بالنسبة ل Baichuan Intelligence أو Zhipu الذكاء الاصطناعي أو OpenAI.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
بايتشوان مقابل زيبو ، من هو OpenAI الصيني؟
مصدر المادة: ضوء مخروط الاستخبارات *
النص: هاو شين *
المحرر: ليو يوتشي
في أوائل يونيو ، أصدرت وسائل الإعلام الأجنبية تعذيبا ل "من هو OpenAI في الصين" ، وبعد تجربة موجة ريادة الأعمال الكبيرة ، اندفعت الأمواج الكبيرة إلى الرمال ، ولم يتبق سوى عدد قليل من الناس في النهاية.
مبنى Xaar على بعد عدد قليل من التقاطعات خارج جامعة Tsinghua هو ذكاء Baichuan لرجل الأعمال النجم Wang Xiaochuan ، ومبنى شبكة Sohu هو طيف الحكمة الذي أرسلته الأكاديمية الذكاء الاصطناعي. بعد اجتياز اختبار السوق ، أصبحا أكثر المرشحين الواعدين.
يبدو أن المعركة على المبنيين قد بدأت بهدوء.
** من منظور التمويل ، أكملت Zhipu الذكاء الاصطناعي و Baichuan Intelligent جولات متعددة من التمويل واسع النطاق هذا العام. **
هذا العام ، تجاوز إجمالي مبلغ التمويل التراكمي ل Zhipu الذكاء الاصطناعي 2.5 مليار يوان ، وبلغ إجمالي مبلغ التمويل لشركة Baichuan Intelligent 350 مليون دولار أمريكي (حوالي 2.3 مليار يوان). وفقا للمعلومات العامة ، تجاوز التقييم الأخير ل ** Zhipu الذكاء الاصطناعي 10 مليارات يوان ، وهو أعلى أو 15 مليار ، وهي واحدة من أسرع الشركات المحلية بتقييم يزيد عن 10 مليارات يوان ؛ ** بعد الجولة الأخيرة من التمويل ، تم تقييم Baichuan Intelligent بأكثر من 1 مليار دولار أمريكي (حوالي 6.6 مليار يوان).
من منظور تكوين الفريق ، يخرج كل من Zhipu الذكاء الاصطناعي و Baichuan Intelligent Master من نفس المنزل ، ووانغ شاولان ، رئيس Zhipu الذكاء الاصطناعي ، ووانغ شياو تشوان ، مؤسس Sogou ، كلاهما فريقان رياديان في قسم Tsinghua.
** من منظور سرعة اللحاق بالركب التكنولوجي ، لا يمكن التمييز بين الاثنين أيضا. ** هزم GLM-130B من Zhipu الذكاء الاصطناعي GPT-3 بمجرد ظهوره ، ويتقدم Baichuan 2 الذي تم إصداره حديثا على Llama 2 في جميع الأبعاد ، وهو رائد في تطوير النظام البيئي مفتوح المصدر في الصين.
تشير جميع المؤشرات إلى أن Zhipu الذكاء الاصطناعي و Baichuan Intelligence أصبحا "الخيول السوداء" لمسار النموذج الكبير في الصين ، وفي ظل المنافسة الشرسة ، من هو الغزلان الميتة؟
المؤمنون بالذكاء الاصطناعي المفتوح: الحكمة الذكاء الاصطناعي
يمكن إرجاع العلاقة بين Zhipu الذكاء الاصطناعي و OpenAI إلى عام 2020 ، والذي اعتبره Zhang Peng ، الرئيس التنفيذي لشركة Zhipu الذكاء الاصطناعي ، "السنة الأولى الحقيقية لنموذج اللغة الكبيرة" الذكاء الاصطناعي قلبه.
يمكن إرجاع العلاقة بين Zhipu الذكاء الاصطناعي و OpenAI إلى عام 2020 ، والذي اعتبره Zhang Peng ، الرئيس التنفيذي لشركة Zhipu الذكاء الاصطناعي ، "السنة الأولى الحقيقية لنموذج اللغة الكبيرة" الذكاء الاصطناعي قلبه.
في ذكرى Zhipu الذكاء الاصطناعي ، في الجو البهيج ، يمكنك شم بعض القلق الناجم عن ولادة GPT-3 من وقت لآخر. GPT-3 ، الذي يصل إلى 175 مليار معلمة ، هو أول نموذج لغوي كبير بالمعنى الدقيق للكلمة.
في ذلك الوقت ، لم يصدم تشانغ بنغ بقدرة ظهور GPT-3 فحسب ، بل وقع أيضا في التفكير في "ما إذا كان يجب متابعة" ، سواء كان ذلك في ذلك الوقت أو الآن ، كل ذلك في اتجاه نموذج كبير المعلمة على نطاق واسع للغاية هو شيء محفوف بالمخاطر للغاية. بعد الموازنة ، قررت Zhipu الذكاء الاصطناعي اتخاذ OpenAI كمعيار لها والاستثمار في تطوير نماذج ما قبل التدريب على نطاق واسع للغاية.
** من حيث اختيار مسار التكنولوجيا ، فإن Zhipu الذكاء الاصطناعي لديها نفس التفكير المستقل مثل OpenAI. **
في ذلك الوقت ، كان هناك العديد من أطر ما قبل التدريب النموذجية الكبيرة مثل BERT و GPT و T5. المسارات الثلاثة لها مزاياها وعيوبها من حيث هدف التدريب وهيكل النموذج ومصدر بيانات التدريب وحجم النموذج.
إذا تمت مقارنة عملية التدريب النموذجية الكبيرة بامتحان اللغة الإنجليزية ، فإن BERT جيد في الإجابة على الأسئلة من خلال العلاقة بين الكلمات والجمل ، وإجراء الاختبار من خلال الفهم ، وتأتي مواد المراجعة الخاصة به بشكل أساسي من الكتب المدرسية وويكيبيديا ؛ GPT جيدة في التنبؤ بالكلمة التالية للقيام بالأسئلة ، والتحضير للامتحان من خلال الكثير من ممارسة الكتابة ، وتأتي مواد المراجعة الخاصة بها بشكل أساسي من مجموعة متنوعة من صفحات الويب. تتبنى T5 استراتيجية إضفاء الطابع الرسمي على الأسئلة ، أولا ترجمة الأسئلة إلى اللغة الصينية ثم حل الأسئلة ، وعند المراجعة ، ليس فقط قراءة الكتاب المدرسي ، ولكن أيضا تنظيف عدد كبير من بنوك الأسئلة.
كما نعلم جميعا ، اختارت Google BERT ، واختار OpenAI GPT ، ولم يتبع Zhipu الذكاء الاصطناعي بشكل أعمى ، ** بناء على هذين الطريقين ، اقترح إطار خوارزمية GLM (نموذج اللغة العام). يدرك الإطار في الواقع المزايا والعيوب التكميلية ل BERT و GPT ، "والتي يمكن فهمها أثناء الاستمرار وملء الفراغات". **
وهكذا أصبحت GLM أكبر ثقة ل Zhipu الذكاء الاصطناعي لمتابعة OpenAI ، وفي ظل هذا الإطار ، نمت نماذج سلسلة GLM مثل GLM-130B و ChatGLM-6B و ChatGLM2-6B على التوالي. تظهر البيانات التجريبية أن النماذج الكبيرة من سلسلة GLM تتفوق على GPT من حيث دقة فهم اللغة وسرعة الاستدلال ونسبة الذاكرة وتطبيق تكييف النموذج الكبير.
تعد OpenAI حاليا المؤسسة الأكثر اكتمالا التي يمكنها تقديم خدمات نموذجية أساسية في الخارج ، وينقسم تسويقها بشكل أساسي إلى فئتين ، إحداهما رسوم جمع واجهة برمجة التطبيقات ، والأخرى هي رسوم اشتراك ChatGPT. من حيث التسويق ، تتبع Zhipu الذكاء الاصطناعي أيضا الفكرة العامة وهي في مستوى الشركات ذات التسويق الناضج نسبيا للنماذج المحلية الكبيرة.
وفقا للتمشيط الذكي للمخروط البصري ، جنبا إلى جنب مع هبوط الشركات الصينية ، ينقسم نموذج أعمال ** Zhipu الذكاء الاصطناعي إلى رسوم تحصيل API ووضع رسوم الخصخصة. **
الأنواع الإجمالية للنماذج المقدمة هي نماذج اللغة الكبيرة ، والنماذج الكبيرة فائقة التجسيم ، والنماذج الكبيرة المتجهة ، والنماذج الكبيرة المشفرة ، وتحت كل خيار نموذج كبير ، بما في ذلك التسعير القياسي والتسعير الخاص السحابي والتسعير الخاص المحلي. بالمقارنة مع OpenAI ، تفتقر Zhapu الذكاء الاصطناعي إلى توفير خدمات النماذج الكبيرة للصوت والصورة ، ولكنها تضيف نماذج كبيرة فائقة التجسيم ، والتي تلبي أيضا احتياجات الإنسان الرقمي والشخصيات الذكية في الصين وغيرها من الصناعات.
علمت Light Cone Intelligence من المطور أنه "في الوقت الحاضر ، تعتبر خصائص منصة Baidu Wenxin Qianfan مثالية ، وخصائص Tongyi Qianwen مرنة ، و Zhipu الذكاء الاصطناعي هي واحدة من الشركات التي لديها أرخص رسوم API بين الشركات المصنعة الرئيسية في السوق."
تبلغ رسوم ChaGLM-Pro 0.01 يوان / ألف رمز ، ويتم منح 18 يوان ، ويتم تخفيض رسوم ChaGLM-Lite إلى 0.002 يوان / ألف رمز. كمرجع ، يتقاضى OpenAI GPT-3.5 0.014 يوان / ألف رمز ، ويتقاضى علي تونغيي تشيانوين-توربو 0.012 يوان / ألف رمز ، ويتقاضى Baidu Wenxin One Word emie-bot-turbo 0.008 يوان / ألف رمز.
كما قال Zhang Peng ، يمر Zhipu الذكاء الاصطناعي أيضا بمرحلة جديدة من "عدم اتباع OpenAI" مع OpenAI كهدف.
فيما يتعلق بأعمال المنتجات ، على عكس OpenAI ، الذي يركز فقط على ترقية وبناء ChatGPT ، اختار Zhipu الذكاء الاصطناعي الهجوم من ثلاثة جوانب.
وفقا لموقعها الرسمي على الإنترنت ، تنقسم الأعمال الحالية ل Zhipu الذكاء الاصطناعي بشكل أساسي إلى ثلاث كتل ، وهي منصة MaaS ذات الطراز الكبير ومنصة الذكاء التكنولوجي AMiner والإنسان الرقمي المعرفي. نتيجة لذلك ، تم تشكيل ثلاث مصفوفات رئيسية لمنتجات الذكاء الاصطناعي ، منتجات نموذجية كبيرة ، منتجات AMiner ومنتجات بشرية رقمية. من بينها ، لا تغطي المنتجات النموذجية الكبيرة روبوتات الحوار الأساسية فحسب ، بل تغطي أيضا البرمجة والكتابة وقسم روبوت قلادة الرسم.
في الوقت نفسه ، تواصل Zhipu الذكاء الاصطناعي استكشاف جانب التطبيق من خلال الاستثمار. حتى الآن ، استثمرت Zhipu الذكاء الاصطناعي في Lingxin Intelligence و Painting Wall Intelligence ، وزادت من حيازاتها من Lingxin Intelligent مرة أخرى في سبتمبر من هذا العام.
يتم احتضان Lingxin Intelligence أيضا من قسم علوم الكمبيوتر بجامعة Tsinghua ، على الرغم من أن القسم متماثل ، لكن Lingxin Intelligence أكثر ميلا للتطبيق ، والمجتمع التفاعلي AiU الذي طوره هو نموذج كبير مجسم للغاية يعتمد على Zhipu الذكاء الاصطناعي. تشبه فكرة تطوير منتجاتها الذكاء الاصطناعي الشخصيات الأجنبية ، من خلال إنشاء شخصيات الذكاء الاصطناعي بشخصيات وشخصيات مختلفة ، والتفاعل والدردشة معهم ، فهي أكثر ميلا إلى تطبيقات C-end وتؤكد على سمات الترفيه.
** الانتقال من OpenAI إلى LIama: ذكاء بايتشوان **
وجدت Light Cone Intelligence أنه بالمقارنة مع OpenAI ، فإن Baichuan Intelligence يشبه اللاما.
** بادئ ذي بدء ، على أساس التكنولوجيا والخبرة الأصلية ، فإن سرعة الإصدار والتكرار سريعة جدا. **
بعد نصف عام من إنشائها ، أصدرت Baichuan Intelligent على التوالي أربعة نماذج تجارية مفتوحة المصدر من baichuan-7B / 13B و Baichuan2-7B / 13B ونموذجين كبيرين مغلقي المصدر من Baichuan-53B و Baichuan2-53B. اعتبارا من افتتاح واجهة Baichuan2-53B API في 25 سبتمبر ، في الأيام ال 168 الماضية ، أصدرت Baichuan Intelligent نموذجا كبيرا بمعدل متوسط أشهر.
تعتمد Meta على LLama2 لاستعادة المركز الذكاء الاصطناعي ، وتشتهر Baichuan Intelligent بهزيمة LLama2 بسلسلة Baichuan2 من النماذج مفتوحة المصدر.
وفقا لنتائج الاختبار ، يتفوق Baichuan2-7B-Base و Baichuan2-13B-Base على LLaMA2 في العديد من معايير التقييم الموثوقة مثل MMLU و CMMLU و GSM8K وما إلى ذلك ، كما أن أدائها مشرق جدا مقارنة بالموديلات الأخرى بكميات كبيرة من نفس المعلمات ، وأدائها أفضل بكثير من أداء منافسي LLaMA2 والنماذج الأخرى من نفس الحجم.
لقد أثبتت الحقائق أن نموذج Baichuan الذكي الكبير قد صمد بالفعل أمام الاختبار. وفقا للبيانات الرسمية ، تم تنزيل Baichuan أكثر من 5 ملايين مرة في مجتمع المصادر المفتوحة وأكثر من 3 ملايين مرة في الشهر.
وجدت Light Cone Intelligent أن نموذج سلسلة Baichuan الذكي يحتوي على أكبر عدد من التنزيلات في مجتمع Hugging Face مفتوح المصدر لأكثر من 110,000 ، والذي لا يزال قادرا على المنافسة بين النماذج الصينية والأجنبية مفتوحة المصدر.
يرتبط السبب في أن مصدرها المفتوح له مزايا أيضا بتوافقه القوي ، وقد قدمت Baichuan Intelligent للجمهور أن هيكلها الأساسي الكبير بالكامل أقرب إلى هيكل LLAMA من Meta ، لذلك فهو ودود للغاية للشركات والمصنعين من تصميم المصدر المفتوح.
** "بعد المصدر المفتوح ، سيتم بناء البيئة حول LLaMA ، وهناك العديد من المشاريع مفتوحة المصدر في البلدان الأجنبية التي تتبع LLaMA للترويج لها ، وهذا هو السبب في أن هيكلنا أقرب إلى LLaMA." قال وانغ شياو تشوان.
وفقا لذكاء المخروط البصري ، تتبنى Baichuan Intelligent قابلية التوصيل الساخن في تصميم الهندسة المعمارية ، والتي يمكن أن تدعم التبديل العشوائي بين الوحدات المختلفة لنموذج Baichuan ونموذج LLAMA ونموذج Baichuan ، مثل تدريب نموذج مع LLAMA ، دون تعديل ، يمكن وضع النموذج مباشرة في Baichuan للاستخدام. وهذا يفسر أيضا سبب استخدام معظم مصنعي الإنترنت الآن لنموذج Baichuan ، ويقدم بائعو السحابة نموذج سلسلة Baichuan.
الطريق الذي سلكه التاريخ يؤدي إلى الماضي والمستقبل ، وريادة الأعمال الكبيرة لوانغ شياو تشوان هي مثل هذا.
استنادا إلى هوية مؤسس Sogou وتجربة تكنولوجيا البحث ، في الأيام الأولى لريادة الأعمال ، تلقى Wang Xiaochuan تقييمات العديد من الأشخاص ، "Xiaochuan ، هو الأنسب للنماذج الكبيرة."
** أصبح بناء نماذج كبيرة في تجربة البحث والأطر لون الخلفية لذكاء Baichuan. **
قال تشن وي بنغ ، المؤسس المشارك لشركة Baichuan Intelligent Technology ، ذات مرة إن البحث والتطوير في البحث لديه العديد من أوجه التشابه مع تطوير النماذج الكبيرة ، "تنقل Baichuan Intelligent بسرعة تجربة البحث إلى البحث والتطوير للنماذج الكبيرة ، وهو ما يشبه مشروع" بناء الصواريخ "المنهجي ، وتفكيك الأنظمة المعقدة ، وتعزيز تعاون الفريق وتحسين فعالية الفريق من خلال تقييم العملية ".
كما تحدث وانغ شياو تشوان في المؤتمر الصحفي: "نظرا لأن Baichuan Intelligence لديها جين بحث من قبل ، فإنها تعرف بطبيعة الحال كيفية اختيار أفضل الصفحات من وسط تريليونات من صفحات الويب ، والتي يمكن إلغاء تكرارها ومكافحة القمامة." في معالجة البيانات ، تعتمد Baichuan Intelligent أيضا على تجربة عمليات البحث السابقة ، ويمكنها إكمال تنظيف وإلغاء البيانات المكررة لمئات المليارات من البيانات في ساعة واحدة ".
يتم عرض جوهر البحث عن النموذج الكبير بوضوح في Baichuan-53B. في التعامل مع مشكلة "وهم" النماذج الكبيرة ، جنبا إلى جنب مع هطول الأمطار من تكنولوجيا البحث ، جعلت Baichuan Intelligent تحسينات في الحصول على المعلومات ، وتحسين جودة البيانات ، وتحسين البحث.
على الرغم من أنها بدأت بالمصدر المفتوح ، إلا أن Baichuan Intelligent بدأت في استكشاف مسار التسويق. وفقا للمعلومات الرسمية ، فإن هدف Baichuan Intelligence هو "بناء أفضل قاعدة نموذجية كبيرة في الصين" ، والهدف من البعد الرأسي هو تعزيز البحث ، والوسائط المتعددة ، والتعليم ، والمجالات الطبية وغيرها.
يتركز تسويق اليوم في Baichuan2-53B ، ويظهر الموقع الرسمي أن استدعاء واجهة برمجة التطبيقات للنموذج يعتمد معيار شحن قائم على الوقت. 0: 00-8: 00 رسوم 0.01 يوان / ألف رمز ، 8: 00-24: 00 رسوم 0.02 يوان / ألف رمز ، بالمقارنة ، فإن سعر الرسوم النهارية أعلى من الليل.
النهاية
إن مناقشة من هو OpenAI في الصين ليس له معنى كبير في الأيام الأولى لتطوير النموذج الكبير. أدركت العديد من الشركات الناشئة مثل Zhipu الذكاء الاصطناعي و Baichuan Intelligent أن اتباع خطى OpenAI بشكل أعمى أمر غير مستحسن ، على سبيل المثال ، أوضحت Zhipu الذكاء الاصطناعي المسار التقني "لعدم القيام GPT الصيني". علاوة على ذلك ، في الوقت الذي أصبح فيه المصدر المفتوح شائعا ويشكل حصارا ، لا يبدو أن التفوق التكنولوجي المطلق ل OpenAI غير قابل للكسر.
ذكر Zhipu الذكاء الاصطناعي ، Baichuan Intelligent أن التطبيقات الفائقة هي سوق أوسع ، ولكن أيضا منطقة الراحة للشركات النموذجية الكبيرة في الصين ، لم تعد موجودة ، على سبيل المثال ، شخص قريب من Zhipu الذكاء الاصطناعي نشر الأخبار لوسائل الإعلام ، حدد فريق Zhipu الذكاء الاصطناعي بحزم طريق 2B ، الذي يهدف إلى سوق المعلومات والابتكار ، وفي غضون 5 أشهر ، وسع الفريق بسرعة ، من 200 إلى 500 شخص ، للقوى العاملة الاحتياطية التجارية اللاحقة 2B.
في مسار التسويق ، اختارت Baichuan Intelligent الإشارة إلى بيئة المصدر المفتوح ل Llama2 ، وبدأت أيضا في التكرار بخطوات صغيرة.
يمكن أن نرى بالعين المجردة أنه في نصف عام فقط ، مرت Baichuan Intelligent و Zhipu الذكاء الاصطناعي بالأرض الحرام التكنولوجية ووصلت إلى مرحلة التسويق للهبوط الصناعي. بالمقارنة مع ازدهار ريادة الأعمال في الذكاء الاصطناعي 1.0 ، فإن فترة تلميع التكنولوجيا تصل إلى 3 سنوات (2016-2019) ، وبسبب العوائق في الهبوط التجاري على وجه التحديد ، سينخفض عدد كبير من الشركات الذكاء الاصطناعي بشكل جماعي في عام 2022 وتسقط قبل الفجر.
التعلم من دروس المرحلة السابقة ، ولكن أيضا لأن تعدد استخدامات تكنولوجيا النماذج الكبيرة أكثر ملاءمة للهبوط ، تقوم الشركات الناشئة التي تمثلها Baichuan Intelligence و Zhipu الذكاء الاصطناعي بتربية القوات والخيول لإعداد التكنولوجيا والمنتجات واحتياطيات المواهب للمرحلة التالية.
ومع ذلك ، لم تسمع الطلقات النارية الأولى إلا في الماراثون ، وكان من السابق لأوانه القول إن النتيجة كانت مبكرة جدا. ولكن على الأقل تم تحلل المرحلة الأولى من المسار ، وبعد أن يكون الهدف واضحا ، تكون المنافسة أكثر صبرا ومثابرة. هذا هو نفسه بالنسبة ل Baichuan Intelligence أو Zhipu الذكاء الاصطناعي أو OpenAI.