أفضل علاج للهلوسة في البلاد! مع 53 مليار معلمة، ارتفعت قدرة Baichuan2 على التفكير بنسبة 100%، وتم فتح واجهة برمجة التطبيقات للاستخدام التجاري لأول مرة.

2023-09-26 04:13:21

المصدر الأصلي: Xinzhiyuan

مصدر الصورة: تم إنشاؤها بواسطة Unbounded AI

تمت ترقية النموذج الكبير لـ Baichuan بالكامل بالأمس!

في 25 سبتمبر فقط، أصدرت Baichuan Intelligent رسميًا الطراز الكبير الذي تمت ترقيته حديثًا والذي يبلغ 53 مليار معلمة - Baichuan2-53B.

عنوان الخبرة:

هذه المرة، تم تحسين قدراته على التفكير الرياضي والمنطقي بشكل ملحوظ.

والأهم من ذلك، أنه من خلال نظام البيانات عالي الجودة وتحسين البحث، تم تقليل هلوسة Baichuan2-53B بشكل كبير، مما يجعلها أكبر نموذج محلي بأقل مشكلة هلوسة.

ليس هذا فحسب، باعتبارها واحدة من أولى الشركات النموذجية الكبيرة التي اجتازت عملية التسجيل، فتحت Baichuan Intelligence أيضًا واجهة Baichuan2-53B API.

وهذا يعني أن Baichuan Intelligence دخلت رسميًا إلى مجال To B وستبدأ عملية التسويق من الآن فصاعدًا.

معالجة الوهم، متقدمة جدًا في الصين

والشيء الأكثر جدارة بالملاحظة هو أن Baichuan2-53B الذي تمت ترقيته حديثًا يتقدم بالفعل بفارق كبير في الصناعة المحلية من حيث المعالجة "الوهمية".

بكل بساطة، "الوهم" يعني أن LLM غالبًا ما يتحدث بجدية وهراء دون أي حقائق معروفة تدعمه.

وعلى الرغم من أن GPT-4 يؤدي أداءً جيدًا في مجموعة متنوعة من المهام، إلا أنه لا يمكنه الهروب من هذه اللعنة.

فلماذا تظهر النماذج الكبيرة "الهلوسة"؟

في أبريل، تحدث جون شولمان، المؤسس المشارك لـ OpenAI وعالم الأبحاث، عن الصعوبات التي يصعب التغلب عليها باستخدام النماذج الكبيرة في خطاب ألقاه في جامعة كاليفورنيا في بيركلي.

من وجهة نظر شولمان، هناك "رسم بياني معرفي" مخفي داخل الصندوق الأسود لماجستير القانون. إذا لم تكن هناك معرفة في هذه البنية، وكان تدريس المعرفة النموذجية الكبيرة (أي الاستنساخ السلوكي) فقط من خلال SFT هو في الواقع تعليمها لإخراج الأوهام.

ردًا على هذه المشكلة، كيف يمكن لشركة Baichuan Intelligence تحقيق الأداء الرائد في الصناعة في "معالجة الوهم" للنماذج الكبيرة؟

فيما يتعلق ببناء البيانات عالية الجودة، أنشأ Baichuan2-53B نظامًا فريدًا لجودة البيانات.

قم بتصنيف البيانات بناءً على معايير منخفضة الجودة وعالية الجودة للتأكد من أن Baichuan2-53B يستخدم دائمًا بيانات عالية الجودة للتدريب المسبق.

بالإضافة إلى ذلك، فيما يتعلق بالحصول على المعلومات، قام Baichuan2-53B بترقية وحدات متعددة، بما في ذلك المكونات الرئيسية مثل فهم غرض الأوامر والبحث الذكي وتحسين النتائج.

يقود هذا النظام الشامل البحث عن مصطلحات الاستعلام بدقة من خلال الفهم العميق لتعليمات المستخدم، وأخيرًا يجمع بين تقنية نماذج اللغة الكبيرة لتحسين موثوقية توليد نتائج النموذج، وتحقيق نتائج إجابات نموذجية أكثر دقة وذكاءً، وتقليل أوهام النموذج.

على سبيل المثال، عندما يتعلق الأمر بشرح مشكلة "الربط بثلاثة خيوط وأربعة سلاسل وخمسة"، فمن الواضح أن GPT-4 يتحدث هراء.

وفي المقابل، أعطى Baichuan2-53B الإجابة الصحيحة في المرة الأولى.

على سبيل المثال، إجابة Baichuan2-53B على السؤال الكلاسيكي "هل Zhou Shuren وLu Xun هما نفس الشخص؟" هي إجابة شاملة ودقيقة.

يمكن ملاحظة أنه من خلال بناء نظام بيانات عالي الجودة وتحسين تقنية تحسين البحث، يقلل Baichuan2-53B بشكل فعال من وهم النموذج.

تظهر النتائج بعد تقييم FacTool أن Baichuan2-53B حصل على درجة شاملة تبلغ 140.5، ليحتل المرتبة الثانية بعد GPT-4 بين النماذج الكبيرة الأساسية السائدة، وهو على المستوى الرائد المحلي.

FacTool هو إطار عام تم اقتراحه بشكل مشترك من قبل علماء من جامعة شنغهاي جياو تونغ، وجامعة كارنيجي ميلون، وجامعة مدينة هونغ كونغ، وميتا وغيرها من المؤسسات، ويمكنه التحقق من الدقة الواقعية للمحتوى الناتج عن النماذج الكبيرة (يمكنه أيضًا التحقق من الدقة الواقعية المحتوى العام).الجنس).

عنوان المشروع:

ترقية القدرة، والتفكير بنسبة 100%

في الواقع، يعد Baichuan2-53B بالفعل النموذج الكبير السادس الذي أصدرته شركة Baichuan Intelligence.

منذ تأسيس شركة Baichuan Intelligence في 10 أبريل، كانت تبتكر بسرعة مذهلة، وقد وصلت سرعة التكرار إلى متوسط إطلاق نموذج كبير كل 28 يومًا!

في وقت مبكر من 8 أغسطس، عندما تم إصدار Baichuan2-53B لأول مرة، أظهر أسئلة وأجوبة معرفية ممتازة وقدرات على الإبداع الأدبي.

إذا كنت تريد أن تسأل ما هي المؤشرات المهمة لتقييم ما إذا كان النموذج الكبير هو الرائد، فأعتقد أن "قدرات التفكير الرياضي والمنطقي" ستكون الإجابة التي يقدمها العديد من الأشخاص في الصناعة.

هذه المرة، استنادًا إلى Baichuan-53B، يركز Baichuan2-53B على تعزيز قدراته على التفكير الرياضي والمنطقي، كما يقوم أيضًا بترقية قدراته الشاملة بشكل شامل.

على وجه التحديد، زادت قدرته على التفكير المنطقي بنسبة 100%، وزادت قدرته الرياضية بنسبة 31%، وزادت قدرته على فهم اللغة بنسبة 29%، وزادت قدرته على إنشاء النص بنسبة 18%، كما زادت قدرته على السؤال والإجابة المعرفية. بنسبة 9%.

### المنطق الرياضي

يمكن لـ Baichuan2-53B، الذي قام بترقية قدرته الرياضية بشكل كبير، حل المسائل الرياضية اللفظية بسهولة.

على سبيل المثال، مجموع رقمين هو 572، ورقم الآحاد لأحد المضافات هو 0. وبعد إزالة الصفر، يكون هو نفس المضاف الثاني. إذًا، ما هذين الرقمين؟

يسرد Baichuan2-53B المعادلة، على افتراض أن أحد الإضافات هو 10A والآخر هو B، ومن ثم بناءً على الشروط المعروفة، يتم الحصول على الحل الصحيح.

للحصول على مثال آخر، في السؤال أدناه، قام Baichuan2-53B أولاً بحساب إجمالي إيرادات النقل، ثم قسمه على الخسارة لكل صندوق زجاجي للحصول على عدد الصناديق الزجاجية التالفة.

لنأخذ سؤالًا كلاسيكيًا آخر: "كم كيلومترًا هي المسافة بين مكانين؟" حصل Baichuan2-53B على الإجابة الصحيحة من خلال حسابات خطوة بخطوة.

ومن حيث المنطق، فلنبدأ بسؤال بسيط: قالت توقعات الطقس إنها ستمطر يوم الأربعاء، وقد هطلت الأمطار أمس. في أي يوم من أيام الأسبوع هذا اليوم؟

جاء Baichuan2-53B بسهولة بـ "الخميس"!

بعد ذلك، يكون المنطق أكثر صعوبة بعض الشيء: لنفترض أن هناك بركة بها مياه لا حصر لها.

توجد غلايتين فارغتين بسعة 5 لتر و6 لتر على التوالي. كيف يمكنني الحصول على 3 لترات من الماء من البركة باستخدام هاتين الغلايتين فقط؟

بدأ Baichuan2-53B في الإجابة بسلاسة وأعطى الإجابة الصحيحة خلال 6 خطوات.

بعد عدة جولات من الاختبار، يمكن العثور على أن قدرات التفكير الرياضي والمنطقي لـ Baichuan2-53B الذي تمت ترقيته تختلف بالفعل عن تلك الموجودة في نفس النموذج. لقد تحسن بشكل كبير في المواضيع التي لم يكن جيدًا فيها من قبل.

مشكلة تتعلق بالتوقيت

من حيث التوقيت المناسب، أداء Baichuan2-53B ممتاز.

افتتحت للتو دورة الألعاب الآسيوية في هانغتشو، وأصغر لاعب يبلغ من العمر 9 سنوات فقط. أجاب Baichuan2-53B أيضًا على السؤال الأخير بشكل صحيح.

وقد أوضح Baichuan2-53B بدقة مبدأ الشبكة العصبية وراء أوبتيموس، وهو الروبوت البشري الذي أعلنت عنه شركة تسلا للتو.

على سبيل المثال، في أوائل سبتمبر من هذا العام، اختتم مهرجان البندقية السينمائي الثمانين في إيطاليا.

هل فاز أي من الأفلام والممثلين الصينيين بجوائز في هذا المهرجان السينمائي؟

أجاب Baichuan2-53B على الفور أن فيلم "Love is a Gun" للمخرج Li Hongqi فاز بجائزة أفضل فيلم روائي طويل، وفاز Tony Leung بجائزة الأسد الذهبي لإنجاز العمر.

وينتهي عقد بوس مي مع باريس في نهاية يونيو من هذا العام، وانضم رسميًا إلى إنتر ميامي في يوليو.

يعرف Baichuan2-53B هذا أيضًا جيدًا.

وبالمثل، يمكن أيضًا أن يخبرك بدقة أن Druid فاز بما مجموعه 24 بطولة من البطولات الأربع الكبرى، بما في ذلك هذه البطولة في عام 2023.

افتح واجهة برمجة التطبيقات (API) وأدخل الاستخدام التجاري رسميًا

ليس هذا فحسب، فهذه المرة افتتح Baichuan2-53B أيضًا رسميًا واجهة API، مما سمح للشركات والمطورين بدمج النموذج في تطبيقاتهم وخدماتهم.

عنوان واجهة برمجة التطبيقات:

هل هناك حد معين لهذه الخدمة؟

ويمكن القول أن لا شيء تقريبا. واجهة API الخاصة بـ Baichuan2-53B مريحة للغاية وسهلة الاستخدام، ولا تتطلب سوى تكوين وتكامل بسيط للوصول إليها.

علاوة على ذلك، فهو متوافق إلى حد كبير مع واجهة OpenAI، التي تسمح للعملاء بالانتقال بسرعة، مما يقلل بشكل كبير من تكاليف نشر النموذج وتكاليف التحويل.

باختصار، سواء أكان الأمر يتعلق بخدمة عملاء ذكية أو كتابة ذكية أو توصية ذكية، يمكن دعم كل ذلك بقدرات النماذج الكبيرة.

أكثر ما يثير قلق مستخدمي المؤسسات هو مشكلات الامتثال الأمني.

ليست هناك حاجة للقلق بشأن هذا.

باعتبارها واحدة من أولى شركات النماذج واسعة النطاق التي اجتازت "التدابير المؤقتة لإدارة خدمات الذكاء الاصطناعي التوليدي"، أنشأت Baichuan Intelligent تحسينات أمنية لـ Baichuan2-53B تغطي الدورة الكاملة للتدريب المسبق للنماذج واسعة النطاق، والتحسينات الدقيقة. الضبط والاستدلال يمكن القول أن العملية برمتها تحت الأمان.

بفضل إمكانات الطراز الغنية والقوية لـ Baichuan2-53B، لا يمكن لمستخدمي المؤسسات ترقية الخدمات الحالية وخفض التكاليف فحسب، بل يمكنهم أيضًا استكشاف المزيد من سيناريوهات التطبيق.

ويعتقد أنه في هذه اللحظة، هناك بالفعل موجة كبيرة من الابتكارات المثيرة للإعجاب تختمر في التربة.

مراجع:

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 1

أعجبني
1
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
1/3
1Simple Earn Annual Rate 24.4%
39k درجة الشعبية
2Gate Launchpad List IKA
41k درجة الشعبية
3ETH Trading Volume Surges
42k درجة الشعبية
4Gate ETH 10th Anniversary Celebration
22k درجة الشعبية
5Trump’s AI Strategy
18k درجة الشعبية

تثبيت

خريطة الموقع