تقدمت شركة OpenAI بطلب للحصول على العلامة التجارية GPT-5 ، متى سيتم إصدارها؟ ما هي القدرات الجديدة التي ستجلبها؟

المصدر الأصلي: AGI Innovation Lab

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI‌

في الأول من أغسطس ، قدمت شركة OpenAI رسميًا طلب علامة تجارية لـ "GPT-5" ، والذي يغطي ما يلي:

  • البرامج التي تولد الكلام والنصوص البشرية بشكل مصطنع
  • تحويل ملفات البيانات الصوتية إلى نص
  • التعرف على الصوت والكلام
  • معالجة اللغة والكلام القائمة على التعلم الآلي

وفقًا لوثائق تطبيق العلامات التجارية الخاصة بـ GPT-5 ، تغطي العلامة التجارية GPT-5 وظيفة الذكاء الاصطناعي لتوليد الكلام والنص ، ويمكنها أيضًا تحويل الملفات الصوتية إلى نص ، وتحقيق التعرف على الصوت والكلام ، واستخدام تقنية التعلم الآلي لمعالجة اللغة والكلام. .

قد يعني هذا أن GPT-5 ستدعم القدرات الصوتية ، والتي ستوفر للمستخدمين تجربة معالجة صوت ونصوص أكثر تقدمًا وفعالية ، وتعزز أيضًا قدرات الوسائط المتعددة.

متى يأتي GPT-5؟

عندما يتم إصدار GPT-4 في مارس 2023 ، من المتوقع أن تطلق OpenAI نموذج الجيل التالي في ديسمبر 2023. صرح المؤسس المشارك لـ Runway Siqi Chen سابقًا أنه تم إخباري أنه من المقرر أن تكمل GPT5 التدريب في ديسمبر من هذا العام ، وتتوقع Openai أن تكون قادرة على تحقيق الذكاء الاصطناعي العام (AGI). هذا يعني أننا سنجادل جميعًا بشدة حول ما إذا كان الذكاء الاصطناعي العام حقًا أم لا.

ومع ذلك ، عندما سئل في حدث MIT في أبريل عما إذا كانت OpenAI تدرب GPT-5 ، قال الرئيس التنفيذي لشركة OpenAI Sam Altman "لن ولن نفعل لفترة من الوقت". في مقابلة في يونيو من هذا العام ، قال سام ألتمان ، مؤسس شركة OpenAI ومديرها التنفيذي ، عندما سُئل عن سبب إطلاق GPT-5 ، أشعر بالفضول أيضًا ، وليس لدينا إجابة ، ولن يكون لدينا GPT-5 قريبًا ، يجب أن نجعل الأمان كبيرًا جزء منه.

ومع ذلك ، يعتقد البعض أن OpenAI قد تطلق GPT-4.5 ، وهو إصدار وسيط بين GPT-4 و GPT-5 ، مثل GPT-3.5 ، بحلول أكتوبر 2023. يقال إن GPT-4.5 يجلب في النهاية إمكانيات متعددة الوسائط ، والقدرة على تحليل الصور والنصوص. أعلنت شركة OpenAI بالفعل عن إمكانات الوسائط المتعددة لـ GPT-4 وعرضها في وقت مبكر من مارس 2023 خلال البث المباشر لمطور GPT-4. أصدرت Microsoft الآن الإمكانات متعددة الوسائط لـ GPT-4 في Bing Chat. يبدو أن التحديث الرئيسي التالي لـ GPT-4 قريب جدًا.

بالإضافة إلى ذلك ، لدى OpenAI حاليًا الكثير من العمل الذي يتعين القيام به على طراز GPT-4 قبل البدء في العمل على GPT-5. حاليًا ، وقت الاستدلال لـ GPT-4 طويل جدًا ومكلف جدًا للتشغيل. لا يزال الوصول إلى واجهة برمجة تطبيقات GPT-4 صعب المنال. بالإضافة إلى ذلك ، فتحت OpenAI مؤخرًا إمكانية الوصول إلى مكونات ChatGPT الإضافية ومترجمي الشفرات ، والتي لا تزال في مرحلة تجريبية. تمت إزالة تصفح الإنترنت من GPT-4 لأنه يعرض محتوى من المواقع المدفوعة.

في حين أن GPT-4 قوي للغاية ، أعتقد أن OpenAI تدرك أن الكفاءة الحسابية هي أحد العناصر الأساسية لتشغيل النموذج بشكل مستدام. أضف ميزات وإمكانيات جديدة ، ويمكنك التعامل مع بنى تحتية أكبر مع ضمان تشغيل جميع نقاط التفتيش بشكل موثوق. لذلك ، بتخمين جامح ، من المرجح أن يتم إصدار GPT-5 في عام 2024 إذا افترضنا عدم وجود عقبات تنظيمية من الوكالات الحكومية.

التوقعات: ميزات ووظائف GPT-5

** تقليل الهلوسة **

الموضوع الساخن في الصناعة هو أن GPT-5 ستدرك AGI (الذكاء الاصطناعي). من بين أشياء أخرى ، يجب أن يقلل GPT-5 من وقت الاستدلال وتحسين الكفاءة وتقليل الهلوسة والمزيد. لنبدأ بالهلوسة ، أحد الأسباب الرئيسية التي تجعل معظم المستخدمين لا يثقون كثيرًا في نماذج الذكاء الاصطناعي.

وفقًا لـ OpenAI ، سجل GPT-4 أعلى بنسبة 40٪ من GPT-3.5 في التقييم الواقعي لتصميم الخصوم الداخلي عبر جميع الفئات التسع. أصبح الآن احتمال استجابة GPT-4 أقل بنسبة 82٪ للمحتوى غير الدقيق وغير المسموح به. إنها قريبة جدًا من درجة 80٪ في اختبارات الدقة عبر الفئات. هذه قفزة عملاقة ضد الوهم.

الآن ، من المتوقع أن تقلل OpenAI من الهلوسة إلى أقل من 10٪ في GPT-5 ، والتي ستكون ضخمة لجعل نماذج LLM جديرة بالثقة.

** نموذج كفاءة الحساب **

نحن نعلم بالفعل أن تشغيل GPT-4 مكلف (0.03 دولارًا لكل 1 كيلو) ويستغرق وقتًا أطول للاستنتاج. ونموذج GPT-3.5-turbo الأقدم أرخص بـ 15 مرة من GPT-4 (0.002 دولار لكل 1K Token). وفقًا لتقرير صدر مؤخرًا عن SemiAnalysis ، فإن GPT-4 ليس نموذجًا كثيفًا ، ولكنه يعتمد على "مزيج من الخبراء" في الهندسة المعمارية. هذا يعني أن GPT-4 يستخدم 16 نموذجًا مختلفًا لمهام مختلفة ، مع 1.8 تريليون معلمة.

مع هذه البنية التحتية الكبيرة ، تصبح تكلفة تشغيل وصيانة طراز GPT-4 باهظة الثمن.

في الواقع ، بدأت العديد من النماذج الكبيرة الجديدة في السعي وراء "الصغيرة والمكررة" ، بحيث تحتوي النماذج الكبيرة على أقل عدد ممكن من المعلمات ، وليس أكثر.

في التفسير الأخير لنموذج Google PaLM 2 ، تكون معلمات PaLM 2 صغيرة جدًا ، لكن الأداء سريع.

** نموذج ذكاء اصطناعي متعدد الحواس **

على الرغم من إعلان GPT-4 كنموذج ذكاء اصطناعي متعدد الوسائط ، إلا أنه يتعامل فقط مع نوعين من البيانات ، وهما الصور والنص. مع GPT-5 ، قد تتخذ OpenAI خطوة عملاقة نحو تعدد الوسائط الحقيقي. يمكنه أيضًا التعامل مع النص والصوت والصور والفيديو وبيانات العمق ودرجة الحرارة. سيكون قادرًا على ربط تدفقات البيانات من طرائق مختلفة لإنشاء مساحات مضمنة.

** ذاكرة طويلة المدى **

مع إصدار GPT-4 ، يجلب OpenAI حدًا أقصى لطول السياق يبلغ 32 ألفًا بتكلفة 0.06 دولارًا لكل توكن 1K. سرعان ما رأينا تحولًا من رمز 4K القياسي إلى 32K في غضون أشهر. في الآونة الأخيرة ، زادت Anthropic نافذة سياق روبوت الدردشة Claude AI من 9K إلى 100K Tokens. من المتوقع أن يجلب GPT-5 دعمًا طويل المدى للذاكرة من خلال طول سياق أكبر.

يساعد ذلك في جعل شخصيات وأصدقاء الذكاء الاصطناعي يتذكرون شخصياتك وذكرياتك لسنوات قادمة. بالإضافة إلى ذلك ، يمكنك أيضًا تحميل الكتب ومكتبات المستندات النصية في نافذة سياقية واحدة. قد تظهر مجموعة متنوعة من تطبيقات الذكاء الاصطناعي الجديدة بفضل دعم الذاكرة طويلة المدى ، ويمكن أن تجعل GPT-5 هذا ممكنًا.

متى تعتقد أنه سيتم إصدار GPT-5 وما هي الابتكارات التخريبية التي ستجلبها؟

مراجع:

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت