مؤتمر مطوري OpenAI الأول: GPT-4 Turbo ، متجر GPT

المصدر: هناك نيوين جديد

في إطلاق أول يوم مطور ل OpenAI ، أوضح Sam Altman سلسلة من التطورات المهمة للشركة ، لا تقتصر على GPT-4 Turbo ، وهو نموذج جديد يتمتع بمزيد من القوة وسياق أطول ومزيد من التحكم ، بالإضافة إلى إطلاق واجهة برمجة تطبيقات المساعدة لتبسيط تجربة المطورين لبناء وكلاء مساعدين ، سلط OpenAI الضوء على أن اللغة الطبيعية ستكون وسيلة مهمة للتفاعل مع أجهزة الكمبيوتر في المستقبل ، كما قدم برمجة GPT من خلال المحادثة أعلن ألتمان عن الإطلاق القادم لمتجر GPT ، والذي سيسمح للمستخدمين بمشاركة واكتشاف تطبيقات GPT المبتكرة وتوفير حوافز لمشاركة الإيرادات. تحدث ألتمان أيضا عن تعميق التعاون مع Microsoft ، وعرض نموذج تحويل النص إلى كلام الجديد ومكالمات الميزات المحسنة ، والتي يمكن تلخيصها في الجلسات التالية:

  • GPT-4 Turbo: تم إطلاق طرازات جديدة ، مع زيادة طول السياق والتحكم الأكثر دقة.
  • واجهة برمجة تطبيقات المساعدة: يوفر عملية مبسطة للمطورين لإنشاء وكيل ثانوي.
  • برمجة اللغة الطبيعية: يوضح كيفية إنشاء GPT من خلال المحادثات.
  • متجر GPT: يسمح للمستخدمين بمشاركة واكتشاف تطبيقات GPT ويوفر مشاركة الإيرادات للمبدعين.
  • تعاون Microsoft: عرض نموذج جديد لتحويل النص إلى كلام ، بالإضافة إلى خطاب الرئيس التنفيذي لشركة Microsoft ساتيا ناديلا.
  • شكر الفريق: أعرب ألتمان عن امتنانه لفريق OpenAI على عملهم.
  • عرض التكنولوجيا: تم عرض ميزات جديدة ، بما في ذلك عرض توضيحي لتطبيقات السفر ومساعد يتم تنشيطه صوتيا.

إليك كل المحتوى الكامل من يوم مطوري OpenAI الأول:

أولا ، يتذكر ألتمان إصدار 30 نوفمبر من ChatGPT كمعاينة بحثية منخفضة المستوى ويعلن بفخر عن إطلاق GPT-4 في مارس ، أقوى طراز في العالم في الوقت الحالي.

قدم ألتمان أيضا قدرات الكلام والبصرية التي تم تقديمها إلى ChatGPT خلال الأشهر القليلة الماضية ، مما يمنحها القدرة على الرؤية والسماع والتحدث ، وأعلن أن DALL · إطلاق E 3 ، نموذج الصور الأكثر تقدما في العالم وتم دمجه في ChatGPT.

بالنسبة للعملاء على مستوى المؤسسات ، أطلقت OpenAI ChatGPT Enterprise ، والذي يوفر وصولا أسرع إلى GPT ، ونوافذ سياق أطول ، والمزيد من حماية الأمان والخصوصية على مستوى المؤسسة. كشف Altman أن حوالي 2 مليون مطور يستخدمون واجهات برمجة التطبيقات الخاصة بهم ، وأكثر من 92٪ من شركات Fortune 500 تبني حلولا تعتمد على منتجاتها ، ولدى ChatGPT الآن حوالي 100 مليون مستخدم نشط أسبوعيا. وأشار على وجه الخصوص إلى أن هذا الإنجاز يعتمد كليا على الكلام الشفهي، حيث يجد المستخدمون المنتج مفيدا ويوصون به للأصدقاء. واختتم بالإشارة إلى أنه على الرغم من أن البيانات مثيرة للإعجاب ، إلا أن الأهم هو كيفية استخدام الناس لهذه المنتجات وكيف يستفيدون من الذكاء الاصطناعي ، ثم عرض مقطع فيديو يصور هذه التطورات.

في مؤتمر مطوري OpenAI ، أوضح لنا Sam Altman كيف يمكن الذكاء الاصطناعي أن تؤثر بعمق على حياة الأشخاص الشخصية وإبداعهم في مقطع فيديو. تحكي إحدى الحالات في الفيديو عن رجل يستخدم ChatGPT بطريقة غير رومانسية ، ولكن محترمة وحنونة ، لإخبار والده بحبه ودعمه بلغة والده الأم - التاغالوغية - وبنية نحوية معقدة. توضح هذه الحالة قدرة ChatGPT على فهم وتطبيق الفروق الثقافية واللغوية.

وفقا ل Altman ، فإن تطبيقات ChatGPT الإبداعية مذهلة ويمكن أن تساعد المبدعين على توسيع تفكيرهم وتعزيز ثقتهم. أحد الأمثلة على ذلك هو شخص يستخدم ChatGPT لمساعدته في المهام اليومية مثل التحقق مما هو مفقود من الثلاجة ، أو التخطيط لوصفة نباتية ، أو حتى المساعدة في إنشاء جداول البيانات وكتابة التعليمات البرمجية ، وتكتشف الشخصية في مقطع فيديو آخر تقارب ChatGPT وصبره ومعرفته واستجابته. بالنسبة لطالبة 4.0 وأم لأربعة أطفال ، فإن قدرة ChatGPT على تقديم إجابات للأسئلة والتفسيرات تقلل من اعتمادها على المعلمين وتشتري لها المزيد من الوقت مع عائلتها ونفسها. أخيرا ، هناك أيضا رجل في الفيديو يروي كيف اقتصر على استخدام يده اليسرى بعد خضوعه لعملية جراحية في الحبل الشوكي والدماغ. الآن ، باستخدام ميزات الإدخال الصوتي والمحادثة في ChatGPT ، تم مساعدة هذا المستخدم وتسهيله بشكل كبير. توضح قصص الحالة هذه إمكانات ChatGPT للمساعدة في الحياة اليومية ، ودعم التعلم ، والتغلب على العقبات ، مع توضيح كيف يمكن الذكاء الاصطناعي الاتصال وتمكين المستخدمين على نطاق عالمي كما لم يحدث من قبل.

ثم شارك سام ألتمان كيف يستفيد الناس من تقنياتهم وأكد أن هذا هو بالضبط ما يفعلونه. ثم أعلن عن سلسلة من التطورات الجديدة. يقول ألتمان إنهم أمضوا الكثير من الوقت في التحدث إلى المطورين في جميع أنحاء العالم والاستماع إلى ملاحظاتهم ، والتي كان لها تأثير عميق على ما سنعرضه اليوم.

أطلقت OpenAI نموذجا جديدا ، GPT-4 Turbo. سيلبي هذا النموذج الجديد احتياجات العديد من المطورين. قام بتفصيل ستة تحديثات رئيسية: الأول هو طول السياق ، ويدعم GPT-4 سياقات تصل إلى 8000 رمز مميز ، وفي بعض الحالات يمكن أن يصل إلى 32000. يدعم GPT-4 Turbo سياقات تصل إلى 128000 رمز مميز ، وهو ما يعادل 300 صفحة من كتاب قياسي و 16 مرة أطول من سياق 8000 رمز مميز. بالإضافة إلى طول السياق الأطول ، تم أيضا تحسين دقة هذا النموذج عند التعامل مع السياقات الطويلة بشكل كبير.

التحديث الثاني هو مزيد من التحكم. لمنح المطورين مزيدا من التحكم في استجابات النموذج ومخرجاته ، فقد قدموا ميزة جديدة تسمى JSON Schema لضمان استجابة النماذج ل JSON الصالح ، مما سيؤدي إلى تبسيط استدعاءات واجهة برمجة التطبيقات إلى حد كبير. تحسن النموذج أيضا من حيث استدعاءات الوظائف ، مما يسمح باستدعاء وظائف متعددة في نفس الوقت واتباع التعليمات بشكل أفضل. كما قدموا ميزة جديدة تسمى "الإخراج القابل للتكرار" ، والتي تسمح للنموذج بإرجاع ناتج ثابت عن طريق تمرير معلمة البذور ، والتي من الواضح أنها توفر درجة أعلى من التحكم في سلوك النموذج. هذه الميزة حاليا في مرحلة تجريبية.

في الأسابيع المقبلة ، سيطرحون ميزة جديدة تسمح بعرض تحقيقات السجل في واجهة برمجة التطبيقات. التحديث الثالث هو معرفة أفضل بالعالم. لمنح النموذج إمكانية الوصول إلى معرفة عالمية أكثر دقة ، أدخلوا ميزة استرجاع تسمح باستخراج المعرفة من المستندات أو قواعد البيانات الخارجية. لقد قاموا أيضا بتحديث الموعد النهائي للمعرفة ، وتم تحديث المعرفة العالمية ل GPT-4 Turbo حتى أبريل 2023 وستستمر في التحسن.

التحديث الرابع هو طريقة جديدة ، DALL · E 3 ، والقدرات المرئية ل GPT-4 Turbo ، ونموذج تحويل النص إلى كلام الجديد كلها قادمة إلى واجهة برمجة التطبيقات اليوم ، ويستخدم عدد قليل من العملاء بالفعل DALL · E 3 يولد الصور والتصاميم برمجيا. تطلق "كوكا كولا" اليوم حملة لتمكين العملاء من استخدام "دال" E 3 إنشاء بطاقات تهنئة ديوالي.

بالطبع ، تساعد أنظمة الأمان الخاصة بهم المطورين على منع إساءة استخدام التطبيقات ، ويمكن استخدام هذه الأدوات في واجهات برمجة التطبيقات. يمكن ل GPT-4 Turbo الآن قبول إدخال الصور عبر واجهة برمجة التطبيقات وإنشاء تسميات توضيحية وتصنيفات وتحليل. على سبيل المثال ، يستخدم Miis هذه التقنية لمساعدة الأشخاص المكفوفين أو ضعاف البصر في المهام اليومية ، مثل تحديد المنتج أمامهم. وباستخدام نموذج تحويل النص إلى كلام الجديد ، ستتمكن من إنشاء صوت طبيعي من نص في واجهة برمجة التطبيقات ، مع ستة أصوات محددة مسبقا للاختيار من بينها.

لعب ألتمان مثالا على الصوت الذي أظهر طبيعية نموذجهم الجديد لتحويل النص إلى كلام. تجعل تقنية الصوت إلى الصوت هذه تفاعل التطبيق أكثر طبيعية ويمكن الوصول إليه ، وتفتح العديد من حالات الاستخدام مثل تعلم اللغة والمساعدين الصوتيين.

أعلن Altman أيضا عن الإصدار التالي من نموذج التعرف على الكلام مفتوح المصدر ، Whisper v3 ، وقال إنه سيضيف واجهات برمجة التطبيقات قريبا. لقد حسن هذا الإصدار الأداء بلغات متعددة ، ويعتقد أن المطورين سيحبونه حقا.

بعد ذلك ، ناقش مسألة التخصيص. منذ إطلاق GPT 3.5 قبل بضعة أشهر ، كان أداء ميزة الضبط الدقيق جيدا. بدءا من اليوم ، سيتم تمديد هذا إلى إصدار 16K من النموذج. كما أنها تدعو المستخدمين الذين يستخدمون الضبط الدقيق بنشاط للتقدم بطلب للحصول على برنامج الوصول إلى تجربة الضبط الدقيق GPT-4. تعد واجهة برمجة التطبيقات الدقيقة مثالية لتحسين أداء نموذج يحتوي على بيانات قليلة نسبيا في مجموعة متنوعة من التطبيقات ، سواء كان يتعلم مجالات جديدة تماما من المعرفة أو يعمل بكميات كبيرة من البيانات الخاصة.

في التحديث الخامس ، أعلن Altman عن مبادرة جديدة تسمى "Custom Models" ، حيث سيعمل باحثو OpenAI بشكل وثيق مع الشركة لاستخدام أدواتهم لبناء نماذج مخصصة متخصصة لحالات استخدام محددة. يتضمن ذلك تعديل كل خطوة من خطوات عملية التدريب النموذجية ، والقيام بالتدريب المسبق الخاص بالمجال ، وتخصيص عملية التعلم المعزز بعد التدريب ، والمزيد. يعترف أنه في البداية لن يكونوا قادرين على العمل مع العديد من الشركات ، والتي ستكون كثيرة من العمل وليست رخيصة ، على الأقل في البداية. ولكن إذا كانت هناك شركات تتطلع إلى دفع الأمور إلى حدودها الحالية ، فتواصل معها.

بالإضافة إلى ذلك ، أعلن ألتمان عن حدود أعلى للمعدل. سيضاعفون عدد الرموز المميزة في الدقيقة لجميع عملاء GPT-4 الحاليين ، مما يسهل القيام بالمزيد ، ويمكنهم طلب المزيد من تغييرات الحد الأقصى للأسعار والحصة مباشرة في إعدادات حساب API. بالإضافة إلى حدود الأسعار هذه ، فقد أدخلوا أيضا درع حقوق الطبع والنشر ، مما يعني أنه إذا واجه العميل مطالبة قانونية لانتهاك حقوق الطبع والنشر ، فسوف تتدخل OpenAI لحماية العميل وتغطية التكاليف المتكبدة. ينطبق هذا على كل من ChatGPT Enterprise وواجهات برمجة التطبيقات. إنه يذكر الجميع بوضوح أنهم لا يستخدمون البيانات أبدا من واجهات برمجة التطبيقات أو ChatGPT Enterprise للتدريب.

ذهب ألتمان للحديث عن طلب مطور كان أكبر من جميع الطلبات السابقة ، وكانت هذه مسألة التسعير. وأعلن أن GPT-4 Turbo ليس فقط أكثر ذكاء من GPT-4 ، ولكنه أيضا أرخص ، مما أدى إلى تخفيض 3x في الرمز المميز وتخفيض 2x في رمز الإكمال. التسعير الجديد هو 0.01 دولار لكل 1,000 رمز موجه و 0.03 دولار لكل 1,000 رمز إكمال. ينتج عن هذا أن يكون المعدل المجمع ل GPT-4 Turbo أرخص بأكثر من 2.75 مرة من GPT-4. لقد عملوا بجد لتحقيق ذلك ويأملون أن يتحمس الجميع لذلك.

كان عليهم الاختيار بين السعر والسرعة عند اتخاذ قرار بإعطاء الأولوية لمسألة السعر ، لكنهم سيعملون بعد ذلك على زيادة السرعة. كما أعلن عن خفض سعر GPT 3.5 Turbo 16K ، مع تخفيض 3x في رموز الإدخال وتخفيض 2x في رموز الإخراج ، مما يعني أن GPT 3.516K أرخص الآن من طراز GPT 3.54K السابق. يعد إصدار GPT 3.5 Turbo 16K المضبوط بدقة أرخص أيضا من إصدار 4K المضبوط بدقة ، ويأمل أن تعالج التغييرات ملاحظات الجميع وهو متحمس لتقديم هذه التحسينات للجميع.

عند تقديم كل شيء ، ذكر أن OpenAI محظوظ لأن لديه شريكا يلعب دورا حيويا في جعل هذا ممكنا. لذلك أحضر ضيفا خاصا ، ساتيا ناديلا ، الرئيس التنفيذي لشركة مايكروسوفت.

يتذكر ناديلا أول مواجهة ل OpenAI حيث سأله ألتمان عما إذا كان لديه بعض أرصدة Azure المتاحة ، وقد قطعوا شوطا طويلا منذ ذلك الحين. وأثنى على OpenAI لبناء شيء سحري ، وشارك اثنين من أفكار Microsoft حول الشراكة: أولا ، أعباء العمل ، حيث يعملون معا لبناء أنظمة تدعم النماذج التي تبنيها OpenAI ، من الطاقة إلى مراكز البيانات ، إلى الرفوف والمسرعات ، إلى الشبكات. هدف Microsoft هو بناء أفضل نظام حتى يتمكن OpenAI من بناء أفضل نموذج وإتاحته للمطورين. ثانيا ، Microsoft هي مطور بحد ذاتها وتقوم ببناء المنتجات. ذكر ناديلا أنه عندما التقى لأول مرة ب GitHub Copilot و GPT ، تغير إيمانه بالجيل الكامل من النماذج الأساسية تماما. إنهم ملتزمون ببناء منتجهم على رأس واجهات برمجة تطبيقات OpenAI ويأملون في إتاحة GitHub Copilot Enterprise لجميع الحاضرين الحاضرين لتجربته.

كما سألت ألتمان ناديلا عن أفكارها حول مستقبل الشراكات ومستقبل الذكاء الاصطناعي. وأكد ناديلا أن مايكروسوفت ملتزمة تماما بتوفير الأنظمة وموارد الحوسبة اللازمة لدعم OpenAI في تقدمها الجريء في خارطة الطريق الخاصة بها. إنهم ملتزمون بتوفير أفضل أنظمة التدريب والاستدلال ، بالإضافة إلى معظم موارد الحوسبة ، حتى تتمكن OpenAI من الاستمرار في دفع الطليعة. يعتقد ناديلا أن القيمة الحقيقية ل الذكاء الاصطناعي تكمن في قدرتها على تمكين الناس ، والتي تتماشى مع مهمة OpenAI و Microsoft لتمكين كل شخص وكل مؤسسة على هذا الكوكب من فعل المزيد. وذكر أن الأمن هو محور التركيز الرئيسي في تعاونهم، وأنه محور جهودهم المشتركة، وليس فكرة لاحقة. تؤكد كلمات ناديلا على عمق وهدف شراكة OpenAI و Microsoft ، مما يدل على الرؤية المشتركة للشركتين لدفع نمو الذكاء الاصطناعي وتبنيه.

ثم انتقل Altman إلى موضوع المؤتمر ، وبينما كان مؤتمرا للمطورين ، قاموا بإجراء بعض التحسينات على ChatGPT. الآن ، يستخدم ChatGPT GPT-4 Turbo وجميع التحسينات الأخيرة ، بما في ذلك أحدث أوقات قطع المعرفة ، وسيستمر تحديثها ، والتي هي بالفعل سارية المفعول في نفس اليوم. أصبح ChatGPT الآن قادرا على تصفح الويب وكتابة التعليمات البرمجية وتشغيلها وتحليل البيانات وإنشاء الصور وغير ذلك الكثير عند الحاجة. لقد سمعوا أيضا ملاحظات المستخدمين بأن محدد النموذج مزعج للغاية وبالتالي تمت إزالته. بدءا من اليوم ، لا يتعين على المستخدمين النقر في قائمة منسدلة ، وسيعرف ChatGPT تلقائيا الميزة التي يجب استخدامها ومتى.

يشير Altman إلى أنه على الرغم من أن السعر يمثل مشكلة مهمة ، إلا أنه ليس الشيء الرئيسي في طلب المطور. إنهم يعتقدون أنه إذا تم إعطاء الناس أدوات أفضل ، فسوف يفعلون أشياء مذهلة. يريد الناس أن يكون الذكاء الاصطناعي أكثر ذكاء وأكثر تخصيصا وأكثر قابلية للتخصيص وقادرا على فعل المزيد نيابة عن المستخدم. في النهاية ، يطلب المستخدم ببساطة جهاز الكمبيوتر ويقوم بكل هذه المهام نيابة عنك. في مجال الذكاء الاصطناعي ، غالبا ما يشار إلى هذه القدرات باسم "الوكلاء". لمعالجة أمن الذكاء الاصطناعي ، تعتقد OpenAI أن النشر التدريجي والتكراري هو أفضل نهج ، وتعتقد أنه من المهم بشكل خاص التحرك بحذر نحو مستقبل هذا "الوكيل". سيتطلب ذلك الكثير من العمل الفني والكثير من التفكير من جانب المجتمع.

لذلك ، اتخذوا الخطوة الصغيرة الأولى نحو هذا المستقبل. كان ألتمان سعيدا بتقديم GPT - إصدار ChatGPT المصمم لغرض معين. يمكنك إنشاء نسخة مخصصة من ChatGPT لأي شيء تقريبا مع الإرشادات والمعرفة الموسعة والإجراءات ، ثم نشرها للآخرين لاستخدامها. نظرا لأنها تجمع بين التعليمات والمعرفة الموسعة والعمل ، يمكن أن تكون أكثر فائدة وأكثر ملاءمة لسياقات متعددة وتوفر تحكما أفضل.

سوف يجعلون من السهل إنجاز المهام المختلفة أو مجرد جعلها أكثر متعة بالنسبة لك. يمكنك استخدامها مباشرة في ChatGPT. في الواقع ، يمكنك برمجة GPT باللغة من خلال التحدث إليها. من السهل تخصيص السلوك ليناسب احتياجاتك. هذا يجعل من السهل جدا بنائها وتمكين الجميع.

وتابع ألتمان قائلا إنهم سيظهرون ماهية GPTs ، وكيفية استخدامها ، وكيفية بنائها ، ثم سيناقشون كيفية توزيعها واكتشافها. بعد ذلك ، بالنسبة للمطورين ، سيعرضون كيفية إنشاء هذه التجارب الشبيهة بالوكيل في تطبيقاتهم الخاصة.

وقدم بعض الأمثلة. يعمل شركاء Code.org على توسيع مناهج علوم الكمبيوتر في المدرسة ، ولديهم دورات يستخدمها عشرات الملايين من الطلاب حول العالم. طورت Code.org خطة درس و GPT لمساعدة المعلمين على توفير تجربة أكثر جاذبية لطلاب المدارس المتوسطة. على سبيل المثال ، إذا طلب المعلم طريقة مبتكرة لشرح الحلقة ، فسوف يفعل ذلك ، وفي هذه الحالة ، سيشرحها بالطريقة التي تلتقط بها شخصية لعبة فيديو العملات المعدنية بشكل متكرر ، وهو أمر يسهل على طالب الصف الثامن فهمه. يجمع GPT هذا بين منهج وخبرة code.org الواسعة ، مما يسمح للمعلمين بالتكيف بسرعة وسهولة مع احتياجاتهم.

بعد ذلك ، يبني Canva GPT حيث يمكنك بدء أعمال التصميم من خلال وصف التصميم الذي تريده بلغة طبيعية. إذا قلت ، قم بعمل ملصق لاستقبال Dev Day بعد ظهر اليوم وقدم بعض التفاصيل ، إنشاء بعض خيارات البدء عن طريق الاتصال بواجهة برمجة تطبيقات Canva.

يلاحظ ألتمان أن المفهوم قد يكون مألوفا للبعض. قاموا بتطوير المكون الإضافي إلى إجراء مخصص ل GPT. يمكنك متابعة الدردشة مع هذا لمشاهدة التكرارات المختلفة ، وعندما ترى التكرار الذي يعجبك ، يمكنك النقر للسفر إلى Canva للحصول على تجربة التصميم الكاملة.

بعد ذلك ، أرادوا إظهار GPT مباشرة. قام Zapier ببناء GPT يتيح لك تنفيذ الإجراءات عبر 6000 تطبيق ، وفتح مجموعة واسعة من إمكانيات التكامل. قدم ألتمان جيسيكا ، مهندسة الحلول في OpenAI ، التي ستكون مسؤولة عن العرض التقديمي.

اعتلت مهندسة الحلول جيسيكا شي المسرح وسرعان ما بدأت العرض التوضيحي ، حيث أشارت جيسيكا إلى أن GPTs ستكون موجودة في الزاوية اليسرى العليا من الواجهة وتعرض مثالا يسمى Zapier الذكاء الاصطناعي الإجراءات. عرضت تقويمها لهذا اليوم وذكرت أنها ربطت GPTs بتقويمها.

خلال العرض التقديمي ، سألت جيسيكا عن جدول اليوم. وأكدت أن GPTs مبنية مع وضع الأمان في الاعتبار ، ويطلب النظام إذن المستخدم قبل مشاركة أي إجراء أو بيانات. إنها تسمح ل GPTs بالوصول إلى جدولها الزمني وتشرح أن GPTs مصممة لأخذ تعليمات من المستخدم لتحديد الوظيفة التي يجب استدعاؤها لتنفيذ الإجراء المناسب.

بعد ذلك ، أظهرت جيسيكا كيف نجحت GPTs في الاتصال بتقويمها واستخرجت معلومات الحدث. كما أصدرت تعليمات إلى GPTs للتحقق من وجود تعارضات في التقويم وأظهرت أنها نجحت في تحديد أحدها. ثم توضح كيفية السماح لشخص يدعى سام بمعرفة أنها بحاجة إلى المغادرة مبكرا والتحول إلى محادثة مع سام لطلب القيام بذلك.

عندما أكملت GPTs الطلب ، سألت جيسيكا سام عما إذا كانت قد تلقت الإشعار ، وأكد سام الاستلام. استخدمت جيسيكا هذا كمثال لتوضيح إمكانات GPTs وأعربت عن توقعها لرؤية ما سيبنيه الآخرون.

ثم واصل سام تقديم المزيد من الأمثلة على GPT. وذكر أنه بالإضافة إلى تلك الموضحة ، هناك العديد من GPTs التي يتم إنشاؤها وسيتم إنشاؤها قريبا. لقد أدرك أن العديد من الأشخاص الذين أرادوا بناء GPT لا يمكنهم البرمجة ، لذلك جعلوا من الممكن للأشخاص برمجة GPT من خلال المحادثة. يعتقد ألتمان أن اللغة الطبيعية ستكون جزءا مهما من كيفية استخدام الناس لأجهزة الكمبيوتر في المستقبل ، ويرى أن هذا مثال مبكر مثير للاهتمام.

بعد ذلك ، يوضح Altman كيفية بناء GPT. أراد إنشاء GPT من شأنه أن يساعد المؤسسين والمطورين على تقديم المشورة عند إطلاق مشاريع جديدة. يذهب إلى منشئ GPT ، ويخبره بما يريد ، ويبدأ GPT في بناء تعليمات مفصلة بناء على وصفه. كما يأتي باسم "Startup Mentor" ويبدأ في ملء المعلومات والأسئلة المحتملة في وضع المعاينة. قام ألتمان بتحميل نسخة من خطابه السابق حول ريادة الأعمال لتقديم المشورة بناء عليها ، مضيفا "تعليقات موجزة وبناءة" إلى التوجيه.

ثم جرب Altman GPT هذا في علامة المعاينة وكان سعيدا بالنتائج. قرر فقط نشرها لنفسه في الوقت الحالي ، حتى يتمكن من تحسينها ومشاركتها لاحقا. وذكر أنه كان يريد دائما إنشاء مثل هذا الروبوت وهو الآن سعيد لتمكنه من تحقيق ذلك. أكد ألتمان أن GPTs تسمح للأشخاص بمشاركة واكتشاف الأشياء المثيرة للاهتمام التي يقومون بها بسهولة باستخدام ChatGPT. يمكن للأشخاص إنشاء GPTs بشكل خاص ، أو مشاركة إبداعاتهم بشكل عام عبر الروابط ، أو إنشاء GPTs لشركتهم فقط إذا كانوا يستخدمون ChatGPT Enterprise. إنهم يخططون لإطلاق متجر GPT في وقت لاحق من هذا الشهر ، حيث يمكن للأشخاص إدراج GPTs ، وسيضم OpenAI أفضل وأشهر GPTs.

ذكر ألتمان أيضا أن OpenAI سيضمن أن GPTs في المتاجر تتبع سياساتها ، وأن OpenAI تقدر مشاركة الإيرادات وستدفع جزءا من الإيرادات لأولئك الذين يبنون GPTs الأكثر فائدة وشعبية. إنهم يتطلعون إلى تعزيز نظام بيئي نابض بالحياة من خلال متجر GPT وهم متحمسون لمزيد من المعلومات التي سيتم مشاركتها.

أكد ألتمان أيضا أن هذا مؤتمر للمطورين الذين يجلبون نفس المفاهيم إلى واجهات برمجة التطبيقات. وذكر أن العديد من الأشخاص قد قاموا بالفعل ببناء تجارب شبيهة بالوكيل على واجهات برمجة التطبيقات ، مثل Shopify Sidekick و Discord's Collide ، بالإضافة إلى My الذكاء الاصطناعي ، وهو روبوت محادثة مخصص يمكن إضافته إلى الدردشات الجماعية وتقديم التوصيات. هذه التجارب رائعة ، لكن بنائها غالبا ما يكون صعبا ، ويستغرق أحيانا شهورا وفرقا من عشرات المهندسين. لتبسيط هذه العملية ، أطلقوا واجهة برمجة تطبيقات مساعدة جديدة.

تتضمن واجهة برمجة تطبيقات المساعدة مؤشرات ترابط ثابتة ، ومترجم تعليمات برمجية استرداد مضمن ، ومترجم Python عامل وبيئة رمل ، ووظيفة استدعاء الوظائف المحسنة التي ناقشوها سابقا.

تبع ذلك رامان ، رئيس تجربة المطورين في OpenAI ، موضحا كيفية عمل ذلك. يقول رامون إنه متحمس لرؤية الكثير من الأشخاص يدمجون الذكاء الاصطناعي في طلباتهم. أعلن رامون أنهم لا يقدمون أنماطا جديدة في واجهة برمجة التطبيقات فحسب ، بل إنهم متحمسون أيضا لتحسين تجربة المطور بحيث يسهل على الأشخاص إنشاء وكلاء ثانويين. ثم يعرض عملية البناء مباشرة.

قدم رامون تطبيق السفر الذي يقوم ببنائه بعنوان "حب التجوال" للمستكشفين في جميع أنحاء العالم. كما عرض أفكار الوجهة التي تم إنشاؤها باستخدام GPT-4 ، بالإضافة إلى استخدام DALL الجديد · الرسوم التوضيحية التي تم إنشاؤها برمجيا بواسطة واجهة برمجة التطبيقات E 3. بعد ذلك ، أظهر رامون كيفية تحسين التطبيق عن طريق إضافة مساعد بسيط. يقوم بالتبديل إلى ملعب الأدوات المساعدة الجديد ، وإنشاء مساعد ، وإعطائه اسما ، وتقديم التعليمات الأولية ، وتحديد النموذج ، وتمكين مترجم التعليمات البرمجية ووظائف الاسترجاع ، ثم حفظها.

واصل رامون شرح كيفية دمج المساعد في التطبيق ، والنظر في بعض التعليمات البرمجية وتوضيح كيفية إنشاء سلسلة رسائل جديدة لكل مستخدم جديد وإضافة رسائله إلى تلك المواضيع. كما يوضح كيفية تشغيل المساعد في أي وقت لإرجاع الاستجابة للتطبيق.

بعد ذلك ، أظهر رامون مكالمة الوظيفة ، وهي ميزة أحبها بشكل خاص. تضمن استدعاءات الوظائف الآن إخراج JSON ، ويمكن استدعاء وظائف متعددة في نفس الوقت. ثم أوضح كيف يعرف المساعد الميزات لتضمين التسميات على الخريطة على اليمين ويضيف علامات إلى الخريطة في الوقت الفعلي.

يناقش رامون أيضا ميزة الاسترجاع ، والتي تدور حول منح المساعدين معرفة أكثر من رسائل المستخدم الفورية. يقوم بتحميل ملف PDF ، يقرأه النظام ويعرضه على الشاشة. ثم يقوم بسحب وإسقاط معلومات حجز Airbnb في المحادثة أيضا.

أكد رامون أن المطورين يحتاجون عادة إلى حساب عمليات التضمين ، وإعداد خوارزميات التقسيم ، والآن يتم التعامل مع كل هذا بواسطة واجهة برمجة التطبيقات الجديدة ذات الحالة. كما يعرض لوحة معلومات المطور حيث يمكنك رؤية الخطوات التي اتخذتها الأداة ، بما في ذلك الوظائف التي تم استدعاؤها وملفات PDF التي تم تحميلها.

ثم ناقش رامون ميزة جديدة ينتظرها العديد من المطورين: مترجم التعليمات البرمجية ، والذي يتوفر الآن أيضا في واجهة برمجة التطبيقات. إنه يمكن الذكاء الاصطناعي من كتابة التعليمات البرمجية وتنفيذها وحتى إنشاء الملفات أثناء التنقل. يوضح كيف سيعمل مترجم الكود إذا قلت مشكلة تتطلب تحويل العملات وحسابات الأيام. أخيرا ، يوضح رامون كيفية إنشاء وكيل بسرعة يمكنه إدارة الحالة لمحادثات المستخدم ، والاستفادة من الأدوات الخارجية مثل استرجاع المعرفة ومترجمي التعليمات البرمجية ، واستدعاء وظائفه الخاصة لتنفيذ الوظائف.

قدم رامون أيضا ميزات تجمع بين الأنماط التي تم إصدارها حديثا ومكالمات الميزات ، وقام ببناء مساعد مخصص ل Dev Day. علاوة على ذلك ، قرر استخدام الصوت بدلا من واجهة الدردشة. أظهر تطبيق Swift بسيطا يمكنه تلقي إدخال الميكروفون وإظهار ما يحدث في الخلفية في سجلات المحطة الطرفية. استخدم الهمس لتحويل الإدخال الصوتي إلى نص ، واستخدم مساعد GPT-4 Turbo ، واستخدم واجهة برمجة تطبيقات TTS الجديدة لجعلها تبدو سليمة.

يوضح رامون أيضا كيف يمكن للمساعد الاتصال بالإنترنت وتنفيذ إجراءات في العالم الحقيقي للمستخدم. عرض أن يمنح المساعد 500 دولار من أرصدة OpenAI لخمسة مشاركين عشوائيين في يوم التطوير ، وأكمل المساعد المهمة بنجاح.

أخيرا ، في ملاحظاته الختامية في يوم مطوري OpenAI ، قال Sam Altman إن واجهة برمجة التطبيقات المساعدة قيد الاختبار التجريبي وأنه متحمس لرؤية كيف سيستخدمها المطورون. وشدد على أن GPT والأدوات المساعدة هي رائدة في الطريق إلى وكلاء أكثر تعقيدا سيكونون قادرين على تخطيط وتنفيذ مهام أكثر تعقيدا للمستخدمين.

يكرر ألتمان أهمية النشر التكراري التدريجي ويشجع الناس على البدء في استخدام هذه العوامل الآن من أجل التكيف مع عالم مستقبلي يصبحون فيه أكثر قدرة. وأكد أن OpenAI ستستمر في تحديث النظام بناء على ملاحظات المستخدمين ، قائلا إن OpenAI لديها كثافة مواهب متميزة ، ولكن لا يزال الأمر يتطلب الكثير من الجهد والتنسيق لتحقيق كل هذا. إنه يشعر أن لديه أفضل الزملاء في العالم وهو ممتن للغاية لقدرته على العمل معهم.

إليك سبب عمل فريق OpenAI بجد: فهم يعتقدون أن الذكاء الاصطناعي سيكون جزءا من ثورة تكنولوجية واجتماعية ستغير العالم بعدة طرق. ذكر ألتمان أنهم ناقشوا في وقت سابق أنه من خلال إعطاء الناس أدوات أفضل ، يمكنهم تغيير العالم. وهو يعتقد أن الذكاء الاصطناعي سيجلب تمكينا شخصيا غير مسبوق ونطاقا للوكالة ، وبالتالي يرفع الإنسانية إلى مستوى غير مسبوق. عندما يصبح الذكاء أكثر انتشارا ، لدينا جميعا قوى خارقة في جميع الأوقات. إنه متحمس لكيفية استخدامك للتكنولوجيا والمستقبل الجديد الذي نبنيه معا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت