بعد أن أصدرت OpenAI ChatGPT في نهاية عام 2022، استمر فهم مجال الاستثمار لمجال الذكاء الاصطناعي في التعمق. يمكن تقسيم سلسلة صناعة الذكاء الاصطناعي تقريبًا إلى مزودي التكنولوجيا الأساسية وأنظمة الذكاء الاصطناعي ومستخدمي الذكاء الاصطناعي. وانطلاقا من التصور العام للمستثمرين العالميين، يدرك الجميع الآن أن الذكاء الاصطناعي من المرجح أن يصبح مسارا استثماريا لفترة طويلة في المستقبل، على غرار أجهزة الكمبيوتر قبل 30 عاما، أو الإنترنت قبل 20 عاما. وبالنسبة للمستقبل، أصبحت التطبيقات حقيقة واقعة بالفعل.
لفهم الاستثمار في المجالات المقسمة، نحتاج دائمًا إلى التعلم من المستثمرين في الصناعة. يواصل الرأسمالي الاستثماري الشهير A16Z تقديم رهانات كبيرة في مجال الذكاء الاصطناعي. لقد أجروا مؤخرًا محادثة مع الرئيس التنفيذي للتكنولوجيا في OpenAI، ميرا موراتي. شاركت قصة ChatGPT ومستقبل الذكاء الاصطناعي والتفاعل بين الإنسان والحاسوب.
ملخص
نشأ ChatGPT من التفكير في كيفية إنشاء نظام ذكاء اصطناعي آمن يستخدم ردود الفعل البشرية لتعزيز التعلم.
تعمل OpenAI على إعادة تعريف كيفية تفاعل الأشخاص مع المعلومات الرقمية، لتصبح مساعدًا يشبه الشريك وتعمل باستمرار على تعزيز اتساق وأمان أنظمة الذكاء الاصطناعي. من خلال حالة الإنتاج، فإن الحصول على تعليقات من المستخدمين في العالم الحقيقي هو أكثر من مجرد الجلوس في المختبر.
يقوم ChatGPT بإضافة الصور ومقاطع الفيديو وغيرها بناءً على النص. وهذا يسمح للنماذج بتقديم صورة أكثر اكتمالا للعالم من حولنا، على غرار الطريقة التي نفهم بها العالم ونراقبه.
على الرغم من أنه لن يكون هناك نموذج واحد لحكم العالم في المستقبل، لأن الناس سيبحثون في النهاية عن الأداة التي تناسب احتياجاتهم.
خلفية ميرا موراتي
ولدت ميرا في ألبانيا، بعد انتهاء الشيوعية مباشرة. كانت ألبانيا في ذلك الوقت مشابهة جدًا لكوريا الشمالية اليوم. في عصر التغيير المستمر وعدم اليقين، يحمل التعليم مفتاح كل شيء. علاوة على ذلك، باستثناء الكتب، كان هناك القليل من الترفيه في ذلك الوقت. في ذلك الوقت، كانت ميرا تبحث عن إجابات في الكتب. تفضل ميرا تلك الحقائق العلمية المستقرة والتي يمكن دراستها بعمق. ومصادر العلوم الإنسانية مثل التاريخ وعلم الاجتماع موضع شك لأن التاريخ يتغير باستمرار. لذلك نشأت ميرا على نزعة بديهية وطبيعية نحو العلوم والرياضيات. من الناحية الأساسية، لا تزال ميرا تعمل في مجال الرياضيات في Open AI.
ونظرًا لأدائها الأكاديمي الممتاز، حصلت ميرا على منحة دراسية وأكملت آخر عامين من دراستها الثانوية في كندا.
في الكلية، درست ميرا الهندسة الميكانيكية لأنها اعتقدت أنها أفضل طريقة لتطبيق المعرفة على مشاكل العالم الحقيقي. في ذلك الوقت، كانت ميرا مهتمة جدًا بطرق توفير النقل المستدام والطاقة المستدامة للعالم. كان مشروع تخرجها في ذلك الوقت هو بناء سيارة سباق هجينة باستخدام المكثفات الفائقة.
وبعد فترة وجيزة، انضمت ميرا إلى شركة تيسلا وشاركت في العمل على المحرك المزدوج موديل S. عملت مع Model X منذ الأيام الأولى لتصميمه الأولي وقادت في النهاية عملية إطلاق المشروع بأكمله.
وكان العمل أيضًا في شركة تيسلا هو ما جعل ميرا مهتمة جدًا بتطبيق الذكاء الاصطناعي، وخاصة القيادة الذاتية. لأنه يمكنه استخدام الذكاء الاصطناعي ورؤية الكمبيوتر لإحداث ثورة في السفر. بدأت تفكر أكثر في التطبيقات المختلفة للذكاء الاصطناعي. لذلك أصبح ميرا مهتمًا بشكل متزايد بالذكاء الاصطناعي والتغييرات التي يمكن أن يحدثها في العالم.
وعلى وجه التحديد، فهي مهتمة جدًا بكيفية تأثير الذكاء الاصطناعي على التفاعل بين الإنسان والحاسوب وطريقة تفاعل الأشخاص مع المعلومات بشكل عام، وهي مهتمة جدًا بالحوسبة المكانية. بعد ذلك، انضمت إلى شركة Leap Motion، وهي شركة تكنولوجيا سوداء، في منصب نائب رئيس المنتجات والهندسة. وكانت هذه التجربة هي التي عززت قدراتها الإنتاجية.
(بالمناسبة، مؤسس شركة Leap Motion، ديفيد هولز، أسس تطبيقًا آخر مشهورًا للذكاء الاصطناعي Midjourney بعد بيع Leap Motion).
وفي عام 2018، انضمت ميرا إلى OpenAI. وذلك عندما بدأت تفكر أكثر فيما يمكن أن يحدث إذا ركزت فقط على التنوع.
بالإضافة إلى ذلك، من خلال مناقشة ميرا لطرق البحث، يمكننا أن نرى روحها الاستكشافية للابتكار التكنولوجي في بيئة غير مؤكدة:
في بعض الأحيان تأخذ قيلولة وتستيقظ بأفكار جديدة. على مدار أيام أو أسابيع، ستصل إلى الحل النهائي. إنها ليست عودة سريعة، ولا هي متكررة في بعض الأحيان.
إنها تقريبًا طريقة تفكير مختلفة، فأنت تقوم ببناء الحدس، ولكن لديك أيضًا الانضباط للتعامل مع المشكلات والثقة في نفسك لحلها. بمرور الوقت، ستكتسب حدسًا حول المشكلات التي تحتاج إلى حل حقًا.
#ملخص المحادثة
قام الرأسمالي الاستثماري المعروف A16Z برهان كبير في مجال الذكاء الاصطناعي. المقتطفات التالية هي مقتطفات من محادثة بين مارتن، مدير صندوق A16Z، وميرا. شاركت ميرا قصة ChatGPT ومستقبل الذكاء الاصطناعي والتفاعل بين الإنسان والحاسوب. يمكننا أيضًا أن نرى أن ميرا، التي تتمتع بخلفية كمدير منتج، تشعر بقلق بالغ بشأن إمكانية تطبيق المنتجات.
مارتن: هل تعتقد أنها مشكلة أنظمة أم مشكلة هندسية في الوقت الحالي؟
ميرا: كلاهما. إن الأنظمة والمشاكل الهندسية ضخمة، ونحن نقوم بنشر هذه التقنيات ونحاول توسيع نطاقها، وجعلها أكثر كفاءة، وجعلها في متناول الجميع. هذا يعني أنك لست بحاجة إلى معرفة تعقيدات تعلم الآلة لاستخدامها.
في الواقع، يمكننا أن نرى التناقض بين توفير هذه النماذج من خلال واجهة برمجة التطبيقات (API) مقابل توفير التكنولوجيا من خلال ChatGPT. إنها في الأساس نفس التقنية، مع استثناء واحد محتمل: يتمتع ChatGPT بقدرات التعلم المعزز وردود الفعل البشرية. ما يعنيه هذا هو أن الاستجابة والقدرة على التقاط خيال الناس والسماح لهم باستخدام هذه التكنولوجيا كل يوم مختلفة تمامًا.
واجهة اللغة الطبيعية
مارتن: أعتقد أيضًا أن ChatGPT API أمر مثير للاهتمام للغاية. كلما أستخدم هذه النماذج في برامجي، أشعر دائمًا وكأنني أغلف كمبيوترًا عملاقًا في عداد. أحيانًا أقول، "سأعطي النموذج لوحة مفاتيح وماوس وأتركه يقوم بالبرمجة." واجهة برمجة التطبيقات باللغة الإنجليزية وسأخبره بما يجب فعله وسيقوم بكل البرمجة. أشعر بالفضول، عندما تصمم شيئًا مثل ChatGPT، هل تعتقد أنه بمرور الوقت ستكون الواجهة الفعلية لغة طبيعية، أم تعتقد أن البرامج لا يزال لها دور كبير تلعبه؟
ميرا: تصبح البرمجة أقل تجريدًا في ChatGPT، ويمكننا التحدث إلى أجهزة الكمبيوتر باستخدام اللغة الطبيعية وبنطاق ترددي عالٍ. ولكن ربما يكون هناك ناقل آخر وهو أن هذه التكنولوجيا تساعدنا على فهم كيفية العمل معها بدلاً من برمجتها. أصبحت طبقة البرمجة أسهل وأسهل في الوصول إليها لأنه يمكنك البرمجة باللغة الطبيعية. لكن الجانب الآخر مما نراه مع ChatGPT هو أنه يمكنك بالفعل العمل مع النموذج كشريك أو زميل.
مارتن: سيكون من المثير للاهتمام أن نرى ما سيحدث مع مرور الوقت. لقد قررت أن يكون لديك واجهة برمجة تطبيقات في ChatGTP، ولكن كزميل، ليس لديك واجهة برمجة تطبيقات. أنت تتحدث إلى زميل. مع مرور الوقت، قد تتطور هذه الأشياء إلى التحدث باللغة الطبيعية. أو هل تعتقد أنه يجب دائمًا أن يكون هناك مكون في النظام يكون عبارة عن آلة ذات حالة محدودة، أو كمبيوتر تقليدي؟
ميرا: هناك نقطة تحول الآن حيث نقوم بإعادة تعريف كيفية تفاعلنا مع المعلومات الرقمية، ونحن نفعل ذلك في شكل أنظمة الذكاء الاصطناعي. ربما لدينا العديد من أنظمة الذكاء الاصطناعي، وربما تتمتع جميعها بقدرات مختلفة. ربما لدينا نظام عالمي يتبعنا في كل مكان، ويعرف خلفيتي، وما فعلته اليوم، وما هي أهدافي في الحياة والعمل، ويساعدني خلال الأوقات الصعبة، ويرشدني، وما إلى ذلك. كما يمكنك أن تتخيل، هذا قوي للغاية.
والآن، وصلنا إلى نقطة انعطاف في إعادة تعريفه. نحن لا نعرف كيف سيبدو المستقبل، ونحن نعمل جاهدين لجعل هذه الأدوات والتقنيات متاحة للعديد من الأشخاص الآخرين حتى يتمكنوا من التجربة ويمكننا أن نرى ما سيحدث. هذه هي الاستراتيجية التي استخدمناها منذ البداية.
في ChatGPT الأسبوع الماضي، شعرنا بالقلق من أنه لم يكن جيدًا بما فيه الكفاية. لقد رأينا جميعا ما حدث. لقد نشرناها وأخبرنا الناس أنها قامت بعمل جيد حقًا في العثور على حالات جديدة. هذا ما يحدث عندما تجعل هذه الأشياء سهلة الوصول إليها وسهلة الاستخدام، وتجعل من السهل على الجميع استخدامها.
خارطة طريق تطوير OpenAI
مارتن: عندما يتعلق الأمر بالذكاء الاصطناعي، فإن الناس لا يعرفون كيف يفكرون بعد. يجب أن يكون هناك بعض التوجيه، وعليك أن تقوم ببعض الاختيارات. أنت في OpenAI، وعليك أن تقرر ما يجب فعله بعد ذلك. إذا كان بإمكانك السير خلال عملية اتخاذ القرار هذه: كيف تقرر ما يجب عليك فعله، أو ما الذي يجب التركيز عليه، أو ما الذي يجب إصداره، أو كيفية وضع نفسك؟
ميرا: إذا فكرت في كيفية ظهور ChatGPT، فستجد أنه لم يكن المنتج الذي أردنا إطلاقه. في الواقع، تعود جذورها الحقيقية إلى أكثر من 5 سنوات مضت، عندما كنا نفكر في كيفية صنع نظام ذكاء اصطناعي آمن. أنت لا تريد بالضرورة أن يكتب الإنسان بالفعل الوظيفة الموضوعية، لأنك لا تريد أن يكون لديك بديل يقوم بذلك لوظيفة موضوعية معقدة، أو أنك لا تريد ارتكاب الأخطاء لأن ذلك قد يكون خطيرًا للغاية.
هذا هو المكان الذي يأتي فيه التعلم المعزز باستخدام ردود الفعل البشرية. ما نحاول تحقيقه حقًا هو مواءمة نظام الذكاء الاصطناعي مع القيم الإنسانية والسماح له بقبول ردود الفعل البشرية. بناءً على ردود الفعل البشرية، من المرجح أن يفعل الشيء الصحيح وأقل احتمالاً أن يفعل شيئًا لا ترغب في القيام به. بعد ذلك، بعد أن قمنا بتطوير GPT-3 وإصداره على واجهة برمجة التطبيقات (API)، كانت هذه هي المرة الأولى التي نطبق فيها بالفعل أبحاثنا الأمنية على العالم الحقيقي. ويتم تحقيق ذلك من خلال نموذج متابعة التعليمات.
نحن نستخدم هذا الأسلوب لأخذ الإشارات من العملاء الذين يستخدمون واجهة برمجة التطبيقات (API)، ومن ثم نطلب من المقاولين تقديم تعليقات للنموذج للتعلم منه. لقد قمنا بضبط النموذج بناءً على هذه البيانات وقمنا ببناء نموذج يتبع التعليمات. من المرجح أن يتبعوا نية المستخدم ويفعلوا ما تريد أن يفعله بالفعل. وهذا أمر قوي للغاية لأن سلامة الذكاء الاصطناعي ليست مجرد مفهوم نظري تجلس فيه وتتحدث عنه. يصبح الأمر في الواقع: نحن الآن ندخل عصر أنظمة أمن الذكاء الاصطناعي، كيف يمكنك دمج ذلك في العالم الحقيقي؟
من الواضح أننا في نماذج اللغات الكبيرة نرى تمثيلات رائعة للمفاهيم وأفكار العالم الحقيقي. ولكن من حيث الإنتاج، هناك العديد من المشاكل. من الواضح أن الهلوسة هي واحدة من أكبر المشاكل. لقد عملنا على قضايا الوهم والأصالة. كيف يمكنك الحصول على هذه النماذج للتعبير عن عدم اليقين؟
كان سلف ChatGPT في الواقع مشروعًا آخر أطلقنا عليه اسم WebGPT، والذي يستخدم الاسترجاع للحصول على المعلومات والاستشهاد بالمصادر. أصبح هذا المشروع في النهاية ChatGPT لأننا اعتقدنا أن المحادثات كانت مميزة. فهو يتيح لك طرح الأسئلة وتصحيح الشخص الآخر والتعبير عن عدم اليقين.
مارتن: يتم اكتشاف الأخطاء باستمرار لأنك تتفاعل...
ميرا: نعم، مع هذا النوع من التفاعل، يمكنك فهم الحقيقة الأعمق. لقد بدأنا بالسير في هذا الاتجاه، وفي ذلك الوقت كنا نفعل ذلك باستخدام GPT-3 وGPT-3.5. ومن منظور أمني، نحن متحمسون جدًا لهذا الأمر. لكن هناك شيء واحد ينساه الناس وهو أننا قمنا في هذا الوقت بتدريب GPT-4. في OpenAI، نحن متحمسون جدًا بشأن GPT-4 ولدينا ChatGPT في مرآة الرؤية الخلفية. ثم أدركنا، "سنقضي ستة أشهر في التركيز على محاذاة GPT-4 وسلامته،" وبدأنا في التفكير فيما يمكننا فعله. أحد الأشياء الرئيسية هو وضع ChatGPT في أيدي الباحثين ويمكنهم تقديم تعليقات لنا الآن بعد أن أصبح لدينا نموذج المحادثة هذا. والغرض الأولي هو الحصول على تعليقات من الباحثين واستخدامها لجعل GPT-4 أكثر اتساقًا وأمانًا وقوة وموثوقية.
مارتن: عندما تقول الاتساق والأمن، هل أنت على حق في تضمين ذلك، وأنه يفعل ما يريد؟ أم أنك تقصد الأمان، أو حماية نفسك فعليًا من نوع ما من الأذى؟
ميرا: بالاتساق، أعني عادةً أنه يتوافق مع نية المستخدم، لذا فهو يفعل بالضبط ما تريد أن يفعله. لكن الأمان يشمل أيضًا أشياء أخرى، مثل إساءة الاستخدام، حيث يحاول المستخدمون عمدًا استخدام نموذج لإنتاج نتائج ضارة. باستخدام ChatGPT، نحاول فعليًا أن نجعل من الأرجح أن النموذج سيفعل ما تريد منه أن يفعله، مما يجعله أكثر اتساقًا. وأردنا أيضًا معرفة مشكلة الهلوسة، والتي من الواضح أنها مشكلة صعبة للغاية.
أعتقد أن هذا النهج لاستخدام ردود الفعل البشرية لتعزيز التعلم، إذا حاولنا القيام بذلك، ربما هذا ما نحتاجه.
مارتن: إذًا، ألا توجد خطة كبرى؟ ما الذي يتعين علينا القيام به للوصول إلى AGI؟ إنها مجرد مسألة اتخاذ خطوة واحدة في كل مرة.
ميرا: نعم. وجميع القرارات الصغيرة التي تتخذها على طول الطريق. ربما يكون من المرجح حدوث ذلك لأننا اتخذنا قرارًا استراتيجيًا قبل بضع سنوات لمتابعة المنتج. نحن نفعل هذا لأننا نعتقد أنه من المستحيل الجلوس في المختبر وتطوير هذه الأشياء في الفراغ دون الحصول على تعليقات من المستخدمين في العالم الحقيقي. هذا هو الافتراض. أعتقد أن هذا يساعدنا في اتخاذ بعض هذه القرارات وبناء البنية التحتية الأساسية حتى نتمكن في النهاية من نشر شيء مثل ChatGPT.
** قانون النسب **
مارتن: يمكنك تكرار قانون التناسب. أعتقد أن هذه مشكلة كبيرة يعاني منها الجميع. إن وتيرة التقدم مذهلة. لكن يبدو أن تاريخ الذكاء الاصطناعي يشير إلى أنك في مرحلة ما تحقق عوائد متناقصة، وهذا ليس معياريًا. إنه نوع من التناقص التدريجي. من وجهة نظرك (والتي ربما تكون المنظور الأكثر حكمة في الصناعة بأكملها) هل تعتقد أن قانون التوسع سيصمد وسنستمر في رؤية التقدم، أو هل تعتقد أننا نتجه نحو تناقص العوائد؟
ميرا: لا يوجد دليل على أنه مع استمرارنا في توسيع النموذج عبر البيانات والمحاور الحسابية، فإننا لن نحصل على نماذج أفضل وأكثر قوة. ما إذا كان الأمر سيصل إلى AGI (الذكاء العام الاصطناعي) هو سؤال مختلف. وفي هذه العملية، قد تكون هناك حاجة إلى بعض الاختراقات والتقدمات الأخرى. للحصول على الكثير من الفوائد من هذه النماذج الأكبر حجمًا، لا يزال أمام قوانين القياس طريق طويل لتقطعه.
مارتن: كيف يمكنك تعريف الذكاء الاصطناعي العام؟
ميرا: في ميثاق OpenAI الخاص بنا. نحن نعرّفه بأنه نظام كمبيوتر يمكنه إكمال معظم الأعمال الفكرية بشكل مستقل.
مارتن: كنت أتناول الغداء، وكان هناك روبرت نيشيهارا من Anyscale. لقد سألني عما أسميه سؤال روبرت نيشيهارا. أعتقد أن هذا في الواقع توصيف جيد جدًا. لقد قال، "هناك سلسلة متصلة بين أجهزة الكمبيوتر وآينشتاين. أنت تنتقل من أجهزة الكمبيوتر إلى القطط، ومن القطط إلى الأشخاص العاديين، ومن الأشخاص العاديين إلى أينشتاين." ثم سأل السؤال، "نحن في سلسلة متصلة." الموقع؟ ما هي المشاكل التي سيتم حلها؟"
الجميع متفق على أننا نعرف كيف نتحول من قطة إلى إنسان. نحن لا نعرف كيفية الانتقال من الكمبيوتر إلى القطة لأنها مشكلة إدراك عالمية. نحن قريبون، لكننا لم نصل إلى هناك بعد، ولا نعرف حقًا كيف نفعل أينشتاين، وهذا هو المنطق المحدد.
ميرا: يمكنك الحصول على الكثير من خلال الضبط الدقيق، ولكن بشكل عام، أعتقد أنه في معظم المهام، نحن على مستوى المتدرب الآن. المشكلة هي الموثوقية. لا يمكنك الاعتماد بشكل كامل على النظام للقيام بما تريده أن يفعله طوال الوقت. في العديد من المهام لا يستطيع القيام بذلك. كيف يمكنك تحسين الموثوقية بمرور الوقت ومن ثم توسيع الإمكانات الجديدة التي يمكن لهذه النماذج القيام بها؟
أعتقد أنه من المهم الاهتمام بهذه القدرات الناشئة، حتى لو كانت غير موثوقة على الإطلاق. وخاصة بالنسبة للأشخاص الذين يبنون شركة اليوم، فأنت تريد حقًا أن تفكر في "ما هو الممكن اليوم؟ ماذا ترى اليوم؟ "تصبح هذه النماذج موثوقة بسرعة كبيرة.
**نموذج واحد يمكن أن يغزو العالم؟ **
مارتن: سأسألك على الفور، توقع كيف سيبدو المستقبل. لكن قبل أن أسأل، بأنانية، كيف تعتقد أن اقتصاديات هذا الأمر ستتطور. أقول لك ما يذكرني به. هذا يذكرني بصناعة السيليكون. أتذكر أنه في التسعينيات، عندما اشتريت جهاز كمبيوتر، كان هناك الكثير من معالجات الكتابة الغريبة. "هذه مطابقة للسلسلة، وهذه نقطة عائمة، وهذا تشفير،" كل ذلك يستهلك وحدة المعالجة المركزية.
لقد اتضح أن تعدد الاستخدامات قوي جدًا لدرجة أنه يخلق نوعًا معينًا من الاقتصاد حيث تلعب كل من Intel و AMD دوراً فاعلاً. وبطبيعة الحال، فإن صنع هذه الرقائق يكلف الكثير من المال.
لذلك يمكنك أن تتخيل مستقبلين. في المستقبل، سيكون تعدد الاستخدامات قويًا جدًا لدرجة أن النماذج الكبيرة ستستوعب بشكل أساسي جميع الوظائف بمرور الوقت. ثم هناك مستقبل آخر حيث توجد مجموعة من النماذج المختلفة، وجميع أنواع القطع، ونقاط مختلفة في مساحة التصميم. هل لديك هذا الشعور: هل OpenAI فريد من نوعه، أم أن لديه العديد من النماذج؟
ميرا: هذا يعتمد على ما تريد القيام به. ومن الواضح أن المسار الآن هو أن أنظمة الذكاء الاصطناعي هذه ستقوم بالمزيد والمزيد من العمل الذي نقوم به. سيكونون قادرين على العمل بشكل مستقل، ولكننا سنحتاج إلى توفير التوجيه والإرشاد والإشراف. لكنني لا أريد القيام بالكثير من الأعمال المتكررة التي يجب علي القيام بها كل يوم. أريد التركيز على أشياء أخرى. ربما لا يتعين علينا العمل 10 أو 12 ساعة يوميًا، وربما يمكننا العمل أقل ونكون أكثر إنتاجية. هذا ما آمله. فيما يتعلق بالطريقة التي تعمل بها المنصة، حتى اليوم يمكنك أن ترى أن لدينا العديد من النماذج المتاحة من خلال واجهة برمجة التطبيقات، بدءًا من النماذج الصغيرة جدًا وحتى نماذجنا المتطورة.
لا يحتاج المرء دائمًا إلى استخدام النموذج الأقوى والأكثر قدرة. في بعض الأحيان يحتاجون فقط إلى نموذج يناسب حالة الاستخدام الخاصة بهم، ويكون أكثر اقتصادا. أعتقد أنه سيكون هناك نطاق. ولكن فيما يتعلق بكيفية تصورنا لألعاب المنصات، فنحن بالتأكيد نريد من الأشخاص البناء على نموذجنا، ونريد أن نمنحهم الأدوات اللازمة لتسهيل الأمر ومنحهم المزيد والمزيد من الوصول والتحكم بشكل صحيح. يمكنك إحضار بياناتك، ويمكنك تخصيص هذه النماذج. يمكنك حقًا التركيز على الطبقات خارج النموذج وتحديد المنتج، وهو أمر صعب للغاية في الواقع. هناك الكثير من التركيز الآن على بناء المزيد من النماذج، ولكن من الصعب جدًا بناء منتجات جيدة فوق هذه النماذج.
5-10 سنوات القادمة
مارتن: أود منك أن تتنبأ بالمكان الذي تعتقد أنه سيكون عليه خلال ثلاث أو خمس أو عشر سنوات.
ميرا: أعتقد أن النموذج التأسيسي اليوم لديه تمثيل كبير للعالم في النص. نحن نضيف نماذج أخرى مثل الصور ومقاطع الفيديو وجميع أنواع الأشياء الأخرى، بحيث يمكن لهذه النماذج أن توفر صورة أكثر اكتمالا للعالم من حولنا، على غرار الطريقة التي نفهم بها العالم ونراقبه. العالم موجود ليس فقط بالكلمات، بل بالصور أيضًا. نحن بالتأكيد نتحرك في هذا الاتجاه، وسيكون لدينا هذه النماذج الأكبر التي تستخدم كل هذه الأنماط في أعمال ما قبل التدريب. نريد حقًا أن تفهم هذه النماذج المدربة مسبقًا العالم كما نفعل نحن.
في الجزء الناتج من النموذج، نقدم التعلم المعزز بالتغذية الراجعة البشرية. نريد أن يقوم النموذج بالفعل بما نطلب منه، ونريد أن يكون ذلك موثوقًا. وهذا يتطلب الكثير من العمل وربما إدخال التصفح حتى يمكن الحصول على معلومات جديدة والرجوع إليها وحل الهلوسة. لا أعتقد أن هذا ممكن. أعتقد أن هذا أمر قابل للتحقيق.
ومن ناحية المنتج، نريد جمع كل ذلك معًا في مجموعة من المنتجات التي يعمل الأشخاص معها وتوفير منصة يمكن للأشخاص البناء عليها. إذا ذهبت حقًا إلى الخارج، فهذه النماذج قوية جدًا جدًا. ومن الواضح أن هذا يأتي مع الخوف من أن هذه النماذج القوية للغاية لا تتفق مع نوايانا. التحدي الكبير هو Super Alignment، وهو تحدٍ تقني صعب. لدينا فريق كامل في OpenAI يركز على هذه المشكلة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
محادثات a16z مع OpenAI CTO: كيف ستقود تكنولوجيا الذكاء الاصطناعي الابتكار المستقبلي؟
بقلم القديس بولس
بعد أن أصدرت OpenAI ChatGPT في نهاية عام 2022، استمر فهم مجال الاستثمار لمجال الذكاء الاصطناعي في التعمق. يمكن تقسيم سلسلة صناعة الذكاء الاصطناعي تقريبًا إلى مزودي التكنولوجيا الأساسية وأنظمة الذكاء الاصطناعي ومستخدمي الذكاء الاصطناعي. وانطلاقا من التصور العام للمستثمرين العالميين، يدرك الجميع الآن أن الذكاء الاصطناعي من المرجح أن يصبح مسارا استثماريا لفترة طويلة في المستقبل، على غرار أجهزة الكمبيوتر قبل 30 عاما، أو الإنترنت قبل 20 عاما. وبالنسبة للمستقبل، أصبحت التطبيقات حقيقة واقعة بالفعل.
لفهم الاستثمار في المجالات المقسمة، نحتاج دائمًا إلى التعلم من المستثمرين في الصناعة. يواصل الرأسمالي الاستثماري الشهير A16Z تقديم رهانات كبيرة في مجال الذكاء الاصطناعي. لقد أجروا مؤخرًا محادثة مع الرئيس التنفيذي للتكنولوجيا في OpenAI، ميرا موراتي. شاركت قصة ChatGPT ومستقبل الذكاء الاصطناعي والتفاعل بين الإنسان والحاسوب.
ملخص
خلفية ميرا موراتي
ولدت ميرا في ألبانيا، بعد انتهاء الشيوعية مباشرة. كانت ألبانيا في ذلك الوقت مشابهة جدًا لكوريا الشمالية اليوم. في عصر التغيير المستمر وعدم اليقين، يحمل التعليم مفتاح كل شيء. علاوة على ذلك، باستثناء الكتب، كان هناك القليل من الترفيه في ذلك الوقت. في ذلك الوقت، كانت ميرا تبحث عن إجابات في الكتب. تفضل ميرا تلك الحقائق العلمية المستقرة والتي يمكن دراستها بعمق. ومصادر العلوم الإنسانية مثل التاريخ وعلم الاجتماع موضع شك لأن التاريخ يتغير باستمرار. لذلك نشأت ميرا على نزعة بديهية وطبيعية نحو العلوم والرياضيات. من الناحية الأساسية، لا تزال ميرا تعمل في مجال الرياضيات في Open AI.
ونظرًا لأدائها الأكاديمي الممتاز، حصلت ميرا على منحة دراسية وأكملت آخر عامين من دراستها الثانوية في كندا.
في الكلية، درست ميرا الهندسة الميكانيكية لأنها اعتقدت أنها أفضل طريقة لتطبيق المعرفة على مشاكل العالم الحقيقي. في ذلك الوقت، كانت ميرا مهتمة جدًا بطرق توفير النقل المستدام والطاقة المستدامة للعالم. كان مشروع تخرجها في ذلك الوقت هو بناء سيارة سباق هجينة باستخدام المكثفات الفائقة.
وبعد فترة وجيزة، انضمت ميرا إلى شركة تيسلا وشاركت في العمل على المحرك المزدوج موديل S. عملت مع Model X منذ الأيام الأولى لتصميمه الأولي وقادت في النهاية عملية إطلاق المشروع بأكمله.
وكان العمل أيضًا في شركة تيسلا هو ما جعل ميرا مهتمة جدًا بتطبيق الذكاء الاصطناعي، وخاصة القيادة الذاتية. لأنه يمكنه استخدام الذكاء الاصطناعي ورؤية الكمبيوتر لإحداث ثورة في السفر. بدأت تفكر أكثر في التطبيقات المختلفة للذكاء الاصطناعي. لذلك أصبح ميرا مهتمًا بشكل متزايد بالذكاء الاصطناعي والتغييرات التي يمكن أن يحدثها في العالم.
وعلى وجه التحديد، فهي مهتمة جدًا بكيفية تأثير الذكاء الاصطناعي على التفاعل بين الإنسان والحاسوب وطريقة تفاعل الأشخاص مع المعلومات بشكل عام، وهي مهتمة جدًا بالحوسبة المكانية. بعد ذلك، انضمت إلى شركة Leap Motion، وهي شركة تكنولوجيا سوداء، في منصب نائب رئيس المنتجات والهندسة. وكانت هذه التجربة هي التي عززت قدراتها الإنتاجية.
(بالمناسبة، مؤسس شركة Leap Motion، ديفيد هولز، أسس تطبيقًا آخر مشهورًا للذكاء الاصطناعي Midjourney بعد بيع Leap Motion).
وفي عام 2018، انضمت ميرا إلى OpenAI. وذلك عندما بدأت تفكر أكثر فيما يمكن أن يحدث إذا ركزت فقط على التنوع.
بالإضافة إلى ذلك، من خلال مناقشة ميرا لطرق البحث، يمكننا أن نرى روحها الاستكشافية للابتكار التكنولوجي في بيئة غير مؤكدة:
#ملخص المحادثة
قام الرأسمالي الاستثماري المعروف A16Z برهان كبير في مجال الذكاء الاصطناعي. المقتطفات التالية هي مقتطفات من محادثة بين مارتن، مدير صندوق A16Z، وميرا. شاركت ميرا قصة ChatGPT ومستقبل الذكاء الاصطناعي والتفاعل بين الإنسان والحاسوب. يمكننا أيضًا أن نرى أن ميرا، التي تتمتع بخلفية كمدير منتج، تشعر بقلق بالغ بشأن إمكانية تطبيق المنتجات.
مارتن: هل تعتقد أنها مشكلة أنظمة أم مشكلة هندسية في الوقت الحالي؟
ميرا: كلاهما. إن الأنظمة والمشاكل الهندسية ضخمة، ونحن نقوم بنشر هذه التقنيات ونحاول توسيع نطاقها، وجعلها أكثر كفاءة، وجعلها في متناول الجميع. هذا يعني أنك لست بحاجة إلى معرفة تعقيدات تعلم الآلة لاستخدامها.
في الواقع، يمكننا أن نرى التناقض بين توفير هذه النماذج من خلال واجهة برمجة التطبيقات (API) مقابل توفير التكنولوجيا من خلال ChatGPT. إنها في الأساس نفس التقنية، مع استثناء واحد محتمل: يتمتع ChatGPT بقدرات التعلم المعزز وردود الفعل البشرية. ما يعنيه هذا هو أن الاستجابة والقدرة على التقاط خيال الناس والسماح لهم باستخدام هذه التكنولوجيا كل يوم مختلفة تمامًا.
واجهة اللغة الطبيعية
مارتن: أعتقد أيضًا أن ChatGPT API أمر مثير للاهتمام للغاية. كلما أستخدم هذه النماذج في برامجي، أشعر دائمًا وكأنني أغلف كمبيوترًا عملاقًا في عداد. أحيانًا أقول، "سأعطي النموذج لوحة مفاتيح وماوس وأتركه يقوم بالبرمجة." واجهة برمجة التطبيقات باللغة الإنجليزية وسأخبره بما يجب فعله وسيقوم بكل البرمجة. أشعر بالفضول، عندما تصمم شيئًا مثل ChatGPT، هل تعتقد أنه بمرور الوقت ستكون الواجهة الفعلية لغة طبيعية، أم تعتقد أن البرامج لا يزال لها دور كبير تلعبه؟
ميرا: تصبح البرمجة أقل تجريدًا في ChatGPT، ويمكننا التحدث إلى أجهزة الكمبيوتر باستخدام اللغة الطبيعية وبنطاق ترددي عالٍ. ولكن ربما يكون هناك ناقل آخر وهو أن هذه التكنولوجيا تساعدنا على فهم كيفية العمل معها بدلاً من برمجتها. أصبحت طبقة البرمجة أسهل وأسهل في الوصول إليها لأنه يمكنك البرمجة باللغة الطبيعية. لكن الجانب الآخر مما نراه مع ChatGPT هو أنه يمكنك بالفعل العمل مع النموذج كشريك أو زميل.
مارتن: سيكون من المثير للاهتمام أن نرى ما سيحدث مع مرور الوقت. لقد قررت أن يكون لديك واجهة برمجة تطبيقات في ChatGTP، ولكن كزميل، ليس لديك واجهة برمجة تطبيقات. أنت تتحدث إلى زميل. مع مرور الوقت، قد تتطور هذه الأشياء إلى التحدث باللغة الطبيعية. أو هل تعتقد أنه يجب دائمًا أن يكون هناك مكون في النظام يكون عبارة عن آلة ذات حالة محدودة، أو كمبيوتر تقليدي؟
ميرا: هناك نقطة تحول الآن حيث نقوم بإعادة تعريف كيفية تفاعلنا مع المعلومات الرقمية، ونحن نفعل ذلك في شكل أنظمة الذكاء الاصطناعي. ربما لدينا العديد من أنظمة الذكاء الاصطناعي، وربما تتمتع جميعها بقدرات مختلفة. ربما لدينا نظام عالمي يتبعنا في كل مكان، ويعرف خلفيتي، وما فعلته اليوم، وما هي أهدافي في الحياة والعمل، ويساعدني خلال الأوقات الصعبة، ويرشدني، وما إلى ذلك. كما يمكنك أن تتخيل، هذا قوي للغاية.
والآن، وصلنا إلى نقطة انعطاف في إعادة تعريفه. نحن لا نعرف كيف سيبدو المستقبل، ونحن نعمل جاهدين لجعل هذه الأدوات والتقنيات متاحة للعديد من الأشخاص الآخرين حتى يتمكنوا من التجربة ويمكننا أن نرى ما سيحدث. هذه هي الاستراتيجية التي استخدمناها منذ البداية.
في ChatGPT الأسبوع الماضي، شعرنا بالقلق من أنه لم يكن جيدًا بما فيه الكفاية. لقد رأينا جميعا ما حدث. لقد نشرناها وأخبرنا الناس أنها قامت بعمل جيد حقًا في العثور على حالات جديدة. هذا ما يحدث عندما تجعل هذه الأشياء سهلة الوصول إليها وسهلة الاستخدام، وتجعل من السهل على الجميع استخدامها.
خارطة طريق تطوير OpenAI
مارتن: عندما يتعلق الأمر بالذكاء الاصطناعي، فإن الناس لا يعرفون كيف يفكرون بعد. يجب أن يكون هناك بعض التوجيه، وعليك أن تقوم ببعض الاختيارات. أنت في OpenAI، وعليك أن تقرر ما يجب فعله بعد ذلك. إذا كان بإمكانك السير خلال عملية اتخاذ القرار هذه: كيف تقرر ما يجب عليك فعله، أو ما الذي يجب التركيز عليه، أو ما الذي يجب إصداره، أو كيفية وضع نفسك؟
ميرا: إذا فكرت في كيفية ظهور ChatGPT، فستجد أنه لم يكن المنتج الذي أردنا إطلاقه. في الواقع، تعود جذورها الحقيقية إلى أكثر من 5 سنوات مضت، عندما كنا نفكر في كيفية صنع نظام ذكاء اصطناعي آمن. أنت لا تريد بالضرورة أن يكتب الإنسان بالفعل الوظيفة الموضوعية، لأنك لا تريد أن يكون لديك بديل يقوم بذلك لوظيفة موضوعية معقدة، أو أنك لا تريد ارتكاب الأخطاء لأن ذلك قد يكون خطيرًا للغاية.
هذا هو المكان الذي يأتي فيه التعلم المعزز باستخدام ردود الفعل البشرية. ما نحاول تحقيقه حقًا هو مواءمة نظام الذكاء الاصطناعي مع القيم الإنسانية والسماح له بقبول ردود الفعل البشرية. بناءً على ردود الفعل البشرية، من المرجح أن يفعل الشيء الصحيح وأقل احتمالاً أن يفعل شيئًا لا ترغب في القيام به. بعد ذلك، بعد أن قمنا بتطوير GPT-3 وإصداره على واجهة برمجة التطبيقات (API)، كانت هذه هي المرة الأولى التي نطبق فيها بالفعل أبحاثنا الأمنية على العالم الحقيقي. ويتم تحقيق ذلك من خلال نموذج متابعة التعليمات.
نحن نستخدم هذا الأسلوب لأخذ الإشارات من العملاء الذين يستخدمون واجهة برمجة التطبيقات (API)، ومن ثم نطلب من المقاولين تقديم تعليقات للنموذج للتعلم منه. لقد قمنا بضبط النموذج بناءً على هذه البيانات وقمنا ببناء نموذج يتبع التعليمات. من المرجح أن يتبعوا نية المستخدم ويفعلوا ما تريد أن يفعله بالفعل. وهذا أمر قوي للغاية لأن سلامة الذكاء الاصطناعي ليست مجرد مفهوم نظري تجلس فيه وتتحدث عنه. يصبح الأمر في الواقع: نحن الآن ندخل عصر أنظمة أمن الذكاء الاصطناعي، كيف يمكنك دمج ذلك في العالم الحقيقي؟
من الواضح أننا في نماذج اللغات الكبيرة نرى تمثيلات رائعة للمفاهيم وأفكار العالم الحقيقي. ولكن من حيث الإنتاج، هناك العديد من المشاكل. من الواضح أن الهلوسة هي واحدة من أكبر المشاكل. لقد عملنا على قضايا الوهم والأصالة. كيف يمكنك الحصول على هذه النماذج للتعبير عن عدم اليقين؟
كان سلف ChatGPT في الواقع مشروعًا آخر أطلقنا عليه اسم WebGPT، والذي يستخدم الاسترجاع للحصول على المعلومات والاستشهاد بالمصادر. أصبح هذا المشروع في النهاية ChatGPT لأننا اعتقدنا أن المحادثات كانت مميزة. فهو يتيح لك طرح الأسئلة وتصحيح الشخص الآخر والتعبير عن عدم اليقين.
مارتن: يتم اكتشاف الأخطاء باستمرار لأنك تتفاعل...
ميرا: نعم، مع هذا النوع من التفاعل، يمكنك فهم الحقيقة الأعمق. لقد بدأنا بالسير في هذا الاتجاه، وفي ذلك الوقت كنا نفعل ذلك باستخدام GPT-3 وGPT-3.5. ومن منظور أمني، نحن متحمسون جدًا لهذا الأمر. لكن هناك شيء واحد ينساه الناس وهو أننا قمنا في هذا الوقت بتدريب GPT-4. في OpenAI، نحن متحمسون جدًا بشأن GPT-4 ولدينا ChatGPT في مرآة الرؤية الخلفية. ثم أدركنا، "سنقضي ستة أشهر في التركيز على محاذاة GPT-4 وسلامته،" وبدأنا في التفكير فيما يمكننا فعله. أحد الأشياء الرئيسية هو وضع ChatGPT في أيدي الباحثين ويمكنهم تقديم تعليقات لنا الآن بعد أن أصبح لدينا نموذج المحادثة هذا. والغرض الأولي هو الحصول على تعليقات من الباحثين واستخدامها لجعل GPT-4 أكثر اتساقًا وأمانًا وقوة وموثوقية.
مارتن: عندما تقول الاتساق والأمن، هل أنت على حق في تضمين ذلك، وأنه يفعل ما يريد؟ أم أنك تقصد الأمان، أو حماية نفسك فعليًا من نوع ما من الأذى؟
ميرا: بالاتساق، أعني عادةً أنه يتوافق مع نية المستخدم، لذا فهو يفعل بالضبط ما تريد أن يفعله. لكن الأمان يشمل أيضًا أشياء أخرى، مثل إساءة الاستخدام، حيث يحاول المستخدمون عمدًا استخدام نموذج لإنتاج نتائج ضارة. باستخدام ChatGPT، نحاول فعليًا أن نجعل من الأرجح أن النموذج سيفعل ما تريد منه أن يفعله، مما يجعله أكثر اتساقًا. وأردنا أيضًا معرفة مشكلة الهلوسة، والتي من الواضح أنها مشكلة صعبة للغاية.
أعتقد أن هذا النهج لاستخدام ردود الفعل البشرية لتعزيز التعلم، إذا حاولنا القيام بذلك، ربما هذا ما نحتاجه.
مارتن: إذًا، ألا توجد خطة كبرى؟ ما الذي يتعين علينا القيام به للوصول إلى AGI؟ إنها مجرد مسألة اتخاذ خطوة واحدة في كل مرة.
ميرا: نعم. وجميع القرارات الصغيرة التي تتخذها على طول الطريق. ربما يكون من المرجح حدوث ذلك لأننا اتخذنا قرارًا استراتيجيًا قبل بضع سنوات لمتابعة المنتج. نحن نفعل هذا لأننا نعتقد أنه من المستحيل الجلوس في المختبر وتطوير هذه الأشياء في الفراغ دون الحصول على تعليقات من المستخدمين في العالم الحقيقي. هذا هو الافتراض. أعتقد أن هذا يساعدنا في اتخاذ بعض هذه القرارات وبناء البنية التحتية الأساسية حتى نتمكن في النهاية من نشر شيء مثل ChatGPT.
** قانون النسب **
مارتن: يمكنك تكرار قانون التناسب. أعتقد أن هذه مشكلة كبيرة يعاني منها الجميع. إن وتيرة التقدم مذهلة. لكن يبدو أن تاريخ الذكاء الاصطناعي يشير إلى أنك في مرحلة ما تحقق عوائد متناقصة، وهذا ليس معياريًا. إنه نوع من التناقص التدريجي. من وجهة نظرك (والتي ربما تكون المنظور الأكثر حكمة في الصناعة بأكملها) هل تعتقد أن قانون التوسع سيصمد وسنستمر في رؤية التقدم، أو هل تعتقد أننا نتجه نحو تناقص العوائد؟
ميرا: لا يوجد دليل على أنه مع استمرارنا في توسيع النموذج عبر البيانات والمحاور الحسابية، فإننا لن نحصل على نماذج أفضل وأكثر قوة. ما إذا كان الأمر سيصل إلى AGI (الذكاء العام الاصطناعي) هو سؤال مختلف. وفي هذه العملية، قد تكون هناك حاجة إلى بعض الاختراقات والتقدمات الأخرى. للحصول على الكثير من الفوائد من هذه النماذج الأكبر حجمًا، لا يزال أمام قوانين القياس طريق طويل لتقطعه.
مارتن: كيف يمكنك تعريف الذكاء الاصطناعي العام؟
ميرا: في ميثاق OpenAI الخاص بنا. نحن نعرّفه بأنه نظام كمبيوتر يمكنه إكمال معظم الأعمال الفكرية بشكل مستقل.
مارتن: كنت أتناول الغداء، وكان هناك روبرت نيشيهارا من Anyscale. لقد سألني عما أسميه سؤال روبرت نيشيهارا. أعتقد أن هذا في الواقع توصيف جيد جدًا. لقد قال، "هناك سلسلة متصلة بين أجهزة الكمبيوتر وآينشتاين. أنت تنتقل من أجهزة الكمبيوتر إلى القطط، ومن القطط إلى الأشخاص العاديين، ومن الأشخاص العاديين إلى أينشتاين." ثم سأل السؤال، "نحن في سلسلة متصلة." الموقع؟ ما هي المشاكل التي سيتم حلها؟"
الجميع متفق على أننا نعرف كيف نتحول من قطة إلى إنسان. نحن لا نعرف كيفية الانتقال من الكمبيوتر إلى القطة لأنها مشكلة إدراك عالمية. نحن قريبون، لكننا لم نصل إلى هناك بعد، ولا نعرف حقًا كيف نفعل أينشتاين، وهذا هو المنطق المحدد.
ميرا: يمكنك الحصول على الكثير من خلال الضبط الدقيق، ولكن بشكل عام، أعتقد أنه في معظم المهام، نحن على مستوى المتدرب الآن. المشكلة هي الموثوقية. لا يمكنك الاعتماد بشكل كامل على النظام للقيام بما تريده أن يفعله طوال الوقت. في العديد من المهام لا يستطيع القيام بذلك. كيف يمكنك تحسين الموثوقية بمرور الوقت ومن ثم توسيع الإمكانات الجديدة التي يمكن لهذه النماذج القيام بها؟
أعتقد أنه من المهم الاهتمام بهذه القدرات الناشئة، حتى لو كانت غير موثوقة على الإطلاق. وخاصة بالنسبة للأشخاص الذين يبنون شركة اليوم، فأنت تريد حقًا أن تفكر في "ما هو الممكن اليوم؟ ماذا ترى اليوم؟ "تصبح هذه النماذج موثوقة بسرعة كبيرة.
**نموذج واحد يمكن أن يغزو العالم؟ **
مارتن: سأسألك على الفور، توقع كيف سيبدو المستقبل. لكن قبل أن أسأل، بأنانية، كيف تعتقد أن اقتصاديات هذا الأمر ستتطور. أقول لك ما يذكرني به. هذا يذكرني بصناعة السيليكون. أتذكر أنه في التسعينيات، عندما اشتريت جهاز كمبيوتر، كان هناك الكثير من معالجات الكتابة الغريبة. "هذه مطابقة للسلسلة، وهذه نقطة عائمة، وهذا تشفير،" كل ذلك يستهلك وحدة المعالجة المركزية.
لقد اتضح أن تعدد الاستخدامات قوي جدًا لدرجة أنه يخلق نوعًا معينًا من الاقتصاد حيث تلعب كل من Intel و AMD دوراً فاعلاً. وبطبيعة الحال، فإن صنع هذه الرقائق يكلف الكثير من المال.
لذلك يمكنك أن تتخيل مستقبلين. في المستقبل، سيكون تعدد الاستخدامات قويًا جدًا لدرجة أن النماذج الكبيرة ستستوعب بشكل أساسي جميع الوظائف بمرور الوقت. ثم هناك مستقبل آخر حيث توجد مجموعة من النماذج المختلفة، وجميع أنواع القطع، ونقاط مختلفة في مساحة التصميم. هل لديك هذا الشعور: هل OpenAI فريد من نوعه، أم أن لديه العديد من النماذج؟
ميرا: هذا يعتمد على ما تريد القيام به. ومن الواضح أن المسار الآن هو أن أنظمة الذكاء الاصطناعي هذه ستقوم بالمزيد والمزيد من العمل الذي نقوم به. سيكونون قادرين على العمل بشكل مستقل، ولكننا سنحتاج إلى توفير التوجيه والإرشاد والإشراف. لكنني لا أريد القيام بالكثير من الأعمال المتكررة التي يجب علي القيام بها كل يوم. أريد التركيز على أشياء أخرى. ربما لا يتعين علينا العمل 10 أو 12 ساعة يوميًا، وربما يمكننا العمل أقل ونكون أكثر إنتاجية. هذا ما آمله. فيما يتعلق بالطريقة التي تعمل بها المنصة، حتى اليوم يمكنك أن ترى أن لدينا العديد من النماذج المتاحة من خلال واجهة برمجة التطبيقات، بدءًا من النماذج الصغيرة جدًا وحتى نماذجنا المتطورة.
لا يحتاج المرء دائمًا إلى استخدام النموذج الأقوى والأكثر قدرة. في بعض الأحيان يحتاجون فقط إلى نموذج يناسب حالة الاستخدام الخاصة بهم، ويكون أكثر اقتصادا. أعتقد أنه سيكون هناك نطاق. ولكن فيما يتعلق بكيفية تصورنا لألعاب المنصات، فنحن بالتأكيد نريد من الأشخاص البناء على نموذجنا، ونريد أن نمنحهم الأدوات اللازمة لتسهيل الأمر ومنحهم المزيد والمزيد من الوصول والتحكم بشكل صحيح. يمكنك إحضار بياناتك، ويمكنك تخصيص هذه النماذج. يمكنك حقًا التركيز على الطبقات خارج النموذج وتحديد المنتج، وهو أمر صعب للغاية في الواقع. هناك الكثير من التركيز الآن على بناء المزيد من النماذج، ولكن من الصعب جدًا بناء منتجات جيدة فوق هذه النماذج.
5-10 سنوات القادمة
مارتن: أود منك أن تتنبأ بالمكان الذي تعتقد أنه سيكون عليه خلال ثلاث أو خمس أو عشر سنوات.
ميرا: أعتقد أن النموذج التأسيسي اليوم لديه تمثيل كبير للعالم في النص. نحن نضيف نماذج أخرى مثل الصور ومقاطع الفيديو وجميع أنواع الأشياء الأخرى، بحيث يمكن لهذه النماذج أن توفر صورة أكثر اكتمالا للعالم من حولنا، على غرار الطريقة التي نفهم بها العالم ونراقبه. العالم موجود ليس فقط بالكلمات، بل بالصور أيضًا. نحن بالتأكيد نتحرك في هذا الاتجاه، وسيكون لدينا هذه النماذج الأكبر التي تستخدم كل هذه الأنماط في أعمال ما قبل التدريب. نريد حقًا أن تفهم هذه النماذج المدربة مسبقًا العالم كما نفعل نحن.
في الجزء الناتج من النموذج، نقدم التعلم المعزز بالتغذية الراجعة البشرية. نريد أن يقوم النموذج بالفعل بما نطلب منه، ونريد أن يكون ذلك موثوقًا. وهذا يتطلب الكثير من العمل وربما إدخال التصفح حتى يمكن الحصول على معلومات جديدة والرجوع إليها وحل الهلوسة. لا أعتقد أن هذا ممكن. أعتقد أن هذا أمر قابل للتحقيق.
ومن ناحية المنتج، نريد جمع كل ذلك معًا في مجموعة من المنتجات التي يعمل الأشخاص معها وتوفير منصة يمكن للأشخاص البناء عليها. إذا ذهبت حقًا إلى الخارج، فهذه النماذج قوية جدًا جدًا. ومن الواضح أن هذا يأتي مع الخوف من أن هذه النماذج القوية للغاية لا تتفق مع نوايانا. التحدي الكبير هو Super Alignment، وهو تحدٍ تقني صعب. لدينا فريق كامل في OpenAI يركز على هذه المشكلة.