قال ألتمان إن البيانات البشرية في عجلة من أمرها ، وبدأت Microsoft OpenAI في تغذية الذكاء الاصطناعي بالذكاء الاصطناعي: ستصبح جميع البيانات في المستقبل بيانات تركيبية

2023-08-14 03:22:36

المصدر الأصلي: Qubit

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI‌

هناك نقص في البيانات البشرية ، ويضطر الذكاء الاصطناعي إلى البدء في تناول البيانات التي ينتجها الذكاء الاصطناعي!

هذا هو الوضع الراهن الذي تواجهه شركات الذكاء الاصطناعي المتطورة مثل ** Microsoft ** و ** OpenAI **.

لقد بحثوا عن كميات هائلة من البيانات من منصات ومنتديات مثل ويكيبيديا ، والكتب الإلكترونية ، والمواقع الإخبارية ، والمدونات ، وتويتر ، وريديت ، والآن ... تنفد البيانات لديهم.

ولكن ، لتدريب نموذج كبير أفضل ، لا يكفي أي قدر من البيانات.

وفقًا لـ "فاينانشيال تايمز" ، تقوم العديد من الشركات بتغذية النتائج الناتجة عن النماذج الكبيرة ، ما يسمى ** البيانات التركيبية ** (البيانات التركيبية) ، إلى النماذج الكبيرة ذات المعلمات الأصغر ، ووجدت أن النتائج ليست سيئة.

من أجل استخدام البيانات التركيبية ، ** أوبن إيه آي ** الرئيس التنفيذي سام ألتمان لا يمانع فقط ، ولكنه قال أيضًا "** جميع البيانات في المستقبل ستصبح بيانات تركيبية **".

Cohere ، وهي شركة ناشئة ضخمة تبلغ قيمتها 2 مليار دولار ، تستخدم أيضًا بيانات تركيبية. يعتقد أيدان جوميز ، الرئيس التنفيذي للشركة وأحد مؤلفي النموذج الكلاسيكي الكبير Transformer paper ، أن:

يمكن للبيانات التركيبية أن تسرع المسار إلى أنظمة الذكاء الاصطناعي "** superintelligent **".

إذن ، ما هي النماذج الكبيرة التي تستخدم بالفعل البيانات التركيبية ، ومن أين تأتي هذه البيانات التركيبية؟

تقوم منظمة العفو الدولية الكبيرة بتجميع البيانات ، والذكاء الاصطناعي الصغير يأكل

هذه ما يسمى ** البيانات التركيبية ** هي في الأساس البيانات التي تم إنشاؤها بواسطة النموذج الكبير الحالي بأداء أفضل ، بعد ** الضبط اليدوي ** ، ثم يتم تغذيتها إلى نموذج كبير أصغر قليلاً.

على سبيل المثال ، حاول Cohere استخدام نموذجين كبيرين لإجراء حوارات "تمثيل الأدوار" وتحويل النتائج الناتجة عنهما إلى بيانات تركيبية.

يلعب هذان النموذجان الكبيران دور "مدرس الرياضيات" و "الطالب" على التوالي ، ويقومان بإجراء فصل افتراضي لتدريس الرياضيات. وفي الوقت نفسه ، وضع كوير موظفًا بشريًا على الهامش للإشراف على جيل الحوار.

يتدخل البشر ** لإصلاح ** النص كلما سارت المحادثة بشكل خاطئ.

في حين أنه يتطلب قوة بشرية ، إلا أنه أرخص بكثير من تعيين خبراء في العلوم والطب والأعمال لكتابة النص.

إذن ، ما نوع النماذج الكبيرة التي ستستخدم هذه البيانات التركيبية؟

أظهرت الأبحاث الحديثة من Microsoft Research أنه يمكن استخدام البيانات التركيبية لتدريب نماذج اللغة الأصغر قليلاً من GPT-4 أو PaLM-2 **.

خذ مجموعة بيانات "قصص الأطفال البالغة من العمر أربع سنوات" ** TinyStories ** التي تم إنشاؤها بواسطة GPT-4 كمثال. وقد ثبت أن مجموعة البيانات هذه تحتوي فقط على كلمات يمكن للأطفال في سن 4 سنوات فهمها ، ولكن بعد التدريب نموذج كبير ، نفس القصة الصحيحة نحويًا وتقرأ بسلاسة:

بالنسبة لأسباب استخدام البيانات التركيبية ، يعتقد الرئيس التنفيذي لشركة Cohere Aidan Gomez:

من الأفضل بالطبع أن تكون قادرًا على الحصول على البيانات من الإنترنت ، لكن بيانات الشبكة شديدة الفوضى بحيث لا تلبي الاحتياجات على الإطلاق. في المقابل ، البيانات التركيبية وفيرة بالفعل ، حتى لو لم يتم نشرها على نطاق واسع.

ظهرت السلسلة الصناعية من الخلف

في الوقت الحاضر ، بدأت الشركات بما في ذلك Scale AI و Gretel.ai في تقديم خدمات البيانات التركيبية إلى العالم الخارجي.

أولاً ، ** Scale AI ** ، التي أطلقت منتج بيانات تركيبي ، Scale Synthetic لتزويد المؤسسات بخدمات البيانات التركيبية.

في الأخبار السابقة التي أفادت بأن SemiAnalysis نشر أخبارًا عن "الدانتيل الكبير" لـ GPT-4 ، ذكر أيضًا أنه في مجموعة بيانات GPT-4 ، هناك ملايين الصفوف من Scale AI وبيانات ضبط التعليمات الداخلية.

أما بالنسبة لمنصة البيانات التركيبية ** Gretel.ai ** ، من الموقع الرسمي ، فقد تعاونت مع شركات مختلفة مثل Google و Riot Games و HSBC لتوليد المزيد من البيانات الاصطناعية ليستخدمها المطورون الآخرون.

يعتقد علي غولشان ، الرئيس التنفيذي لشركة Gretel.ai ، أن فائدة البيانات التركيبية هي أنها تحافظ على خصوصية جميع الأفراد في مجموعة البيانات مع الحفاظ على تكاملها الإحصائي.

لكن لا يقبل الجميع "العملية السحرية" للبيانات التركيبية ، ففي الوقت الحالي تنقسم آراء جميع الأطراف بشكل أساسي إلى مجموعتين.

البعض ** يوافق ** على استخدام البيانات التركيبية. بما في ذلك شركات الذكاء الاصطناعي مثل Cohere ، لا تزال العديد من الشركات المنخرطة في نماذج واسعة النطاق تصر على هذا النهج ، وتعتقد أنها قد تولد ذكاءً اصطناعيًا أفضل ، بل وتولد "ذكاءً خارقًا".

يعتقد جزء آخر أن البيانات التركيبية ستسمح للذكاء الاصطناعي في النهاية بـ "** تغذية نفسها **".

على سبيل المثال ، أظهرت دراسة من جامعة أكسفورد وجامعة كامبريدج وإمبريال كوليدج وجامعة تورنتو وجامعة إدنبرة ومعهد Vector أن:

سوف يتسبب التدريب باستخدام البيانات التركيبية في حدوث عيوب لا رجعة فيها في النموذج: ** انسَ ** تلك "الأحداث المستحيلة" التي ينتهي بها الأمر بالتسمم بالبيانات الذاتية.

يعتقد بعض مستخدمي الإنترنت أن هذه البيانات التركيبية ستصبح في نهاية المطاف مجموعة من "الحمأة غير القابلة للاستخدام" - ومن ثم يتعين على الناس توظيف علماء البيانات لتنظيفها.

سخر بعض مستخدمي الإنترنت من أن هذا يبدو مثل "** زواج الأقارب بالذكاء الاصطناعي **".

هل تعتقد أن الذكاء الاصطناعي يحتاج إلى استخدام البيانات التركيبية؟

ارتباط مرجعي: [1] [2] [3] [4]

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.