قال ألتمان إن البيانات البشرية في عجلة من أمرها ، وبدأت Microsoft OpenAI في تغذية الذكاء الاصطناعي بالذكاء الاصطناعي: ستصبح جميع البيانات في المستقبل بيانات تركيبية
هناك نقص في البيانات البشرية ، ويضطر الذكاء الاصطناعي إلى البدء في تناول البيانات التي ينتجها الذكاء الاصطناعي!
هذا هو الوضع الراهن الذي تواجهه شركات الذكاء الاصطناعي المتطورة مثل ** Microsoft ** و ** OpenAI **.
لقد بحثوا عن كميات هائلة من البيانات من منصات ومنتديات مثل ويكيبيديا ، والكتب الإلكترونية ، والمواقع الإخبارية ، والمدونات ، وتويتر ، وريديت ، والآن ... تنفد البيانات لديهم.
ولكن ، لتدريب نموذج كبير أفضل ، لا يكفي أي قدر من البيانات.
وفقًا لـ "فاينانشيال تايمز" ، تقوم العديد من الشركات بتغذية النتائج الناتجة عن النماذج الكبيرة ، ما يسمى ** البيانات التركيبية ** (البيانات التركيبية) ، إلى النماذج الكبيرة ذات المعلمات الأصغر ، ووجدت أن النتائج ليست سيئة.
من أجل استخدام البيانات التركيبية ، ** أوبن إيه آي ** الرئيس التنفيذي سام ألتمان لا يمانع فقط ، ولكنه قال أيضًا "** جميع البيانات في المستقبل ستصبح بيانات تركيبية **".
Cohere ، وهي شركة ناشئة ضخمة تبلغ قيمتها 2 مليار دولار ، تستخدم أيضًا بيانات تركيبية. يعتقد أيدان جوميز ، الرئيس التنفيذي للشركة وأحد مؤلفي النموذج الكلاسيكي الكبير Transformer paper ، أن:
يمكن للبيانات التركيبية أن تسرع المسار إلى أنظمة الذكاء الاصطناعي "** superintelligent **".
إذن ، ما هي النماذج الكبيرة التي تستخدم بالفعل البيانات التركيبية ، ومن أين تأتي هذه البيانات التركيبية؟
** تقوم منظمة العفو الدولية الكبيرة بتجميع البيانات ، والذكاء الاصطناعي الصغير يأكل **
هذه ما يسمى ** البيانات التركيبية ** هي في الأساس البيانات التي تم إنشاؤها بواسطة النموذج الكبير الحالي بأداء أفضل ، بعد ** الضبط اليدوي ** ، ثم يتم تغذيتها إلى نموذج كبير أصغر قليلاً.
على سبيل المثال ، حاول Cohere استخدام نموذجين كبيرين لإجراء حوارات "تمثيل الأدوار" وتحويل النتائج الناتجة عنهما إلى بيانات تركيبية.
يلعب هذان النموذجان الكبيران دور "مدرس الرياضيات" و "الطالب" على التوالي ، ويقومان بإجراء فصل افتراضي لتدريس الرياضيات. وفي الوقت نفسه ، وضع كوير موظفًا بشريًا على الهامش للإشراف على جيل الحوار.
يتدخل البشر ** لإصلاح ** النص كلما سارت المحادثة بشكل خاطئ.
في حين أنه يتطلب قوة بشرية ، إلا أنه أرخص بكثير من تعيين خبراء في العلوم والطب والأعمال لكتابة النص.
إذن ، ما نوع النماذج الكبيرة التي ستستخدم هذه البيانات التركيبية؟
أظهرت الأبحاث الحديثة من Microsoft Research أنه يمكن استخدام البيانات التركيبية لتدريب نماذج اللغة الأصغر قليلاً من GPT-4 أو PaLM-2 **.
خذ مجموعة بيانات "قصص الأطفال البالغة من العمر أربع سنوات" ** TinyStories ** التي تم إنشاؤها بواسطة GPT-4 كمثال. وقد ثبت أن مجموعة البيانات هذه تحتوي فقط على كلمات يمكن للأطفال في سن 4 سنوات فهمها ، ولكن بعد التدريب نموذج كبير ، نفس القصة الصحيحة نحويًا وتقرأ بسلاسة:
بالنسبة لأسباب استخدام البيانات التركيبية ، يعتقد الرئيس التنفيذي لشركة Cohere Aidan Gomez:
من الأفضل بالطبع أن تكون قادرًا على الحصول على البيانات من الإنترنت ، لكن بيانات الشبكة شديدة الفوضى بحيث لا تلبي الاحتياجات على الإطلاق. في المقابل ، البيانات التركيبية وفيرة بالفعل ، حتى لو لم يتم نشرها على نطاق واسع.
** ظهرت السلسلة الصناعية من الخلف **
في الوقت الحاضر ، بدأت الشركات بما في ذلك Scale AI و Gretel.ai في تقديم خدمات البيانات التركيبية إلى العالم الخارجي.
أولاً ، ** Scale AI ** ، التي أطلقت منتج بيانات تركيبي ، Scale Synthetic لتزويد المؤسسات بخدمات البيانات التركيبية.
في الأخبار السابقة التي أفادت بأن SemiAnalysis نشر أخبارًا عن "الدانتيل الكبير" لـ GPT-4 ، ذكر أيضًا أنه في مجموعة بيانات GPT-4 ، هناك ملايين الصفوف من Scale AI وبيانات ضبط التعليمات الداخلية.
أما بالنسبة لمنصة البيانات التركيبية ** Gretel.ai ** ، من الموقع الرسمي ، فقد تعاونت مع شركات مختلفة مثل Google و Riot Games و HSBC لتوليد المزيد من البيانات الاصطناعية ليستخدمها المطورون الآخرون.
يعتقد علي غولشان ، الرئيس التنفيذي لشركة Gretel.ai ، أن فائدة البيانات التركيبية هي أنها تحافظ على خصوصية جميع الأفراد في مجموعة البيانات مع الحفاظ على تكاملها الإحصائي.
لكن لا يقبل الجميع "العملية السحرية" للبيانات التركيبية ، ففي الوقت الحالي تنقسم آراء جميع الأطراف بشكل أساسي إلى مجموعتين.
البعض ** يوافق ** على استخدام البيانات التركيبية. بما في ذلك شركات الذكاء الاصطناعي مثل Cohere ، لا تزال العديد من الشركات المنخرطة في نماذج واسعة النطاق تصر على هذا النهج ، وتعتقد أنها قد تولد ذكاءً اصطناعيًا أفضل ، بل وتولد "ذكاءً خارقًا".
يعتقد جزء آخر أن البيانات التركيبية ستسمح للذكاء الاصطناعي في النهاية بـ "** تغذية نفسها **".
على سبيل المثال ، أظهرت دراسة من جامعة أكسفورد وجامعة كامبريدج وإمبريال كوليدج وجامعة تورنتو وجامعة إدنبرة ومعهد Vector أن:
سوف يتسبب التدريب باستخدام البيانات التركيبية في حدوث عيوب لا رجعة فيها في النموذج:
** انسَ ** تلك "الأحداث المستحيلة" التي ينتهي بها الأمر بالتسمم بالبيانات الذاتية.
يعتقد بعض مستخدمي الإنترنت أن هذه البيانات التركيبية ستصبح في نهاية المطاف مجموعة من "الحمأة غير القابلة للاستخدام" - ومن ثم يتعين على الناس توظيف علماء البيانات لتنظيفها.
سخر بعض مستخدمي الإنترنت من أن هذا يبدو مثل "** زواج الأقارب بالذكاء الاصطناعي **".
هل تعتقد أن الذكاء الاصطناعي يحتاج إلى استخدام البيانات التركيبية؟
ارتباط مرجعي:
[1]
[2]
[3]
[4]
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
قال ألتمان إن البيانات البشرية في عجلة من أمرها ، وبدأت Microsoft OpenAI في تغذية الذكاء الاصطناعي بالذكاء الاصطناعي: ستصبح جميع البيانات في المستقبل بيانات تركيبية
المصدر الأصلي: Qubit
هناك نقص في البيانات البشرية ، ويضطر الذكاء الاصطناعي إلى البدء في تناول البيانات التي ينتجها الذكاء الاصطناعي!
هذا هو الوضع الراهن الذي تواجهه شركات الذكاء الاصطناعي المتطورة مثل ** Microsoft ** و ** OpenAI **.
لقد بحثوا عن كميات هائلة من البيانات من منصات ومنتديات مثل ويكيبيديا ، والكتب الإلكترونية ، والمواقع الإخبارية ، والمدونات ، وتويتر ، وريديت ، والآن ... تنفد البيانات لديهم.
وفقًا لـ "فاينانشيال تايمز" ، تقوم العديد من الشركات بتغذية النتائج الناتجة عن النماذج الكبيرة ، ما يسمى ** البيانات التركيبية ** (البيانات التركيبية) ، إلى النماذج الكبيرة ذات المعلمات الأصغر ، ووجدت أن النتائج ليست سيئة.
من أجل استخدام البيانات التركيبية ، ** أوبن إيه آي ** الرئيس التنفيذي سام ألتمان لا يمانع فقط ، ولكنه قال أيضًا "** جميع البيانات في المستقبل ستصبح بيانات تركيبية **".
Cohere ، وهي شركة ناشئة ضخمة تبلغ قيمتها 2 مليار دولار ، تستخدم أيضًا بيانات تركيبية. يعتقد أيدان جوميز ، الرئيس التنفيذي للشركة وأحد مؤلفي النموذج الكلاسيكي الكبير Transformer paper ، أن:
إذن ، ما هي النماذج الكبيرة التي تستخدم بالفعل البيانات التركيبية ، ومن أين تأتي هذه البيانات التركيبية؟
** تقوم منظمة العفو الدولية الكبيرة بتجميع البيانات ، والذكاء الاصطناعي الصغير يأكل **
هذه ما يسمى ** البيانات التركيبية ** هي في الأساس البيانات التي تم إنشاؤها بواسطة النموذج الكبير الحالي بأداء أفضل ، بعد ** الضبط اليدوي ** ، ثم يتم تغذيتها إلى نموذج كبير أصغر قليلاً.
على سبيل المثال ، حاول Cohere استخدام نموذجين كبيرين لإجراء حوارات "تمثيل الأدوار" وتحويل النتائج الناتجة عنهما إلى بيانات تركيبية.
يلعب هذان النموذجان الكبيران دور "مدرس الرياضيات" و "الطالب" على التوالي ، ويقومان بإجراء فصل افتراضي لتدريس الرياضيات. وفي الوقت نفسه ، وضع كوير موظفًا بشريًا على الهامش للإشراف على جيل الحوار.
في حين أنه يتطلب قوة بشرية ، إلا أنه أرخص بكثير من تعيين خبراء في العلوم والطب والأعمال لكتابة النص.
إذن ، ما نوع النماذج الكبيرة التي ستستخدم هذه البيانات التركيبية؟
أظهرت الأبحاث الحديثة من Microsoft Research أنه يمكن استخدام البيانات التركيبية لتدريب نماذج اللغة الأصغر قليلاً من GPT-4 أو PaLM-2 **.
خذ مجموعة بيانات "قصص الأطفال البالغة من العمر أربع سنوات" ** TinyStories ** التي تم إنشاؤها بواسطة GPT-4 كمثال. وقد ثبت أن مجموعة البيانات هذه تحتوي فقط على كلمات يمكن للأطفال في سن 4 سنوات فهمها ، ولكن بعد التدريب نموذج كبير ، نفس القصة الصحيحة نحويًا وتقرأ بسلاسة:
** ظهرت السلسلة الصناعية من الخلف **
في الوقت الحاضر ، بدأت الشركات بما في ذلك Scale AI و Gretel.ai في تقديم خدمات البيانات التركيبية إلى العالم الخارجي.
أولاً ، ** Scale AI ** ، التي أطلقت منتج بيانات تركيبي ، Scale Synthetic لتزويد المؤسسات بخدمات البيانات التركيبية.
في الأخبار السابقة التي أفادت بأن SemiAnalysis نشر أخبارًا عن "الدانتيل الكبير" لـ GPT-4 ، ذكر أيضًا أنه في مجموعة بيانات GPT-4 ، هناك ملايين الصفوف من Scale AI وبيانات ضبط التعليمات الداخلية.
لكن لا يقبل الجميع "العملية السحرية" للبيانات التركيبية ، ففي الوقت الحالي تنقسم آراء جميع الأطراف بشكل أساسي إلى مجموعتين.
البعض ** يوافق ** على استخدام البيانات التركيبية. بما في ذلك شركات الذكاء الاصطناعي مثل Cohere ، لا تزال العديد من الشركات المنخرطة في نماذج واسعة النطاق تصر على هذا النهج ، وتعتقد أنها قد تولد ذكاءً اصطناعيًا أفضل ، بل وتولد "ذكاءً خارقًا".
يعتقد جزء آخر أن البيانات التركيبية ستسمح للذكاء الاصطناعي في النهاية بـ "** تغذية نفسها **".
على سبيل المثال ، أظهرت دراسة من جامعة أكسفورد وجامعة كامبريدج وإمبريال كوليدج وجامعة تورنتو وجامعة إدنبرة ومعهد Vector أن:
ارتباط مرجعي: [1] [2] [3] [4]