a16z: لماذا نستثمر في Yupp

المؤلف: كريس ديكسون، مؤسس a16z crypto؛ إليزابيث هاركاوي، شريكة في a16z crypto؛ الترجمة: 金色财经xiaozou

نظام الذكاء الاصطناعي الحديث لا يعتمد فقط على قوة الحوسبة والخوارزميات، بل لا يمكنه الاستغناء عن التغذية الراجعة من البشر. تستخدم الشركات تقنيات تحسين ما بعد التدريب مثل التعلم المعزز بالتغذية الراجعة البشرية (RLHF) وتحسين التفضيلات المباشرة (DPO) لتحسين النماذج. هذه التقنيات قادرة على تقليل التحيز، مما يجعل النموذج يستجيب لجمل التوجيه بجودة أعلى وترابط أفضل - وهو أمر حيوي لتسريع تطوير الذكاء الاصطناعي. تقييم النماذج أيضاً حاسم، ولكن لا يمكن تحقيق تحسين النموذج إلا بعد تحديد ما هو "أفضل".

التحدي ينشأ من هنا: الشركات لا ترغب في المشاركة - حيث تعتبر بياناتها وعمليات التدريب أسرارًا. وهذا يؤدي إلى أن تقييم نماذج الذكاء الاصطناعي يعتمد فقط على معلومات محدودة من أنظمة مغلقة، أو على اختبارات معيارية ثابتة بعيدة عن التطبيقات العملية، مما يقيّد بشكل خطير مجال تحسين النموذج. كما أن المستخدمين يتواجدون في منطقة غامضة من المعلومات، حيث لا يعرفون كيف تؤثر تعليقاتهم على النموذج، ولا يمكنهم حتى التأكد مما إذا كانت تلك التعليقات قد تم اعتمادها. بعض قوائم النماذج ومنصات العمل الجماعي تحاول تحسين الشفافية، لكنها عادة لا تدعم المستخدمين في تتبع مساهماتهم، ولا تقدم عوائد حقيقية للمشاركة. تلك المنصات التي تدعي الشفافية والنزاهة، غالبًا ما تعتمد على الأمانة بدلاً من معايير قابلة للتنفيذ.

نحن نعتقد أن تقنية التشفير يمكن أن توفر الشفافية والملكية لهذه المنطقة الرمادية للذكاء الاصطناعي. يمكن أن تساعد سلسلة الكتل المساهمين في الحصول على المكافآت بسهولة، وتوفر لمطوري الذكاء الاصطناعي ضمانًا موثوقًا لجودة البيانات ومصدرها. يحصل المستخدمون على الحوافز، ويحصل المطورون على بيانات موثوقة، ويمكن للجميع تحقيق تدقيق ثنائي الاتجاه في هذا السوق المفتوح. لهذا السبب، نحن من رواد جولة التمويل الأولية بقيمة 33 مليون دولار للمنتج الاستهلاكي Yupp، الذي يمكّن الجميع من استكشاف ومقارنة أحدث نماذج الذكاء الاصطناعي مجانًا.

يستخدم Yupp نموذج التعهيد الجماعي لتقييم النموذج: يدخل المستخدم كلمة سريعة ، وينظر إلى استجابات متعددة تم إنشاؤها بواسطة الذكاء الاصطناعي بالتوازي ، ثم يختار أفضل إجابة. تولد خياراتهم "حزم" موقعة رقميا من بيانات التفضيلات ذات القيمة لتحسين وتقييم الذكاء الاصطناعي بعد التدريب. لا يحصل المستخدمون على وصول مجاني إلى أحدث الموديلات فحسب ، بل يكافأون أيضا على التعليقات التي يقدمونها.

تصميم Yupp يحول حكم البشر إلى موارد اقتصادية قابلة للتجديد. مع ظهور بيانات تفاعلية جديدة، ستصبح البيانات القديمة "منتهية الصلاحية"، مما يشكل دوامة طبيعية: المزيد من الاستخدامات تؤدي إلى تقييمات أحدث؛ التقييمات الأحدث تُنتج نماذج أفضل؛ والنماذج الأفضل تجذب مزيدًا من الاستخدام. يمكن لجميع المشاركين - سواء كانوا مستخدمين عاديين أو مطوري نماذج AI - الانضمام إلى هذه العملية ورؤية القواعد الشفافة التي تنطبق على الجميع، مما يضمن أن السوق تحتفظ بموثوقية وحيادية. لا يمكن لأحد إخفاء الدرجات، ولا يمكن لأحد التلاعب بالمكافآت أو النتائج.

يتمتع فريق المؤسسين بخبرة عميقة في مجالي الذكاء الاصطناعي والتشفير. لقد قاموا بتطوير منتجات تعلم آلي موجهة للمستهلكين معًا في المراحل المبكرة من تويتر. شغل بانكاج غوبتا منصب رئيس الهندسة العالمية للجانب الاستهلاكي في Google Pay وCoinbase، وكان جيلاد ميشني رئيس تعلم الآلة في GoogleX. يجمع الفريق الناشئ مهندسين كبار من Google وCoinbase وأفضل المختبرات.

تحتاج الذكاء الاصطناعي إلى نظام تقييم قوي وموثوق يعتمد على مدخلات بشرية واسعة النطاق، وتعتبر تقنية التشفير هي الآلة التي تحقق هذه الثقة. من خلال تمكين المستخدمين العالميين من المساهمة بتعليقات لتحسين النموذج، تكرس Yupp نفسها لتكون طبقة التقييم الأساسية للذكاء الاصطناعي في المستقبل. نحن فخورون بدعم Yupp ونتطلع إلى مساعدتهم في بناء حلقة تغذية راجعة على السلسلة لضمان أن نتائج الابتكار في الذكاء الاصطناعي يتم مشاركتها من قبل جميع البناة.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت