المصدر: قائمة الحروف الأبجدية ، المؤلف: Bi Andi ، المحرر: Wang Jing
مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI
لقد سمعت فقط عن وسائل التواصل الاجتماعي التي تحاول جعل المستخدمين يبقون لفترة أطول ، لكنني لم أسمع أبدًا عن أخذ زمام المبادرة لوضع حد أقصى للناس. افتح عينيك الآن ، يضيف Elon Musk "حماية ثانوية" لجميع مستخدمي Twitter ، وكل هذا تم فرضه بالفعل بواسطة الذكاء الاصطناعي؟
في الوقت الحاضر ، لا يعتمد الحد الأقصى لعدد التغريدات التي يمكن لمستخدمي تويتر تصفحها كل يوم على سرعة اليد أو عدم الرغبة في البقاء حتى وقت متأخر ، ولكن هناك رقم واضح: 10000 حساب تم التحقق منه (أي خدمة "بلوبيرد" المدفوعة) ، 10000 حساب لم يتم التحقق منه هناك 1000 حساب ، ولكن 500 فقط للحسابات المسجلة حديثًا التي لم يتم التحقق منها.
هذا هو معيار Musk الذي تم رفعه مرتين في مواجهة المستخدمين الغاضبين. أما بالنسبة للسبب ، فهو "معالجة المستويات القصوى من تجريف البيانات والتلاعب بالنظام."
كان يشير إلى شركات الذكاء الاصطناعي ، التي تتطلب كميات كبيرة من البيانات لتتغذى عليها من أجل تدريب نماذجها. في ديسمبر من العام الماضي ، قطع Musk اتصال البيانات مع OpenAI ، وفي أبريل من هذا العام اتهم Microsoft باستخدام بيانات Twitter بشكل غير قانوني.
يواجه OpenAI دعوى قضائية جماعية حيث يتخذ Musk خطوات صارمة لوقف تجريف البيانات. هناك 16 مدعياً في الدعوى ، جميعهم أفراد ، أي متصفحي الإنترنت العاديين. وهم يتهمون شركة OpenAI "بنزع 300 مليار كلمة من الإنترنت سراً" وسرقة "كميات هائلة من المعلومات الخاصة" من مستخدم الإنترنت دون إذن لتدريب ChatGPT.
من ناحية ، يوجد مستخدمو الإنترنت والمنصات التي جمعت قدرًا كبيرًا من محتوى المحتوى الذي ينشئه المستخدمون على مر السنين ، ومن الجانب الآخر توجد شركات AIGC الناشئة.بدأت حرب حول التقاط البيانات وأمن الخصوصية.
01
ضرب الصنوج والطبول الجمعة. كانت نهاية الأسبوع أخيرًا ، لكن مستخدمي تويتر أصيبوا بالدهشة ، حيث ظهرت رسالة خطأ على الشاشة ، تذكرهم بأنهم تجاوزوا "حد المعدل" ، وانتهكوا قواعد تويتر ، وشاهدوا عددًا كبيرًا جدًا من التغريدات.
لم يعرف الناس ما يعنيه هذا على الإطلاق. تقدم رئيس Twitter Musk إلى الأمام وقال إن هناك بالفعل حدًا للمعدل ، وأعلن: من أجل حل المستويات القصوى من كشط البيانات والتلاعب بالنظام ، تم التحقق من التسجيلات غير المؤكدة والجديدة. غير مسموح بها. الحسابات التي تم التحقق منها محدودة بـ 6000 و 600 و 300 تغريدة في اليوم.
قبل ذلك ، أعلن ماسك للتو أن تويتر سيمنع المستخدمين غير المسجلين من تصفح المحتوى ، وهو أمر مقبول للمستخدمين. لقد تم وضع القيد بالفعل ، وأصيب المستخدمون بالشلل ، ثم نظروا إلى الفرق بين التحقق وعدم التحقق ، وأثارت دهشةهم: هل من الممكن أنك تحاول استخدام هذه الخدعة للترويج لـ "اشتراك بلو بيرد"؟ في منطقة التعليقات ، علق أكثر من مستخدم: "الآن علينا استخدام المال للفوز؟"
صوت الاستياء مرتفع ، وتظهر منتجات Twitter المنافسة Hive و Mastodon و Tumblr وما إلى ذلك في الموضوعات الساخنة ، ويتم استخدام ميم من علامة Twitter على نطاق واسع. خلال الجدل ، رفع ماسك المعيار مرتين إلى 10000 مشاهدة بواسطة مستخدمين تم التحقق منهم و 1000 مشاهدة لمستخدمين لم يتم التحقق منهم.
قال أحد حسابات ماسك المزيفة مازحا: "لقد حددت الحد لأنكم مدمنو تويتر بحاجة إلى الخروج. أنا أفعل أشياء جيدة للعالم". يعتبر هذا النوع من فكرة زيادة القيمة أمرًا جيدًا. تُعد ضربة ماسك الخلفية بمثابة إعادة نشر ، وقد أرسل أيضًا رسالة منفصلة "اذهب وقم بزيارة أصدقائك وعائلتك".
لكن النكتة هي مزحة ، قدم ماسك تفسيرًا واضحًا لـ "اختباره": التعامل مع زحف البيانات. يكمن استياء المستخدمين أيضًا في ما إذا كانت طريقة التقييد الحالية فعالة ، وليس في مشكلة الزحف إلى البيانات.
ما مدى جدية أن تأتي الشركات الناشئة في مجال الذكاء الاصطناعي إلى تويتر "لاستخراج البيانات"؟ في تغريدة ، قال ماسك إن الزيادة في حركة المرور أجبرت تويتر على تشغيل خوادم النسخ الاحتياطي: ** "من المبالغة في تشغيل عدد كبير من الخوادم عبر الإنترنت في حالات الطوارئ فقط لمساعدة بعض الشركات الناشئة في مجال الذكاء الاصطناعي ذات التقييمات المرتفعة بشكل يبعث على السخرية." إنه أمر مزعج. . "**
في اليوم السابق لعاصفة الحد الحالية ، قام تيم سويني ، الرئيس التنفيذي لشركة Epic Games ، بالتغريد أيضًا للشكوى من أن Twitter كان يبني جدارًا أيضًا. ورد ماسك: "المئات (أو حتى أكثر) من الكتل تزحف بقوة إلى التغريدات. بيانات خاصة ، إلى النقطة التي تؤثر فيها على تجربة المستخدم. كيف نفعل ذلك؟ أنا منفتح على كل الأفكار ".
قدم تيم ، الذي كان لا يزال يشكو حتى الآن ، اقتراحات جادة بسرعة ، مثل إضافة حظر زحف البيانات إلى شروط خدمة تويتر ، وحماية النظام الأساسي بهندسة أمن المعلومات ، واتخاذ إجراءات قانونية ضد الشركات التي تسيء استخدام تويتر على نطاق واسع.
والجدير بالذكر أن ماسك ذكر في رده أنه سيتم اتخاذ إجراء قانوني "مطلقًا" ضد الذين سرقوا البيانات: "(بتفاؤل) 2 إلى 3 سنوات من الآن ، وأتطلع إلى رؤيتهم في المحكمة".
بغض النظر عما إذا كان تخمين "إضافة الحطب إلى الاشتراكات المدفوعة" هو قلب الشرير ، فإن حمل ماسك عالياً راية خصوصية المستخدم قد يكون أكثر أو أقل أنانية. في أبريل ، ترددت شائعات عن ماسك لتأسيس شركة X.AI ، وهي شركة ذكاء اصطناعي جديدة ، لمحاربة ChatGPT. إذا كنت تريد حقًا تدريب نموذج لغوي كبير ، فإن بيانات مستخدم Twitter هي بالطبع لك فقط.
على أي حال ، من الممكن الحد بشكل فعال من تدفق النظام الأساسي.ماسك مستعد لمحاربة الشركات الناشئة في مجال الذكاء الاصطناعي حتى النهاية.
02
** تمامًا كما كان ماسك يهاجم للحد من تدفق النظام الأساسي بأكمله ، شاركت شركة OpenAI ، "البادئ" في جنون AICG هذا ومؤسس ChatGPT ، في دعوى قضائية جماعية. **
بدأت الدعوى في المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا ، مع 16 مدعياً ، جميعهم مجهولون ، وجميعهم أفراد. الشكوى طويلة جدًا ، مكونة من 157 صفحة كاملة ، تبدأ بجملة من ستيفن هوكينج: "إن ظهور الذكاء الاصطناعي القوي هو إما أفضل شيء في تاريخ البشرية أو أسوأ شيء". بالإضافة إلى OpenAI ، فإن المتهم لديه أيضًا مايكروسوفت ، التي ضخت عشرات المليارات من الدولارات فيها.
** الادعاء الأساسي هو أن ChatGPT انتهكت "حقوق الطبع والنشر والخصوصية لعدد لا يحصى من الأشخاص" عندما استخدمت البيانات التي تم جمعها من الإنترنت "لتدريب تقنيتها". **
وجاء في لائحة الاتهام أن شركة أوبن أيه آي ألغت سرا 300 مليار كلمة من الإنترنت وتنصت على "كتب ومقالات ومواقع ومنشورات ، بما في ذلك معلومات شخصية تم الحصول عليها دون موافقة" ، في انتهاك لقوانين الخصوصية. وذكر أن OpenAI يزحف إلى كمية كبيرة من بيانات الشبكة ، بما في ذلك البيانات الموجودة في وسائل التواصل الاجتماعي.
كما أشاروا إلى أن OpenAI لديها مجموعة خاصة بالذكاء الاصطناعي جمعت كميات هائلة من البيانات الشخصية ، بما في ذلك البيانات المأخوذة من منشورات Reddit والمواقع التي ترتبط بها.
هذا اتهام من حيث نماذج التدريب.بالإضافة إلى ذلك ، ادعى المدعي أيضًا أن تفاعل المستخدم مع منتجات OpenAI والمعلومات الخاصة في المنتجات تم الوصول إليه بشكل غير قانوني واختلاس من قبل OpenAI على نطاق واسع.
ليست هذه هي المرة الأولى التي تواجه فيها شركة OpenAI دعوى قضائية جماعية في الولايات المتحدة. في نوفمبر من العام الماضي ، أطلق مبرمجو Github دعوى قضائية جماعية ضد Github و OpenAI و Microsoft ، متهمين OpenAI بانتهاك تراخيص المصادر المفتوحة المزعومة واستخدام الكود الذي ساهموا به لتدريب أداة الذكاء الاصطناعي الملكية GitHub Copilot.
في ذلك الوقت ، لم يكن ChatGPT متصلاً بالإنترنت بعد ، وإذا نظرنا إلى الوراء الآن ، فقد تم الكشف عن مشكلة التدريب على الذكاء الاصطناعي في ذلك الوقت. اليوم ، أحدث إجراء جماعي موجه إلى ChatGPT ، التي تضم نطاقًا أوسع من المستخدمين ونطاقًا أوسع من الأشخاص الذين تم انتهاكهم (جميع الضحايا أساسًا). والأهم من ذلك ، في ظل جنون AIGC ، قد تؤثر أي سابقة قانونية على المستقبل .
وفي بيان ، وصف كلاركسون ، مكتب محاماة المصلحة العامة الذي يمثل القضية ، الدعوى الجماعية بأنها قضية فيدرالية "تاريخية" وتحذيرًا للذكاء الاصطناعي ككل.
من هذا المنظور ، فإن العبء الواقع على أكتاف شركة أوبن إيه آي ثقيل بالفعل.
** واجهت OpenAI بالفعل الكثير من المشاكل بسبب التقاط البيانات وأمن الخصوصية. النظام الأساسي مقفل وينقلب المستخدمون على بعضهم البعض. هذه ليست سوى غيض من فيض. **
في أوروبا ، تم التحقيق مع OpenAI من قبل العديد من البلدان ، وحتى في أبريل من هذا العام ، كانت إيطاليا قلقة من أن ChatGPT قد ينتهك قوانين حماية البيانات الأوروبية وحظر ChatGPT مؤقتًا.
يتقدم تنظيم مجال الذكاء الاصطناعي بأكمله. أطلقت فرنسا خطة عمل للذكاء الاصطناعي في مايو ، ومن بينها ، فيما يتعلق بـ AIGC ، يولي منظم الخصوصية الفرنسي اهتمامًا خاصًا لممارسة بعض نماذج الذكاء الاصطناعي التي تجمع البيانات من الإنترنت وبناء مجموعات البيانات لتدريب النماذج اللغوية الكبيرة.
الأهم هو قانون تنظيم الذكاء الاصطناعي للاتحاد الأوروبي (قانون الاتحاد الأوروبي للذكاء الاصطناعي) ، والذي هو حاليًا في مرحلته النهائية. من المرجح أن يصبح مشروع القانون نموذجًا للحوكمة العالمية للذكاء الاصطناعي.
03
** المنصات والمستخدمين والإشراف ، شكلت القوى الثلاث اتجاه تطويق ، وتعهدت بوضع قواعد لـ AIGC في أقرب وقت ممكن ، والبدء من نقطة البداية للتدريب على نموذج واسع النطاق. **
من ناحية أخرى ، ينفد الوقت وتتطور AIGC بسرعة كبيرة.
نحن لا نعرف إلى من يشير ماسك بعبارة "الشركات الناشئة في مجال الذكاء الاصطناعي ذات القيمة العالية السخيفة". ولكن بمجرد ظهور هذه الكلمات ، كان هناك بالفعل العديد من الضربات ، ففي نهاية المطاف ، هناك موجات من التمويل في مجال AIGC ، وكلها أموال ساخنة.
بين الشركات الناشئة ، تقدر قيمة OpenAI بحوالي 30 مليار دولار أمريكي ، بمجموع تمويل إجمالي قدره 11.3 مليار دولار أمريكي ، مما يجعلها الأغنى في AIGC ؛ تليها أنثروبيك ، ثاني أغنى الشركات ، بتقييم يزيد عن 4 مليارات دولار أمريكي. و Inflection ، التي صدمت وادي السيليكون بتمويل بقيمة 1.3 مليار دولار قبل أيام قليلة فقط ، تقدر قيمتها بنحو 4 مليارات دولار ، وقد تم تأسيسها منذ أكثر من عام فقط.
ربما لم يأتِ الكبار بعد. تستخدم Inflection نموذجها اللغوي الكبير ، وحصلت هذه المرة على 1.3 مليار دولار أمريكي وأعلنت أنها ستصنع 22000 شريحة Nvidia H100 لبناء أكبر مجموعة ذكاء اصطناعي في العالم. مع هذه القوة الحاسوبية واسعة النطاق ، لا بد أن تكون كمية المعلمات المستهدفة ومجموعات البيانات مذهلة.
** من ناحية أخرى ، وُلد ChatGPT من العدم ، وليس من السهل "الإصلاح" عندما يكشف عن المشاكل. ** الأجيال العديدة لنماذج اللغات الكبيرة من OpenAI ، ومجموعة بيانات GPT-2 تحتوي على 40 جيجابايت من النص ، بينما يحتوي GPT-3 (أي النموذج المستخدم عند إصدار ChatGPT) على 570 جيجابايت من بيانات التدريب. أما بالنسبة لـ GPT-4 التي تم إصدارها هذا العام ، حجم مجموعة البيانات في الأساس لم يتم الكشف عنها.
لم يتم توثيق كميات هائلة من البيانات بشكل صحيح منذ البداية. قالت Nicia Sambaswan ، عالمة الأبحاث السابقة في Google ، في المقابلات إن شركات التكنولوجيا لا تتابع كيفية جمع بيانات التدريب على الذكاء الاصطناعي أو التعليق عليها ، أو حتى ما هو موجود في مجموعة البيانات.
يشبه ChatGPT المكتمل الصندوق الأسود ، وهو صندوق أسود مبني في غرفة سرية. الآن يجب أن يكون شفافًا ومحميًا للخصوصية ، مثل سرد البيانات التي يتم الزحف إليها ، وشرح كيفية استخدامها أثناء الاستخدام ، و حذفه بناءً على طلب المستخدمين ، فجزء معين من البيانات هو في الواقع صعب للغاية.
متصفحو الإنترنت والمنظمون يعضون OpenAI ، هناك سبب آخر لا يمكن تجاهله - في السنوات التي تطورت فيها وسائل التواصل الاجتماعي ونمت ، كان الوعي بحماية بيانات الشبكة الشخصية لا يزال في مهده ، وعندما حان وقت المنافسة ، تم العثور عليه أنه قد فاته كثيرًا.
عندما جلس زوكربيرج لأول مرة في جلسة الاستماع في الكونجرس في عام 2018 ، تم إطلاق منصته للتواصل الاجتماعي Facebook لمدة 14 عامًا. في ذلك الوقت ، وقع Facebook في "فضيحة كامبريدج" ، وقال كبير مسؤولي التكنولوجيا في الشركة إن 87 مليون مستخدم قد تأثروا. لقد كان أيضًا خطأً كبيرًا ناجمًا عن تجريف البيانات.
عندما جلس ألتمان في جلسة استماع للكونجرس الأمريكي في مايو من هذا العام ، أعرب أعضاء الكونجرس مرارًا عن أسفهم لعدم تحركهم في عصر وسائل التواصل الاجتماعي. **
لا يزال يجري تدريب النماذج الكبيرة واحدة تلو الأخرى ، ولا يزال التقاط البيانات خيطًا. فقط من خلال استيعابها يمكننا أن نأمل في توضيح ارتباك AIGC.
** المواد المرجعية: **
سينا تكنولوجي: "مسك ومايكروسوفت على العارضة؟ تويتر يتهم مايكروسوفت باستخدام بياناتها بشكل غير قانوني »
مبرمج دارك هورس: "هؤلاء المبرمجون رفعوا دعوى ضد جيثب!" طلب تعويض قدره 64.9 مليار "
Jiemian News: "تم إصدار مشروع قانون الاتحاد الأوروبي للذكاء الاصطناعي ، كيف يمكن لشركة OpenAI والشركات الأخرى أن تسجل ، وما هي النزاعات الأساسية؟" "
Tencent Technology: "التعطش للبيانات يضر OpenAI؟ تتهمها دول عديدة بانتهاك قوانين حماية البيانات
Netease Technology: "يتم استئناف ChatGPT عبر الإنترنت في إيطاليا ولكن المشاكل التنظيمية لـ OpenAI بدأت للتو"
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
المسك قاسٍ على OpenAI ، ويعاني المستخدمون من سوء الحظ
المصدر: قائمة الحروف الأبجدية ، المؤلف: Bi Andi ، المحرر: Wang Jing
لقد سمعت فقط عن وسائل التواصل الاجتماعي التي تحاول جعل المستخدمين يبقون لفترة أطول ، لكنني لم أسمع أبدًا عن أخذ زمام المبادرة لوضع حد أقصى للناس. افتح عينيك الآن ، يضيف Elon Musk "حماية ثانوية" لجميع مستخدمي Twitter ، وكل هذا تم فرضه بالفعل بواسطة الذكاء الاصطناعي؟
في الوقت الحاضر ، لا يعتمد الحد الأقصى لعدد التغريدات التي يمكن لمستخدمي تويتر تصفحها كل يوم على سرعة اليد أو عدم الرغبة في البقاء حتى وقت متأخر ، ولكن هناك رقم واضح: 10000 حساب تم التحقق منه (أي خدمة "بلوبيرد" المدفوعة) ، 10000 حساب لم يتم التحقق منه هناك 1000 حساب ، ولكن 500 فقط للحسابات المسجلة حديثًا التي لم يتم التحقق منها.
هذا هو معيار Musk الذي تم رفعه مرتين في مواجهة المستخدمين الغاضبين. أما بالنسبة للسبب ، فهو "معالجة المستويات القصوى من تجريف البيانات والتلاعب بالنظام."
كان يشير إلى شركات الذكاء الاصطناعي ، التي تتطلب كميات كبيرة من البيانات لتتغذى عليها من أجل تدريب نماذجها. في ديسمبر من العام الماضي ، قطع Musk اتصال البيانات مع OpenAI ، وفي أبريل من هذا العام اتهم Microsoft باستخدام بيانات Twitter بشكل غير قانوني.
يواجه OpenAI دعوى قضائية جماعية حيث يتخذ Musk خطوات صارمة لوقف تجريف البيانات. هناك 16 مدعياً في الدعوى ، جميعهم أفراد ، أي متصفحي الإنترنت العاديين. وهم يتهمون شركة OpenAI "بنزع 300 مليار كلمة من الإنترنت سراً" وسرقة "كميات هائلة من المعلومات الخاصة" من مستخدم الإنترنت دون إذن لتدريب ChatGPT.
من ناحية ، يوجد مستخدمو الإنترنت والمنصات التي جمعت قدرًا كبيرًا من محتوى المحتوى الذي ينشئه المستخدمون على مر السنين ، ومن الجانب الآخر توجد شركات AIGC الناشئة.بدأت حرب حول التقاط البيانات وأمن الخصوصية.
01
ضرب الصنوج والطبول الجمعة. كانت نهاية الأسبوع أخيرًا ، لكن مستخدمي تويتر أصيبوا بالدهشة ، حيث ظهرت رسالة خطأ على الشاشة ، تذكرهم بأنهم تجاوزوا "حد المعدل" ، وانتهكوا قواعد تويتر ، وشاهدوا عددًا كبيرًا جدًا من التغريدات.
لم يعرف الناس ما يعنيه هذا على الإطلاق. تقدم رئيس Twitter Musk إلى الأمام وقال إن هناك بالفعل حدًا للمعدل ، وأعلن: من أجل حل المستويات القصوى من كشط البيانات والتلاعب بالنظام ، تم التحقق من التسجيلات غير المؤكدة والجديدة. غير مسموح بها. الحسابات التي تم التحقق منها محدودة بـ 6000 و 600 و 300 تغريدة في اليوم.
صوت الاستياء مرتفع ، وتظهر منتجات Twitter المنافسة Hive و Mastodon و Tumblr وما إلى ذلك في الموضوعات الساخنة ، ويتم استخدام ميم من علامة Twitter على نطاق واسع. خلال الجدل ، رفع ماسك المعيار مرتين إلى 10000 مشاهدة بواسطة مستخدمين تم التحقق منهم و 1000 مشاهدة لمستخدمين لم يتم التحقق منهم.
ما مدى جدية أن تأتي الشركات الناشئة في مجال الذكاء الاصطناعي إلى تويتر "لاستخراج البيانات"؟ في تغريدة ، قال ماسك إن الزيادة في حركة المرور أجبرت تويتر على تشغيل خوادم النسخ الاحتياطي: ** "من المبالغة في تشغيل عدد كبير من الخوادم عبر الإنترنت في حالات الطوارئ فقط لمساعدة بعض الشركات الناشئة في مجال الذكاء الاصطناعي ذات التقييمات المرتفعة بشكل يبعث على السخرية." إنه أمر مزعج. . "**
في اليوم السابق لعاصفة الحد الحالية ، قام تيم سويني ، الرئيس التنفيذي لشركة Epic Games ، بالتغريد أيضًا للشكوى من أن Twitter كان يبني جدارًا أيضًا. ورد ماسك: "المئات (أو حتى أكثر) من الكتل تزحف بقوة إلى التغريدات. بيانات خاصة ، إلى النقطة التي تؤثر فيها على تجربة المستخدم. كيف نفعل ذلك؟ أنا منفتح على كل الأفكار ".
قدم تيم ، الذي كان لا يزال يشكو حتى الآن ، اقتراحات جادة بسرعة ، مثل إضافة حظر زحف البيانات إلى شروط خدمة تويتر ، وحماية النظام الأساسي بهندسة أمن المعلومات ، واتخاذ إجراءات قانونية ضد الشركات التي تسيء استخدام تويتر على نطاق واسع.
والجدير بالذكر أن ماسك ذكر في رده أنه سيتم اتخاذ إجراء قانوني "مطلقًا" ضد الذين سرقوا البيانات: "(بتفاؤل) 2 إلى 3 سنوات من الآن ، وأتطلع إلى رؤيتهم في المحكمة".
بغض النظر عما إذا كان تخمين "إضافة الحطب إلى الاشتراكات المدفوعة" هو قلب الشرير ، فإن حمل ماسك عالياً راية خصوصية المستخدم قد يكون أكثر أو أقل أنانية. في أبريل ، ترددت شائعات عن ماسك لتأسيس شركة X.AI ، وهي شركة ذكاء اصطناعي جديدة ، لمحاربة ChatGPT. إذا كنت تريد حقًا تدريب نموذج لغوي كبير ، فإن بيانات مستخدم Twitter هي بالطبع لك فقط.
على أي حال ، من الممكن الحد بشكل فعال من تدفق النظام الأساسي.ماسك مستعد لمحاربة الشركات الناشئة في مجال الذكاء الاصطناعي حتى النهاية.
02
** تمامًا كما كان ماسك يهاجم للحد من تدفق النظام الأساسي بأكمله ، شاركت شركة OpenAI ، "البادئ" في جنون AICG هذا ومؤسس ChatGPT ، في دعوى قضائية جماعية. **
بدأت الدعوى في المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا ، مع 16 مدعياً ، جميعهم مجهولون ، وجميعهم أفراد. الشكوى طويلة جدًا ، مكونة من 157 صفحة كاملة ، تبدأ بجملة من ستيفن هوكينج: "إن ظهور الذكاء الاصطناعي القوي هو إما أفضل شيء في تاريخ البشرية أو أسوأ شيء". بالإضافة إلى OpenAI ، فإن المتهم لديه أيضًا مايكروسوفت ، التي ضخت عشرات المليارات من الدولارات فيها.
** الادعاء الأساسي هو أن ChatGPT انتهكت "حقوق الطبع والنشر والخصوصية لعدد لا يحصى من الأشخاص" عندما استخدمت البيانات التي تم جمعها من الإنترنت "لتدريب تقنيتها". **
وجاء في لائحة الاتهام أن شركة أوبن أيه آي ألغت سرا 300 مليار كلمة من الإنترنت وتنصت على "كتب ومقالات ومواقع ومنشورات ، بما في ذلك معلومات شخصية تم الحصول عليها دون موافقة" ، في انتهاك لقوانين الخصوصية. وذكر أن OpenAI يزحف إلى كمية كبيرة من بيانات الشبكة ، بما في ذلك البيانات الموجودة في وسائل التواصل الاجتماعي.
كما أشاروا إلى أن OpenAI لديها مجموعة خاصة بالذكاء الاصطناعي جمعت كميات هائلة من البيانات الشخصية ، بما في ذلك البيانات المأخوذة من منشورات Reddit والمواقع التي ترتبط بها.
هذا اتهام من حيث نماذج التدريب.بالإضافة إلى ذلك ، ادعى المدعي أيضًا أن تفاعل المستخدم مع منتجات OpenAI والمعلومات الخاصة في المنتجات تم الوصول إليه بشكل غير قانوني واختلاس من قبل OpenAI على نطاق واسع.
ليست هذه هي المرة الأولى التي تواجه فيها شركة OpenAI دعوى قضائية جماعية في الولايات المتحدة. في نوفمبر من العام الماضي ، أطلق مبرمجو Github دعوى قضائية جماعية ضد Github و OpenAI و Microsoft ، متهمين OpenAI بانتهاك تراخيص المصادر المفتوحة المزعومة واستخدام الكود الذي ساهموا به لتدريب أداة الذكاء الاصطناعي الملكية GitHub Copilot.
في ذلك الوقت ، لم يكن ChatGPT متصلاً بالإنترنت بعد ، وإذا نظرنا إلى الوراء الآن ، فقد تم الكشف عن مشكلة التدريب على الذكاء الاصطناعي في ذلك الوقت. اليوم ، أحدث إجراء جماعي موجه إلى ChatGPT ، التي تضم نطاقًا أوسع من المستخدمين ونطاقًا أوسع من الأشخاص الذين تم انتهاكهم (جميع الضحايا أساسًا). والأهم من ذلك ، في ظل جنون AIGC ، قد تؤثر أي سابقة قانونية على المستقبل .
وفي بيان ، وصف كلاركسون ، مكتب محاماة المصلحة العامة الذي يمثل القضية ، الدعوى الجماعية بأنها قضية فيدرالية "تاريخية" وتحذيرًا للذكاء الاصطناعي ككل.
من هذا المنظور ، فإن العبء الواقع على أكتاف شركة أوبن إيه آي ثقيل بالفعل.
** واجهت OpenAI بالفعل الكثير من المشاكل بسبب التقاط البيانات وأمن الخصوصية. النظام الأساسي مقفل وينقلب المستخدمون على بعضهم البعض. هذه ليست سوى غيض من فيض. **
في أوروبا ، تم التحقيق مع OpenAI من قبل العديد من البلدان ، وحتى في أبريل من هذا العام ، كانت إيطاليا قلقة من أن ChatGPT قد ينتهك قوانين حماية البيانات الأوروبية وحظر ChatGPT مؤقتًا.
يتقدم تنظيم مجال الذكاء الاصطناعي بأكمله. أطلقت فرنسا خطة عمل للذكاء الاصطناعي في مايو ، ومن بينها ، فيما يتعلق بـ AIGC ، يولي منظم الخصوصية الفرنسي اهتمامًا خاصًا لممارسة بعض نماذج الذكاء الاصطناعي التي تجمع البيانات من الإنترنت وبناء مجموعات البيانات لتدريب النماذج اللغوية الكبيرة.
الأهم هو قانون تنظيم الذكاء الاصطناعي للاتحاد الأوروبي (قانون الاتحاد الأوروبي للذكاء الاصطناعي) ، والذي هو حاليًا في مرحلته النهائية. من المرجح أن يصبح مشروع القانون نموذجًا للحوكمة العالمية للذكاء الاصطناعي.
03
** المنصات والمستخدمين والإشراف ، شكلت القوى الثلاث اتجاه تطويق ، وتعهدت بوضع قواعد لـ AIGC في أقرب وقت ممكن ، والبدء من نقطة البداية للتدريب على نموذج واسع النطاق. **
من ناحية أخرى ، ينفد الوقت وتتطور AIGC بسرعة كبيرة.
نحن لا نعرف إلى من يشير ماسك بعبارة "الشركات الناشئة في مجال الذكاء الاصطناعي ذات القيمة العالية السخيفة". ولكن بمجرد ظهور هذه الكلمات ، كان هناك بالفعل العديد من الضربات ، ففي نهاية المطاف ، هناك موجات من التمويل في مجال AIGC ، وكلها أموال ساخنة.
بين الشركات الناشئة ، تقدر قيمة OpenAI بحوالي 30 مليار دولار أمريكي ، بمجموع تمويل إجمالي قدره 11.3 مليار دولار أمريكي ، مما يجعلها الأغنى في AIGC ؛ تليها أنثروبيك ، ثاني أغنى الشركات ، بتقييم يزيد عن 4 مليارات دولار أمريكي. و Inflection ، التي صدمت وادي السيليكون بتمويل بقيمة 1.3 مليار دولار قبل أيام قليلة فقط ، تقدر قيمتها بنحو 4 مليارات دولار ، وقد تم تأسيسها منذ أكثر من عام فقط.
ربما لم يأتِ الكبار بعد. تستخدم Inflection نموذجها اللغوي الكبير ، وحصلت هذه المرة على 1.3 مليار دولار أمريكي وأعلنت أنها ستصنع 22000 شريحة Nvidia H100 لبناء أكبر مجموعة ذكاء اصطناعي في العالم. مع هذه القوة الحاسوبية واسعة النطاق ، لا بد أن تكون كمية المعلمات المستهدفة ومجموعات البيانات مذهلة.
** من ناحية أخرى ، وُلد ChatGPT من العدم ، وليس من السهل "الإصلاح" عندما يكشف عن المشاكل. ** الأجيال العديدة لنماذج اللغات الكبيرة من OpenAI ، ومجموعة بيانات GPT-2 تحتوي على 40 جيجابايت من النص ، بينما يحتوي GPT-3 (أي النموذج المستخدم عند إصدار ChatGPT) على 570 جيجابايت من بيانات التدريب. أما بالنسبة لـ GPT-4 التي تم إصدارها هذا العام ، حجم مجموعة البيانات في الأساس لم يتم الكشف عنها.
لم يتم توثيق كميات هائلة من البيانات بشكل صحيح منذ البداية. قالت Nicia Sambaswan ، عالمة الأبحاث السابقة في Google ، في المقابلات إن شركات التكنولوجيا لا تتابع كيفية جمع بيانات التدريب على الذكاء الاصطناعي أو التعليق عليها ، أو حتى ما هو موجود في مجموعة البيانات.
يشبه ChatGPT المكتمل الصندوق الأسود ، وهو صندوق أسود مبني في غرفة سرية. الآن يجب أن يكون شفافًا ومحميًا للخصوصية ، مثل سرد البيانات التي يتم الزحف إليها ، وشرح كيفية استخدامها أثناء الاستخدام ، و حذفه بناءً على طلب المستخدمين ، فجزء معين من البيانات هو في الواقع صعب للغاية.
متصفحو الإنترنت والمنظمون يعضون OpenAI ، هناك سبب آخر لا يمكن تجاهله - في السنوات التي تطورت فيها وسائل التواصل الاجتماعي ونمت ، كان الوعي بحماية بيانات الشبكة الشخصية لا يزال في مهده ، وعندما حان وقت المنافسة ، تم العثور عليه أنه قد فاته كثيرًا.
عندما جلس زوكربيرج لأول مرة في جلسة الاستماع في الكونجرس في عام 2018 ، تم إطلاق منصته للتواصل الاجتماعي Facebook لمدة 14 عامًا. في ذلك الوقت ، وقع Facebook في "فضيحة كامبريدج" ، وقال كبير مسؤولي التكنولوجيا في الشركة إن 87 مليون مستخدم قد تأثروا. لقد كان أيضًا خطأً كبيرًا ناجمًا عن تجريف البيانات.
عندما جلس ألتمان في جلسة استماع للكونجرس الأمريكي في مايو من هذا العام ، أعرب أعضاء الكونجرس مرارًا عن أسفهم لعدم تحركهم في عصر وسائل التواصل الاجتماعي. **
لا يزال يجري تدريب النماذج الكبيرة واحدة تلو الأخرى ، ولا يزال التقاط البيانات خيطًا. فقط من خلال استيعابها يمكننا أن نأمل في توضيح ارتباك AIGC.
** المواد المرجعية: **
سينا تكنولوجي: "مسك ومايكروسوفت على العارضة؟ تويتر يتهم مايكروسوفت باستخدام بياناتها بشكل غير قانوني »
مبرمج دارك هورس: "هؤلاء المبرمجون رفعوا دعوى ضد جيثب!" طلب تعويض قدره 64.9 مليار "
Jiemian News: "تم إصدار مشروع قانون الاتحاد الأوروبي للذكاء الاصطناعي ، كيف يمكن لشركة OpenAI والشركات الأخرى أن تسجل ، وما هي النزاعات الأساسية؟" "
Tencent Technology: "التعطش للبيانات يضر OpenAI؟ تتهمها دول عديدة بانتهاك قوانين حماية البيانات
Netease Technology: "يتم استئناف ChatGPT عبر الإنترنت في إيطاليا ولكن المشاكل التنظيمية لـ OpenAI بدأت للتو"