يعتقد إريك غولدمان ، الأستاذ في كلية الحقوق بجامعة سانتا كلارا في الولايات المتحدة ، أن موجة التقاضي قد بدأت للتو ، وأن "الموجتين الثانية والثالثة" قادمة ، اللتان ستحددان مستقبل الذكاء الاصطناعي.
تجادل شركات الذكاء الاصطناعي بأنه من المعقول استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي - إشارة إلى مفهوم "الاستخدام التحويلي" في قانون حقوق الطبع والنشر الأمريكي ، حيث يتم تغيير المواد بطريقة "تحويلية" ستنشئ استثناءً.
* مصدر الصورة: تم إنشاؤه بواسطة أداة Unbounded AI *
كانت نقابة كتاب السيناريو الأمريكيين في إضراب منذ أكثر من 70 يومًا ، للمطالبة بزيادة الأجور ، وزيادة حصة منصات الوسائط المتدفقة ، والإشراف على الذكاء الاصطناعي.
تندلع "انتفاضة البيانات" في أمريكا ، مع هوليوود والفنانين والكتاب وشركات التواصل الاجتماعي والمؤسسات الإخبارية من بين المتمردين.
كل اللوم يشير إلى أدوات الذكاء الاصطناعي التوليدية مثل ChatGPT و Stable Diffusion ، والتي يتم اتهامها بالاستخدام غير القانوني لعمل منشئي المحتوى لتدريب نماذج لغة كبيرة دون إذن أو تعويض.
في قلب "انتفاضة البيانات" هناك اعتراف جديد بأن المعلومات عبر الإنترنت - القصص والأعمال الفنية والمقالات الإخبارية ومنشورات الويب والصور - يمكن أن يكون لها قيمة كبيرة غير مستغلة. ممارسة كشط المحتوى العام على الإنترنت لها تاريخ طويل ، ومعظم الشركات والمنظمات غير الربحية التي تفعل ذلك تفصح عنه علنًا. ولكن قبل إصدار ChatGPT ، لم يكن مالكو البيانات يعرفون الكثير عنها ، ولم يروا أنها مشكلة خطيرة بشكل خاص. الآن ، تغير ذلك حيث تعلم الجمهور المزيد عن أساسيات تدريب الذكاء الاصطناعي.
قال براندون دودرستادت ، المؤسس والرئيس التنفيذي لشركة Nomic ، في مقابلة مع وسائل الإعلام: "هذه إعادة تشكيل أساسية لقيمة البيانات". يمكنك الوصول إلى البيانات وتشغيل الإعلانات للحصول على قيمة منها. الآن ، يعتقد الناس أن عليهم ذلك حماية بياناتهم ".
** المد بعد الموجة **
في الأشهر الأخيرة ، اتخذت شركات التواصل الاجتماعي مثل Reddit و Twitter ، والمؤسسات الإخبارية مثل The New York Times و NBC ، ومؤلف الخيال العلمي بول تريمبلاي والممثلة سارة سيلفرمان (سارة سيلفرمان) وآخرين إجراءات لمعارضة الجمع غير المصرح به لأعمالهم وبياناتهم. بواسطة الذكاء الاصطناعي. وقد أطلقت وسائل الإعلام الأمريكية على سلسلة التحركات هذه اسم "ثورة البيانات".
في الأسبوع الماضي ، رفع سيلفرمان دعوى قضائية ضد OpenAI و Meta ، متهمًا إياهم باستخدام نسخ مقرصنة من كتابه في بيانات التدريب الخاصة بهم لأن برامج الدردشة الخاصة بالشركات يمكنها تلخيص المحتوى بدقة من كتابه. بالإضافة إلى ذلك ، وقع أكثر من 5000 مؤلف ، بما في ذلك Jodi Picoult و Margaret Atwood و Viet Thanh Nguyen ، على عريضة تطالب شركات التكنولوجيا بطلب الإذن منها ومنحهم الإسناد والتعويض عند استخدام كتبهم كبيانات تدريبية.
لحماية أعمالهم ، لجأ الكتاب والفنانين إلى أشكال مختلفة من الاحتجاج. يختار البعض قفل الأعمال ومنع الذكاء الاصطناعي من الحصول عليها ؛ يختار البعض مقاطعة مواقع الويب التي تنشر محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي ؛ يختار البعض كتابة محتوى تخريبي للتدخل في تعلم الذكاء الاصطناعي.
في 13 يوليو ، أعلنت نقابة SAG-AFTRA ، وهي إحدى النقابات الثلاث الكبرى في هوليوود التي يبلغ عدد أعضائها 160 ألف عضو ، إضرابًا ، وقبل ذلك ، كانت نقابة كتاب السيناريو الأمريكيين في إضراب لأكثر من 70 يومًا. وفقًا لصحيفة نيويورك تايمز ، أدى الإضراب العام إلى توقف صناعة السينما والتلفزيون الأمريكية البالغة 134 مليار دولار ، وهو مضمون عدم استبدال الممثلين بالذكاء الاصطناعي والوجوه والأصوات التي تم إنشاؤها بواسطة الكمبيوتر.
في غضون ذلك ، تقاوم بعض المؤسسات الإخبارية الذكاء الاصطناعي. في يونيو ، في مذكرة داخلية حول استخدام الذكاء الاصطناعي التوليدي ، قالت صحيفة نيويورك تايمز: "يجب على شركات الذكاء الاصطناعي احترام ملكيتنا الفكرية." وفي بيان ، قال الناشرون عبر الإنترنت مثل نيويورك تايمز وواشنطن بوست إن استخدام حقوق النشر المقالات الإخبارية مثل بيانات التدريب على الذكاء الاصطناعي لها مخاطر محتملة وقضايا قانونية ، ودعوا شركات الذكاء الاصطناعي إلى احترام معرفة الناشرين حقوق الملكية والعمل الإبداعي.
كما اتخذت شركات التواصل الاجتماعي موقفا. في أبريل ، قال موقع الأخبار الاجتماعية Reddit إنه يريد فرض رسوم على أطراف ثالثة للوصول إلى واجهة برمجة التطبيقات (API). قال الرئيس التنفيذي لشركة Reddit ، ستيف هوفمان ، إن شركته "لا تحتاج إلى منح كل القيمة مجانًا لبعض أكبر الشركات في العالم." في يوليو ، صرح مالك موقع Twitter Elon Musk (Elon Musk) أيضًا أن بعض الشركات والمؤسسات " بشكل غير قانوني "الحصول على قدر كبير من بيانات Twitter. ردًا على" التلاعب الشديد بالبيانات والتلاعب بالنظام "، قرر Twitter الحد من عدد التغريدات التي يمكن للحسابات الفردية عرضها.
يرغب مؤسس Reddit والرئيس التنفيذي Steve Hoffman في فرض رسوم على أطراف ثالثة للوصول إلى واجهة برمجة التطبيقات (API) ، مما أثار غضبًا هائلاً بين مستخدمي الإنترنت.
تتضمن "انتفاضة البيانات" هذه أيضًا "موجة دعاوى قضائية" ، مع مقاضاة بعض شركات الذكاء الاصطناعي عدة مرات بسبب مخاوف تتعلق بخصوصية البيانات. في نوفمبر ، رفعت مجموعة من المبرمجين دعوى قضائية جماعية ضد Microsoft و OpenAI ، زاعمين أن الشركات انتهكت حقوق النشر الخاصة بهم باستخدام التعليمات البرمجية الخاصة بهم لتدريب مساعدي برمجة الذكاء الاصطناعي. في يونيو من هذا العام ، رفعت شركة Clarkson للمحاماة ومقرها لوس أنجلوس دعوى قضائية جماعية من 151 صفحة ضد OpenAI و Microsoft ، مشيرة إلى كيفية قيام OpenAI بجمع البيانات من القاصرين ، قائلة إن تجريف الويب ينتهك قانون حقوق النشر ويشكل "سرقة". وقد رفعت الشركة منذ ذلك الحين دعوى قضائية مماثلة ضد Google.
قال الأستاذ في كلية الحقوق بجامعة سانتا كلارا إريك جولدمان (إريك جولدمان) في مقابلة مع وسائل الإعلام إن حجج هذه الدعوى واسعة للغاية ومن غير المرجح أن تقبلها المحكمة. لكنه يجادل بأن موجة الدعاوى القضائية قد بدأت للتو ، مع ظهور "الموجة الثانية والثالثة" التي ستحدد مستقبل الذكاء الاصطناعي.
** الخلاف القانوني **
يتم تدريب كل من ChatGPT و Dall-E من OpenAI و Google's Bard و Stability AI's Stable Diffusion وأنظمة الذكاء الاصطناعي التوليدية الأخرى على أساس المقالات الإخبارية الضخمة والكتب والصور ومقاطع الفيديو ومنشورات المدونات المأخوذة من الإنترنت ، وكثير منها عامة محمية بموجب حقوق النشر.
في مارس من هذا العام ، أصدرت OpenAI تقريرًا تحليليًا لنموذج اللغة الرئيسي للمؤسسة ، يوضح أن الجزء النصي من بيانات التدريب يستخدم بيانات من مواقع إخبارية وويكيبيديا وقاعدة بيانات الكتب المقرصنة (LibGen) ، والتي تم إغلاقها حاليًا. وزارة العدل الأمريكية.
في 13 يوليو ، أرسلت لجنة التجارة الفيدرالية الأمريكية (FTC) مستندًا من 20 صفحة إلى OpenAI ، تطلب من OpenAI تقديم سجلات حول إدارة المخاطر وأمن البيانات ومراجعة المعلومات لنماذج الذكاء الاصطناعي الخاصة بها للتحقيق فيما إذا كانت تنتهك لوائح حقوق المستهلك. حقوق.
في 12 يوليو ، عقدت اللجنة الفرعية لمجلس الشيوخ الأمريكي جلسة استماع حول قضايا الذكاء الاصطناعي والملكية الفكرية وحقوق النشر ، وأدى الشهود الذين حضروا القسم اليمين في المحكمة. سمعت السمع من صناعة الموسيقى ، صانع Photoshop Adobe ، شركة الذكاء الاصطناعي Stability AI والرسامة Karla Ortiz.
ولكن في المظاهر العامة واستجابة للدعاوى القضائية ، جادلت شركات الذكاء الاصطناعي بأنه من المعقول استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي - إشارة إلى مفهوم "الاستخدام التحويلي" في قانون حقوق الطبع والنشر بالولايات المتحدة ، والذي يحدث إذا تم نشر مادة في A طريقة "تحويلية" في التغيير تخلق استثناءً.
قال كينت ووكر ، رئيس الشؤون العالمية في Google ، في مقابلة: "إن نموذج الذكاء الاصطناعي يتعلم أساسًا من جميع المعلومات. إنه مثل طالب يقرأ في مكتبة ثم يتعلم كيفية الكتابة والقراءة". وفي نفس الوقت الوقت ، عليك التأكد من أنك لا تنسخ عمل شخص آخر أو تفعل شيئًا ينتهك حقوق الطبع والنشر. "
قالت حليمة ديلين برادو ، المستشارة العامة لشركة Google ، لوسائل الإعلام: "لقد كان واضحًا للجميع منذ سنوات أننا نستخدم بيانات من مصادر عامة - مثل النشر على شبكة الإنترنت المفتوحة والبيانات العامة. المعلومات المجمعة لتدريب نماذج الذكاء الاصطناعي وراء الخدمات مثل Google Translate. "وأشارت إلى أن" القانون الأمريكي يدعم إنشاء استخدامات جديدة ومفيدة للمعلومات العامة ، ونتطلع إلى دحض هذه الادعاءات التي لا أساس لها ".
قال أندريس ساويكي ، الأستاذ في جامعة ميامي الذي يدرس قانون الملكية الفكرية ، في مقابلة أن هناك بعض السوابق التي يمكن أن تفضل شركات التكنولوجيا ، مثل حكم محكمة الاستئناف الأمريكية عام 1992 الذي سمح للشركات بمقاضاة شركات أخرى بسبب فكريها. حقوق الملكية: تم إجراء هندسة عكسية لرموز البرامج لتصميم المنتجات المنافسة. لكن يقول الكثيرون أنه من غير العدل أن تستخدم الشركات الكبيرة عمل المبدعين لكسب أدوات جديدة لكسب المال. قال: "من الصعب حقًا الإجابة على السؤال المتعلق بالذكاء الاصطناعي التوليدي".
قالت جيسيكا دي ليتمان ساويكي ، أستاذة قانون حقوق النشر بجامعة ميامي ، إن مبدأ الاستخدام العادل (الاستخدام العادل) هو دفاع قوي لشركات الذكاء الاصطناعي بسبب الحجم الكبير لنماذج الذكاء الاصطناعي. لا يشبه بشكل لا لبس فيه عمل إنسان معين. لكنها تجادل بأنه إذا كان بإمكان المبدعين الذين يقاضون شركات الذكاء الاصطناعي إظهار أمثلة كافية لمخرجات الذكاء الاصطناعي التي تشبه عملهم إلى حد كبير ، فسيكون لديهم سبب وجيه للاعتقاد بانتهاك حقوق النشر.
** شركات الذكاء الاصطناعي تبدأ في الاستجابة **
قال Sauwicki إنه يمكن لشركات الذكاء الاصطناعي تجنب ذلك عن طريق تثبيت المرشحات في منتجاتها للتأكد من أنها لا تولد أي شيء مشابه جدًا للعمل الحالي. على سبيل المثال ، يستخدم موقع الفيديو YouTube بالفعل تقنية لاكتشاف الأعمال المحمية بحقوق الطبع والنشر التي يتم تحميلها على موقعه وإزالتها تلقائيًا. من الناحية النظرية ، يمكن لشركات الذكاء الاصطناعي أيضًا بناء خوارزميات تجد مخرجات تشبه إلى حد كبير الأعمال الفنية أو الموسيقى أو الكتابة الموجودة.
قد لا تؤدي "انتفاضة البيانات" هذه إلى إحداث موجات على المدى الطويل. عمالقة التكنولوجيا مثل Google و Microsoft لديهم بالفعل كميات هائلة من البيانات الخاصة ولديهم القدرة على الحصول على المزيد. لكن الشركات الناشئة والمنظمات غير الربحية التي تتطلع إلى مواجهة لاعبين أكبر قد لا تحصل على بيانات كافية لتدريب أنظمتها حيث يصبح الحصول على المحتوى أكثر صعوبة.
في أوائل شهر يوليو فقط ، حذر ستيوارت راسل ، أستاذ علوم الكمبيوتر بجامعة كاليفورنيا ، بيركلي ومؤلف كتاب "الذكاء الاصطناعي - نهج حديث" ، من أن الروبوتات التي تحركها الذكاء الاصطناعي مثل ChatGPT قد "تنفد قريبًا من الكون". "text" ، وتقنيات تدريب الروبوتات من خلال جمع كميات كبيرة من النصوص "بدأت تواجه صعوبات".
كما أن بعض الشركات تركب الموجة بسلوك تعاوني. في بيان ، قالت OpenAI: "نحن نحترم حقوق المبدعين والمؤلفين ونتطلع إلى مواصلة العمل معهم لحماية مصالحهم". في 14 يوليو ، وافقت وكالة Associated Press على ترخيص أرشيفها للقصص الإخبارية من عام 1985 إلى OpenAI ، بينما تستخدم أيضًا تقنيات ومنتجات OpenAI.
وقالت جوجل أيضًا في بيان إنها شاركت في مفاوضات حول كيفية إدارة الناشرين لمحتوياتهم في المستقبل. وقالت الشركة: "نعتقد أنه يمكن للجميع الاستفادة من نظام محتوى حيوي".
قالت مارجريت ميتشل (مارجريت ميتشل) ، كبيرة علماء الأخلاقيات في شركة الذكاء الاصطناعي HuggingFace ، في مقابلة مع وسائل الإعلام ، "إن نظام جمع البيانات بأكمله بحاجة إلى التغيير ، وللأسف يجب تحقيق ذلك من خلال التقاضي ، والذي غالبًا ما يكون إنها طريقة لدفع شركات التكنولوجيا للتغيير ". وقالت إنها لن تتفاجأ إذا سحبت شركة OpenAI أحد منتجاتها بالكامل بحلول نهاية العام بسبب دعاوى قضائية أو لوائح جديدة.
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
اندلعت "انتفاضة البيانات" في الولايات المتحدة: تمرد أدب هوليوود والصحافة ووسائل التواصل الاجتماعي ضد الذكاء الاصطناعي
المؤلف: المتدرب تشن Xiaorui ؛ المراسل فانغ شياو
المصدر: الورقة
يعتقد إريك غولدمان ، الأستاذ في كلية الحقوق بجامعة سانتا كلارا في الولايات المتحدة ، أن موجة التقاضي قد بدأت للتو ، وأن "الموجتين الثانية والثالثة" قادمة ، اللتان ستحددان مستقبل الذكاء الاصطناعي.
تجادل شركات الذكاء الاصطناعي بأنه من المعقول استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي - إشارة إلى مفهوم "الاستخدام التحويلي" في قانون حقوق الطبع والنشر الأمريكي ، حيث يتم تغيير المواد بطريقة "تحويلية" ستنشئ استثناءً.
كانت نقابة كتاب السيناريو الأمريكيين في إضراب منذ أكثر من 70 يومًا ، للمطالبة بزيادة الأجور ، وزيادة حصة منصات الوسائط المتدفقة ، والإشراف على الذكاء الاصطناعي.
تندلع "انتفاضة البيانات" في أمريكا ، مع هوليوود والفنانين والكتاب وشركات التواصل الاجتماعي والمؤسسات الإخبارية من بين المتمردين.
كل اللوم يشير إلى أدوات الذكاء الاصطناعي التوليدية مثل ChatGPT و Stable Diffusion ، والتي يتم اتهامها بالاستخدام غير القانوني لعمل منشئي المحتوى لتدريب نماذج لغة كبيرة دون إذن أو تعويض.
في قلب "انتفاضة البيانات" هناك اعتراف جديد بأن المعلومات عبر الإنترنت - القصص والأعمال الفنية والمقالات الإخبارية ومنشورات الويب والصور - يمكن أن يكون لها قيمة كبيرة غير مستغلة. ممارسة كشط المحتوى العام على الإنترنت لها تاريخ طويل ، ومعظم الشركات والمنظمات غير الربحية التي تفعل ذلك تفصح عنه علنًا. ولكن قبل إصدار ChatGPT ، لم يكن مالكو البيانات يعرفون الكثير عنها ، ولم يروا أنها مشكلة خطيرة بشكل خاص. الآن ، تغير ذلك حيث تعلم الجمهور المزيد عن أساسيات تدريب الذكاء الاصطناعي.
قال براندون دودرستادت ، المؤسس والرئيس التنفيذي لشركة Nomic ، في مقابلة مع وسائل الإعلام: "هذه إعادة تشكيل أساسية لقيمة البيانات". يمكنك الوصول إلى البيانات وتشغيل الإعلانات للحصول على قيمة منها. الآن ، يعتقد الناس أن عليهم ذلك حماية بياناتهم ".
** المد بعد الموجة **
في الأشهر الأخيرة ، اتخذت شركات التواصل الاجتماعي مثل Reddit و Twitter ، والمؤسسات الإخبارية مثل The New York Times و NBC ، ومؤلف الخيال العلمي بول تريمبلاي والممثلة سارة سيلفرمان (سارة سيلفرمان) وآخرين إجراءات لمعارضة الجمع غير المصرح به لأعمالهم وبياناتهم. بواسطة الذكاء الاصطناعي. وقد أطلقت وسائل الإعلام الأمريكية على سلسلة التحركات هذه اسم "ثورة البيانات".
في الأسبوع الماضي ، رفع سيلفرمان دعوى قضائية ضد OpenAI و Meta ، متهمًا إياهم باستخدام نسخ مقرصنة من كتابه في بيانات التدريب الخاصة بهم لأن برامج الدردشة الخاصة بالشركات يمكنها تلخيص المحتوى بدقة من كتابه. بالإضافة إلى ذلك ، وقع أكثر من 5000 مؤلف ، بما في ذلك Jodi Picoult و Margaret Atwood و Viet Thanh Nguyen ، على عريضة تطالب شركات التكنولوجيا بطلب الإذن منها ومنحهم الإسناد والتعويض عند استخدام كتبهم كبيانات تدريبية.
لحماية أعمالهم ، لجأ الكتاب والفنانين إلى أشكال مختلفة من الاحتجاج. يختار البعض قفل الأعمال ومنع الذكاء الاصطناعي من الحصول عليها ؛ يختار البعض مقاطعة مواقع الويب التي تنشر محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي ؛ يختار البعض كتابة محتوى تخريبي للتدخل في تعلم الذكاء الاصطناعي.
في 13 يوليو ، أعلنت نقابة SAG-AFTRA ، وهي إحدى النقابات الثلاث الكبرى في هوليوود التي يبلغ عدد أعضائها 160 ألف عضو ، إضرابًا ، وقبل ذلك ، كانت نقابة كتاب السيناريو الأمريكيين في إضراب لأكثر من 70 يومًا. وفقًا لصحيفة نيويورك تايمز ، أدى الإضراب العام إلى توقف صناعة السينما والتلفزيون الأمريكية البالغة 134 مليار دولار ، وهو مضمون عدم استبدال الممثلين بالذكاء الاصطناعي والوجوه والأصوات التي تم إنشاؤها بواسطة الكمبيوتر.
في غضون ذلك ، تقاوم بعض المؤسسات الإخبارية الذكاء الاصطناعي. في يونيو ، في مذكرة داخلية حول استخدام الذكاء الاصطناعي التوليدي ، قالت صحيفة نيويورك تايمز: "يجب على شركات الذكاء الاصطناعي احترام ملكيتنا الفكرية." وفي بيان ، قال الناشرون عبر الإنترنت مثل نيويورك تايمز وواشنطن بوست إن استخدام حقوق النشر المقالات الإخبارية مثل بيانات التدريب على الذكاء الاصطناعي لها مخاطر محتملة وقضايا قانونية ، ودعوا شركات الذكاء الاصطناعي إلى احترام معرفة الناشرين حقوق الملكية والعمل الإبداعي.
كما اتخذت شركات التواصل الاجتماعي موقفا. في أبريل ، قال موقع الأخبار الاجتماعية Reddit إنه يريد فرض رسوم على أطراف ثالثة للوصول إلى واجهة برمجة التطبيقات (API). قال الرئيس التنفيذي لشركة Reddit ، ستيف هوفمان ، إن شركته "لا تحتاج إلى منح كل القيمة مجانًا لبعض أكبر الشركات في العالم." في يوليو ، صرح مالك موقع Twitter Elon Musk (Elon Musk) أيضًا أن بعض الشركات والمؤسسات " بشكل غير قانوني "الحصول على قدر كبير من بيانات Twitter. ردًا على" التلاعب الشديد بالبيانات والتلاعب بالنظام "، قرر Twitter الحد من عدد التغريدات التي يمكن للحسابات الفردية عرضها.
تتضمن "انتفاضة البيانات" هذه أيضًا "موجة دعاوى قضائية" ، مع مقاضاة بعض شركات الذكاء الاصطناعي عدة مرات بسبب مخاوف تتعلق بخصوصية البيانات. في نوفمبر ، رفعت مجموعة من المبرمجين دعوى قضائية جماعية ضد Microsoft و OpenAI ، زاعمين أن الشركات انتهكت حقوق النشر الخاصة بهم باستخدام التعليمات البرمجية الخاصة بهم لتدريب مساعدي برمجة الذكاء الاصطناعي. في يونيو من هذا العام ، رفعت شركة Clarkson للمحاماة ومقرها لوس أنجلوس دعوى قضائية جماعية من 151 صفحة ضد OpenAI و Microsoft ، مشيرة إلى كيفية قيام OpenAI بجمع البيانات من القاصرين ، قائلة إن تجريف الويب ينتهك قانون حقوق النشر ويشكل "سرقة". وقد رفعت الشركة منذ ذلك الحين دعوى قضائية مماثلة ضد Google.
قال الأستاذ في كلية الحقوق بجامعة سانتا كلارا إريك جولدمان (إريك جولدمان) في مقابلة مع وسائل الإعلام إن حجج هذه الدعوى واسعة للغاية ومن غير المرجح أن تقبلها المحكمة. لكنه يجادل بأن موجة الدعاوى القضائية قد بدأت للتو ، مع ظهور "الموجة الثانية والثالثة" التي ستحدد مستقبل الذكاء الاصطناعي.
** الخلاف القانوني **
يتم تدريب كل من ChatGPT و Dall-E من OpenAI و Google's Bard و Stability AI's Stable Diffusion وأنظمة الذكاء الاصطناعي التوليدية الأخرى على أساس المقالات الإخبارية الضخمة والكتب والصور ومقاطع الفيديو ومنشورات المدونات المأخوذة من الإنترنت ، وكثير منها عامة محمية بموجب حقوق النشر.
في مارس من هذا العام ، أصدرت OpenAI تقريرًا تحليليًا لنموذج اللغة الرئيسي للمؤسسة ، يوضح أن الجزء النصي من بيانات التدريب يستخدم بيانات من مواقع إخبارية وويكيبيديا وقاعدة بيانات الكتب المقرصنة (LibGen) ، والتي تم إغلاقها حاليًا. وزارة العدل الأمريكية.
في 13 يوليو ، أرسلت لجنة التجارة الفيدرالية الأمريكية (FTC) مستندًا من 20 صفحة إلى OpenAI ، تطلب من OpenAI تقديم سجلات حول إدارة المخاطر وأمن البيانات ومراجعة المعلومات لنماذج الذكاء الاصطناعي الخاصة بها للتحقيق فيما إذا كانت تنتهك لوائح حقوق المستهلك. حقوق.
ولكن في المظاهر العامة واستجابة للدعاوى القضائية ، جادلت شركات الذكاء الاصطناعي بأنه من المعقول استخدام الأعمال المحمية بحقوق الطبع والنشر لتدريب الذكاء الاصطناعي - إشارة إلى مفهوم "الاستخدام التحويلي" في قانون حقوق الطبع والنشر بالولايات المتحدة ، والذي يحدث إذا تم نشر مادة في A طريقة "تحويلية" في التغيير تخلق استثناءً.
قال كينت ووكر ، رئيس الشؤون العالمية في Google ، في مقابلة: "إن نموذج الذكاء الاصطناعي يتعلم أساسًا من جميع المعلومات. إنه مثل طالب يقرأ في مكتبة ثم يتعلم كيفية الكتابة والقراءة". وفي نفس الوقت الوقت ، عليك التأكد من أنك لا تنسخ عمل شخص آخر أو تفعل شيئًا ينتهك حقوق الطبع والنشر. "
قالت حليمة ديلين برادو ، المستشارة العامة لشركة Google ، لوسائل الإعلام: "لقد كان واضحًا للجميع منذ سنوات أننا نستخدم بيانات من مصادر عامة - مثل النشر على شبكة الإنترنت المفتوحة والبيانات العامة. المعلومات المجمعة لتدريب نماذج الذكاء الاصطناعي وراء الخدمات مثل Google Translate. "وأشارت إلى أن" القانون الأمريكي يدعم إنشاء استخدامات جديدة ومفيدة للمعلومات العامة ، ونتطلع إلى دحض هذه الادعاءات التي لا أساس لها ".
قال أندريس ساويكي ، الأستاذ في جامعة ميامي الذي يدرس قانون الملكية الفكرية ، في مقابلة أن هناك بعض السوابق التي يمكن أن تفضل شركات التكنولوجيا ، مثل حكم محكمة الاستئناف الأمريكية عام 1992 الذي سمح للشركات بمقاضاة شركات أخرى بسبب فكريها. حقوق الملكية: تم إجراء هندسة عكسية لرموز البرامج لتصميم المنتجات المنافسة. لكن يقول الكثيرون أنه من غير العدل أن تستخدم الشركات الكبيرة عمل المبدعين لكسب أدوات جديدة لكسب المال. قال: "من الصعب حقًا الإجابة على السؤال المتعلق بالذكاء الاصطناعي التوليدي".
قالت جيسيكا دي ليتمان ساويكي ، أستاذة قانون حقوق النشر بجامعة ميامي ، إن مبدأ الاستخدام العادل (الاستخدام العادل) هو دفاع قوي لشركات الذكاء الاصطناعي بسبب الحجم الكبير لنماذج الذكاء الاصطناعي. لا يشبه بشكل لا لبس فيه عمل إنسان معين. لكنها تجادل بأنه إذا كان بإمكان المبدعين الذين يقاضون شركات الذكاء الاصطناعي إظهار أمثلة كافية لمخرجات الذكاء الاصطناعي التي تشبه عملهم إلى حد كبير ، فسيكون لديهم سبب وجيه للاعتقاد بانتهاك حقوق النشر.
** شركات الذكاء الاصطناعي تبدأ في الاستجابة **
قال Sauwicki إنه يمكن لشركات الذكاء الاصطناعي تجنب ذلك عن طريق تثبيت المرشحات في منتجاتها للتأكد من أنها لا تولد أي شيء مشابه جدًا للعمل الحالي. على سبيل المثال ، يستخدم موقع الفيديو YouTube بالفعل تقنية لاكتشاف الأعمال المحمية بحقوق الطبع والنشر التي يتم تحميلها على موقعه وإزالتها تلقائيًا. من الناحية النظرية ، يمكن لشركات الذكاء الاصطناعي أيضًا بناء خوارزميات تجد مخرجات تشبه إلى حد كبير الأعمال الفنية أو الموسيقى أو الكتابة الموجودة.
قد لا تؤدي "انتفاضة البيانات" هذه إلى إحداث موجات على المدى الطويل. عمالقة التكنولوجيا مثل Google و Microsoft لديهم بالفعل كميات هائلة من البيانات الخاصة ولديهم القدرة على الحصول على المزيد. لكن الشركات الناشئة والمنظمات غير الربحية التي تتطلع إلى مواجهة لاعبين أكبر قد لا تحصل على بيانات كافية لتدريب أنظمتها حيث يصبح الحصول على المحتوى أكثر صعوبة.
في أوائل شهر يوليو فقط ، حذر ستيوارت راسل ، أستاذ علوم الكمبيوتر بجامعة كاليفورنيا ، بيركلي ومؤلف كتاب "الذكاء الاصطناعي - نهج حديث" ، من أن الروبوتات التي تحركها الذكاء الاصطناعي مثل ChatGPT قد "تنفد قريبًا من الكون". "text" ، وتقنيات تدريب الروبوتات من خلال جمع كميات كبيرة من النصوص "بدأت تواجه صعوبات".
كما أن بعض الشركات تركب الموجة بسلوك تعاوني. في بيان ، قالت OpenAI: "نحن نحترم حقوق المبدعين والمؤلفين ونتطلع إلى مواصلة العمل معهم لحماية مصالحهم". في 14 يوليو ، وافقت وكالة Associated Press على ترخيص أرشيفها للقصص الإخبارية من عام 1985 إلى OpenAI ، بينما تستخدم أيضًا تقنيات ومنتجات OpenAI.
وقالت جوجل أيضًا في بيان إنها شاركت في مفاوضات حول كيفية إدارة الناشرين لمحتوياتهم في المستقبل. وقالت الشركة: "نعتقد أنه يمكن للجميع الاستفادة من نظام محتوى حيوي".
قالت مارجريت ميتشل (مارجريت ميتشل) ، كبيرة علماء الأخلاقيات في شركة الذكاء الاصطناعي HuggingFace ، في مقابلة مع وسائل الإعلام ، "إن نظام جمع البيانات بأكمله بحاجة إلى التغيير ، وللأسف يجب تحقيق ذلك من خلال التقاضي ، والذي غالبًا ما يكون إنها طريقة لدفع شركات التكنولوجيا للتغيير ". وقالت إنها لن تتفاجأ إذا سحبت شركة OpenAI أحد منتجاتها بالكامل بحلول نهاية العام بسبب دعاوى قضائية أو لوائح جديدة.