خلف "القضية الأولى لسرقة بيانات النماذج الضخمة"

** نص: Zhu Ling **

** المصدر: ** Financial Association

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI‌

عندما واجهت شركة OpenAI اتهام "سارق البيانات" وشاركت بعمق في دعاوى قضائية جماعية وفردية متعددة ، كانت "القضية الأولى لسرقة بيانات نموذج كبير للذكاء الاصطناعي" في الصين على وشك الانهيار ، ولكن في النهاية حل الطرفان سوء الفهم هل هناك سبب آخر وراء "سوء التفاهم"؟ هل لديك سر؟

في الآونة الأخيرة ، أصدرت Bishen Composition ، منتج الكتابة بمساعدة الذكاء الاصطناعي الذي استثمرته Century Tianhong ، بيانًا قالت فيه إنها قررت في 4 أغسطس التوقف عن التفكير في التعلم وبدء دعوى قضائية ضد حوادث استرجاع البيانات ذات الصلة. **

صرح Bishen Composition أنه بعد التحقيق المتعمق والتواصل الصريح مع Xueersi ، توصل الطرفان إلى اتفاق بشأن الشروط المتنازع عليها ، ** أزال الطرفان سوء التفاهم ** ، وسيواصلان تعميق التعاون لتعزيز الاستكشاف بشكل مشترك لتقنية الذكاء الاصطناعي في مجال التعليم.

وسأل مراسل من صحيفة "كيتشوانغبان" بيشن تركيبة عن أسباب التسوية وسبب سوء التفاهم ، فقال المسؤول المختص: "تم شرح الحادث بوضوح في البيان ، ولن يتم تقديم أي ردود أخرى".

** جولة ونصف من "صراخ الهواء" **

بالعودة إلى ما قبل شهرين ، أصدرت Penshen Composition بيانًا بعد ظهر يوم 13 يونيو ، متهمًا شريكها Xueersi بـ "سرقة" بيانات جرد التكوين لتدريب منتج نموذجي واسع النطاق للذكاء الاصطناعي القادم. ذكرت Bishen Composition أنها ستحل النزاع من خلال الإجراءات القضائية ، حيث تطلب من Xueersi دفع 1 يوان كتعويض ، وتقديم اعتذار عام ، وحذف البيانات التي تم الزحف إليها ، وتسميتها "أول حالة لسرقة بيانات نموذج كبير لمنظمة العفو الدولية" في الصين. **

في تلك الليلة ، ردت ** Xueersi بسرعة بأن استخدام بيانات تكوين Bishen يقع في نطاق التعاون العادي المتفق عليه في العقد بين الطرفين ، و ** كانت "التكهنات الذاتية" لـ Bishen Composition "تتعارض بشكل خطير مع الحقائق".

في 14 حزيران (يونيو) ، استبعدت Penshen Composition أحجام المكالمات ولقطات من سجلات الخادم لدحض استجابة Xueersi ، في محاولة لإثبات أن Xueersi استخدمت تقنية "الزاحف" للوصول بشكل غير قانوني إلى 2.58 مليون بيانات وتخزينها مؤقتًا على خادم Penshen's Composition APP في غضون أيام قليلة ثانيًا ، إنه سلوك نموذجي "لالتقاط قواعد البيانات" ، والذي ينتهك بشكل خطير حقوق البيانات الخاصة بـ Bishen Composition.

بعد ذلك ، لم يصدر Xueersi ردًا علنيًا ، فقد اتصل مراسل "Kechuangban Daily" بشركة Xueersi الأم TAL لإجراء مقابلة ، لكن طاقم الأسلاك رفض نقل المراسل إلى القسم المعني.

في 20 يونيو ، قال شيجي تيانهونغ ، المساهم الثاني في شركة Beijing Yi Yi Liang Hua Technology Co.، Ltd. ، التي تنتمي إلى Pen God ، على المنصة التفاعلية أن الشركة تهتم أيضًا بتقدم الحادث. في وقت سابق ، بسبب ذكر Bishen Composition على المنصة التفاعلية ، ارتفع سعر سهم Century Tianhong بأكثر من 100 ٪ لمدة 10 أيام تداول متتالية منذ 24 أبريل.

** من أين تأتي 5 ملايين مادة التركيب **

في وقت مبكر من عام 2019 ، طرحت Blue Media Exchange على Song Jiawei ، مؤسس Penshen Composition ، سؤالًا: ** كيف يمكن حل مشكلة حقوق الطبع والنشر للكم الهائل من بيانات المحتوى الإعلامي المتراكمة في كواليس Penshen؟ **

قال سونغ جياوي بصراحة في ذلك الوقت إنه كان يتواصل ويتعاون مع بعض مالكي حقوق النشر. بالإضافة إلى ذلك ، يبذل فريق Pen God قصارى جهده لجمع مواد للأعمال العامة ، مثل القصائد والاقتباسات الشهيرة. ** توقع مؤلف هذا التقرير أن قضية حقوق النشر قد تكون مشكلة طويلة الأجل لـ Pen God في المستقبل. **

البيانات باعتبارها أحد العناصر الأساسية للذكاء الاصطناعي ، وفقًا لتكوين Penshen و Shiji Tianhong ، جمعت أكثر من 5 ملايين مادة تركيبية.

ذكرت Century Tianhong سابقًا على المنصة التفاعلية أن البيانات الضخمة لـ Penshen Composition تأتي من تراكمها الخاص ، وأن نموذج الخوارزمية تم تطويره وتدريبه ذاتيًا من قبل الشركة.

في 8 مايو ، أصدرت بورصة Shenzhen خطاب قلق إلى Shiji Tianhong ** ، الذي طلب فيه توضيح ما إذا كانت الشركة قد قدمت البيانات المطلوبة لتدريب نموذج الذكاء الاصطناعي "Pen Shen Composition" لضربة واحدة وسكتين ؛ إذا كان الأمر كذلك ، فيجب دمجها مع معلومات الشركة ذات الصلة.طريقة ومصدر الحصول على البيانات ، وما إلى ذلك ، وفقًا لـ "قانون أمان البيانات" واللوائح الأخرى ذات الصلة ، شرح شرعية الحصول على البيانات ذات الصلة ومعالجتها واستخدامها ؛ ما إذا كانت ملكية حقوق الملكية لأصول البيانات ذات الصلة واضحة ، وما إذا كانت هناك نزاعات محتملة ، وما إذا كانت هناك اتفاقيات وترتيبات منافع لأطراف أخرى.

رداً على رسالة القلق ، ذكرت Century Tianhong أنه تم التحقق من أن البيانات المطلوبة لتدريب نموذج الذكاء الاصطناعي "Pen Shen Composition" قد تراكمت كلها في سياق أعمالها الخاصة. حتى الآن ، لم تقدم الشركة خدمات للعملاء باستخدام "تكوين Pen Shen" ، كما أنها لم تقدم البيانات المطلوبة لتدريب نموذج الذكاء الاصطناعي "Pen Shen Composition" إلى Yiyi Liangshu. في المستقبل ، إذا كان هناك طلب لشراء البيانات لتدريب نموذج الذكاء الاصطناعي على "تكوين Pen Shen" بضربة واحدة وسكتاتين ، فإن الشركة ستتبع بصرامة "قانون أمان البيانات" واللوائح الأخرى ذات الصلة لضمان ذلك يعد الحصول على البيانات ذات الصلة ومعالجتها واستخدامها أمرًا قانونيًا ، كما أن حقوق ملكية أصول البيانات واضحة. ، في ظل فرضية عدم وجود نزاعات محتملة ، تفاوض لتحديد طريقة التعاون التجاري المحددة.

قال Bishen Composition لمراسل "Kechuangban Daily": ** "عندما يستخدم المستخدمون خدماتنا على تطبيق Bishen Composition APP ، وفقًا للاتفاقية ، سنجمع عددًا كبيرًا من مواد التكوين الأصلية للمستخدمين ونصبح أصولنا. ** هذا هو أيضًا سبب تعاون Xueersi معنا. إذا قام Xueersi بتجميع البيانات من البداية ، فإن تكلفة الوقت عالية جدًا ، ولا توجد طريقة لتجميع البيانات من نفس الحجم على المدى القصير. "

لاحظ مراسل "Kechuangban Daily" أنه وفقًا لاتفاقية خدمة المستخدم الخاصة بـ Pen God Composition ، فإن المحتوى المنشور من قبل المستخدمين في Pen God Composition يمنح ترخيصًا مجانيًا وغير قابل للإلغاء وغير حصري لـ Pen God Composition.

** من قام بنسخ تركيبته بالضبط؟ **

قال وانغ هاوكسوان ، الذي تخرج للتو من الجامعة ، لمراسل "Kechuangban Daily" إنه عندما بحث عن اسمه عبر الإنترنت في سنته الثانية ، وجد أن مقطوعة كتبها في المدرسة الإعدادية ظهرت على منصة التأليف penshen. **

قال وانغ هاوكسوان إن التأليف أوصى به مدرس ثانوي ليتم نشره في مجلة داخلية غير علنية ، وقد بذل الكثير من الجهد في كتابته. كان غاضبًا من استخدام Penshen Composition لتكوينه دون إذنه.

يعتقد Wang Haoxuan أن هذا انتهك الحق في نشر المعلومات حول أعماله على الإنترنت. لقد تفاوض مع موظفي Penshen Composition ، لكن موقف الطرف الآخر لم يكن جيدًا ، فقد حذف التكوين فقط وتوقف عن الرد على الرسالة. خطاب المحامي الذي كلف محامٍ بإرساله إلى Bishen Composition لم يتلق ردًا.

قرر Wang Haoxuan رفع دعوى قضائية ضد Bishen Composition للدفاع عن حقوقه ، ورفعت القضية من قبل المحكمة. ولم يتصل به محامي بيشن كومبشنغ إلا قبل أسبوع من المحاكمة ، على أمل المصالحة. قال المحامي إن المقال نشره شخص آخر على موقع Bishen Composition ، وأن تكوين Bishen كان مسؤولاً فقط عن عرضه.

بعد وساطة القاضي ، توصل وانغ هاوكسوان وبيشن إلى تسوية أخيرًا ، وتلقى وانغ هاوكسوان تعويضًا.

ومع ذلك ، تكهن Wang Haoxuan أن مقالته قد تكون أكثر بكثير من تلك التي تنتهك تكوين الفرشاة ، لكن المزيد من الناس لا يعرفون عنها. علاوة على ذلك ، تستهدف منصة Bishen Composition طلاب المدارس الابتدائية والمتوسطة ، حتى لو علموا أن مقالاتهم قد تم انتهاكها ، فقد لا يكون لديهم بالضرورة الوعي لحماية حقوقهم.

وجد مراسل من "Kechuangban Daily" أنه عندما اتهمت Bishen Composition Xue Ersi ، كان هناك عدد كبير من المؤلفات في Bishen Composition APP مقارنة بالكتابة الأصلية ، ولم يتم عرض أي معلومات مثل المؤلف ووقت الإصدار. ** قارن المراسلون ووجدوا أن هذه المؤلفات قد تم نشرها على مواقع غير تجارية مثل Xiaohe Composition. **

الصورة على اليسار عبارة عن تركيبة تشتمل على قضايا تتعلق بالانتهاك ، والصورة الموجودة على اليمين عبارة عن تكوين أصلي

في هذا الصدد ، رد Penshen Composition على مراسل "Kechuangban Daily" في ذلك الوقت قائلاً: "من الطبيعي أن يساهم المؤلفون بأكثر من مخطوطة واحدة. يتم تحميل هذه المقالات بواسطة المستخدمين ، والمستخدمون مسؤولون عن حقوق النشر و صحة المقالات. إذا أثار شخص آخر اعتراضات على حقوق النشر للمقال وقدم أدلة ، فسنحذفها وفقًا للقانون بعد التحقق الأولي. المقالة هي مقالة مبكرة ، ولم يكن العرض في ذلك الوقت مثاليًا ".

ومع ذلك ، قال Xiaohe Composition.com لمراسل "Kechuangban Daily" ، "إذا تم نشر التراكيب التي تظهر على مواقع الويب الأخرى بواسطة Xiaohe Composition. في البداية ، كانت جميع محطات التجميع ، بدءًا من نسخ المقالات من Xiaohe Composition Network ، ** ولكن نظرًا لأن العملية مرهقة للغاية ، فلا توجد حماية للحقوق ".

تُظهر صفحة وصف حقوق النشر الخاصة بـ Xiaohe Composition.com ، "حقوق الطبع والنشر للتكوين المنشور بواسطة Xiaohe Composition.com ملك للمؤلف ، ويحظر إعادة طبع أي وسائط عبر الإنترنت. يجب أن تحصل إعادة الطباعة بواسطة وسائط ورقية أخرى على موافقة هذا الموقع و دفع المؤلف. تحذير شديد لعدد قليل من مواقع الويب وشركات البرمجيات ، توقف فورًا عن نسخ محتوى هذا الموقع ".

قال منغ بو ، المحامي من شركة بكين جينغشي للمحاماة ، لمراسل "Kechuangban Daily" أن الأعمال المشار إليها في قانون حقوق الطبع والنشر تشير إلى الإنجازات الفكرية الأصلية في مجالات الأدب والفن والعلوم ويمكن استنساخها في بعض شكل ملموس. وفقًا للمادة 6 من "لوائح تنفيذ قانون حق المؤلف" ، يتم إنشاء حقوق الطبع والنشر من تاريخ اكتمال إنشاء العمل. يحمي القانون حقوق التأليف والنشر لمؤلفي الأعمال الأدبية والفنية والعلمية والحقوق والمصالح المتعلقة بحق المؤلف. وفقًا لأحكام المادة 52 من "قانون حق المؤلف" ، فإن التعدي على حق المؤلف والحقوق المرتبطة به ، وفقًا للظروف ، يتحمل مسؤوليات مدنية مثل وقف التعدي ، وإزالة التأثير ، وتقديم الاعتذار ، والتعويض عن الخسائر.

** بعد أن تصبح البيانات "مجففة" ، تقل التركيبة بشكل كبير **

وجد مراسل من "Kechuangban Daily" أن التركيبة المذكورة أعلاه والتي تتضمن قضايا انتهاك قد اختفت من نتائج البحث لتطبيق Bishen Composition APP ، كما يوضح فتح رابط المشاركة أنه "تمت إزالة التكوين من الرفوف لأنه غير اصلية." **

** ومع ذلك ، بعد أن كانت البيانات "مجففة" ، انخفض عدد المقالات على تطبيق Bishenzuowen بشكل ملحوظ. ** بحث مراسل "Kechuangban Daily" وفقًا لبعض كلمات البحث في لقطة شاشة سجل وصول Xueersi التي أظهرها سابقًا Bishenzuowen ، Xueersi سبق له أن زار صفحات متعددة من مصطلحات البحث عالية التردد (قالت Bishen Composition أن كل صفحة ستعرض 30 نتيجة تكوين) ، وحاليًا لا يوجد سوى مؤلف واحد أو مؤلفان متبقيان في نتائج البحث.

ومع ذلك ، لم يقم Penshen Composition بتعديل المقدمة التي تتضمن عدد المؤلفات ، ولم ينخفض سعر العضوية بل زاد. الجدير بالذكر أن الامتياز الحصري "تغيير المقطوعات الموسيقية في ثوان" الذي قدمه Penshen Composition للأعضاء يشتبه في قدرته على إنتاج مؤلفات جديدة عن طريق "غسل المخطوطات بنقرة واحدة".

ارتفع سعر العضوية السنوي لتكوين Penshen مقارنة بالشهرين الماضيين

بالإضافة إلى ذلك ، تم تسمية تطبيق Penshen Composition APP وإخطاره من قبل إدارة الفضاء الإلكتروني الحكومية في الصين في سبتمبر 2020 لدفع المعلومات المبتذلة والموجهة بشكل سيء. وفقًا لـ "Net Letter China" ، كان هناك العديد من مجموعات دعم المشاهير في عمود "Family Square" من تطبيق Penshen Composition APP في ذلك الوقت ، وكان هناك عدد كبير من محتوى "الرجال والنساء" و "الحب" على المنصة لم يكن ذلك مفيدًا للصحة الجسدية والعقلية للقصر. لاحظ المراسل أنه لا توجد حاليًا أي مجموعات أو محتوى ذي صلة متضمن في تكوين Pen God.

كما ذكرت Pen God Composition في البيان أنها ستستمر في تعزيز تنظيم وحماية استخدام البيانات لضمان الاستخدام الآمن والمتوافق للبيانات من قبل المستخدمين والشركاء والشركات.

** بعد النمو الهائل ، والبيانات عالية الجودة وبناء الامتثال ، أو الخيار الحتمي لتعلم APP ونموذج الذكاء الاصطناعي للصناعة لدخول مرحلة النضج. **

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت