وراء تدريب النموذج الكبير للذكاء الاصطناعي ، تتشكل سلسلة صناعة البيانات

المؤلف: Guo Xiaojing ، Tencent Technology

مصدر الصورة: تم إنشاؤه بواسطة Unbounded AI

"صنع المعجزات" و "الجماليات العنيفة" ، ظهرت هاتان الكلمتان دائمًا مع مناقشة ChatGPT. بالنسبة إلى "النشط" و "العنيف" ، بالإضافة إلى "قوة الحوسبة الهائلة" ، هناك أيضًا كميات هائلة من البيانات. أشار مارك أندريسن ، مؤسس a16z ، أيضًا في مؤتمر Data + AI إلى أن البيانات الهائلة التي تراكمت بواسطة الإنترنت على مدى العقدين الماضيين هي سبب مهم لظهور هذه الموجة الجديدة من الذكاء الاصطناعي ، لأن الأول يوفر الثاني. مع البيانات التي يمكن استخدامها للتدريب.

وفقًا لـ OpenAI ، يحتوي GPT-3.5 على مجموعة نصية تصل إلى 45 تيرابايت ، وهو ما يعادل 4.72 مليون مجموعة من كلاسيكيات الصين الأربعة الرئيسية ، بينما يضيف GPT-4 بيانات متعددة الوسائط إلى مجموعات بيانات التدريب GPT-3 و GPT-3.5 . في 18 يوليو ، أصدرت Meta ، الشركة الأم لـ Facebook ، Llama2 ، أول نموذج لغة كبير مفتوح المصدر ومتوفر تجاريًا ، مع التدريب المسبق المتوقع أن يصل إلى 2 تريليون رمز.

تُعتبر القدرة على الحصول على كميات هائلة من البيانات عالية الجودة إحدى أهم القدرات التنافسية لشركات النماذج واسعة النطاق في المستقبل ، كما أنها ضرورية لسباق التسلح للذكاء الاصطناعي للعمالقة الكبار. يُنظر إلى البيانات أيضًا على أنها عامل رئيسي للإنتاج يحدد التطور المستقبلي. وفقًا لإحصاءات "تقرير التنمية الرقمية في الصين (2022)" ، فإن إمكانات الاقتصاد الرقمي الصادرة عن عناصر البيانات ستكون ضخمة للغاية.سيصل إنتاج بيانات بلدي إلى 8.1 زيبوتي في عام 2022 ، وهو ما يمثل 10.5 ٪ من العالم ، تحتل المرتبة الثانية في العالم.تطور الاقتصاد الرقمي في المقدمة.

ومع ذلك ، فإن البيانات ، كعامل إنتاج جديد تمامًا ، تجلب أيضًا سلسلة من المشكلات التي تحتاج إلى حل عاجل: كيف نفهم البيانات؟ كيف يتم تأكيد حقوق البيانات؟ كيف تستخرج قيمة البيانات؟ هل حقا يمكن تداولها وتداولها؟ هل يمكن بالفعل تضمين البيانات في البيانات المالية للمؤسسة كأصل؟ كيف يتم إدارة الأمن؟ ولهذه الغاية ، تحدثنا مع الأستاذة Zeng Xueyun ، نائبة عميد معهد العلوم والتكنولوجيا في جامعة بكين للبريد والاتصالات السلكية واللاسلكية ** ، وطلبنا منها الإجابة بعمق على الأسئلة ذات الصلة.

** فيما يلي نص المحادثة: **

** Tencent Technology: قد يشعر الأشخاص العاديون بالقلق ، من أين تأتي بيانات تدريب النماذج الكبيرة؟ هل هناك أي استخدام لبياناتي الشخصية ، وهل ستكون هناك مشكلة في حقوق هذه البيانات؟ **

** البروفيسور Zeng Xueyun: البيانات المحسوبة بواسطة ** النموذج الكبير ** البيانات الشخصية **. مقارنة ببيانات الشركة ، فإن البيانات الشخصية لها ** مشكلة ملكية **. ** من حيث المبدأ ، أنا سيد بياناتي. ** على سبيل المثال ، البيانات التي تم إنشاؤها على البرامج الاجتماعية ، من حيث المبدأ ، لا يمكن للشركة التي ينتمي إليها البرنامج الاجتماعي استخدام بياناتي الشخصية. على الرغم من أن هذه الشركات قد تحكمت بالفعل في البيانات من خلال التفويض الافتراضي ، فإن كيفية استخدام البيانات المحددة يجب أن تكون أن ينظمها "قانون حماية المعلومات الشخصية".

لذا ، إذا كان سيتم استخدامه في حسابات النماذج الكبيرة ، فكيف يتم استخدامه؟ فيما يتعلق بالتكنولوجيا ، من الضروري إجراء ** معالجة إخفاء الهوية ** ، وفيما يتعلق بالتشغيل ، هناك أيضًا حاجة إلى كيان سوقي ، وهو ** يمنح شركة معينة حقًا قانونيًا لتشغيل هذه البيانات بعبارة أخرى ، قم بإعطاء هذه البيانات ابحث عن موضوع السوق. ** عندما يحصل الشخص الموجه نحو السوق على البيانات ، فإنه يحتاج إلى استثمار القوى العاملة والوقت والذكاء ورأس المال لإنتاج البيانات ، والتي يمكن أن نسميها جميعًا مدخلات العمل. بعد إدخال العمالة ، يتم اشتقاق معلومات البيانات الخاصة بالفرد إلى نوع من البيانات التجديدية للشركة ، أو البيانات الثانوية. بعد ذلك ، تُنشئ البيانات الثانوية بيانات إجرائية ، ثم إلى منتجات البيانات وخدمات البيانات. في هذا الوقت ، يتم تحويل البيانات الفردية الأصلية مع الأفراد كمالكين للبيانات إلى منتجات وخدمات بيانات للمؤسسات. هذه ** عملية إنتاجية **.

** Tencent Technology: هل من الممكن أن نفهم أن شركات الإنترنت تحصل على البيانات الشخصية من خلال التفويض ، وبعد أن تقوم هذه الشركات بمعالجة العملية ، يمكن أن تصبح نوعًا من أصول البيانات الخاصة بالشركة؟ **

** البروفيسور Zeng Xueyun: ** يمكن أن نفهم أيضًا أننا نقوم شخصيًا بتوليد كمية كبيرة من البيانات على الإنترنت ، تمامًا مثل الموارد الطبيعية المختلفة في الطبيعة. على سبيل المثال ، يمكن أن تنمو العديد من الزهور والأشجار على الأرض ، ويمكن أن تنمو العديد من الموارد. هذا النوع من الموارد هو نوع من الموارد العامة ، والتي يمكن تطويرها واستخدامها ، ولكن لا يمكن شراؤها أو بيعها مباشرة. ** ما يتم إنشاؤه بعد الاستخدام والمعالجة هو أصول المؤسسة ** ، وهذا مسموح به ، ويجب علينا أيضًا تشجيع تطوير عوامل إنتاج البيانات بهذه الطريقة.

** تقنية Tencent: من وجهة نظر فردية ، كيف نحمي بياناتنا الشخصية ونتركها تتدفق بالطريقة التي نريدها؟ **

** الأستاذ Zeng Xueyun: ** في عصر الذكاء الاصطناعي ، تزداد صعوبة حماية خصوصية الناس. نظرًا لأنه يتم تسجيل جميع سلوكيات الأشخاص ، يتم تسجيل حركة الموقع الجغرافي والحياة والعمل والنظام الغذائي والحياة اليومية. بمجرد التسجيل ، لا يمكن للجاني التحكم في المعلومات التي كانت في الأصل تخصنا. لذلك ، في هذا الوقت ، يكون خطر تسرب الخصوصية مرتفعًا جدًا ، كما أن مهمة حماية البيانات ثقيلة جدًا ، كما أن حماية البيانات صعبة للغاية.

كيف يحمي الناس حقوق البيانات الخاصة بهم؟ في الواقع ، لدى العديد من البلدان أيضًا بعض الأساليب التجارية. ** النوع الأول ، مثل اليابان ، يستخدم بنك بيانات ** ، أي أنه يمكن للجميع تخزين البيانات في بنك البيانات تمامًا مثل الإيداع في أحد البنوك. يعتبر بنك البيانات أمينًا للبيانات ، ويمكنه أيضًا أن يعمل كمطور أصلي لقيمة البيانات ، ويمكن للأفراد أيضًا الحصول على مزايا معينة. هذا يعني أنه يسمح لبعض الأشخاص الراغبين في الكشف عن بياناتهم الخاصة واستخدامها إلى حد معين بالحصول على نموذج أعمال لحل مشكلات حماية البيانات بطريقة تختارها بنفسك. بمعنى آخر ، بناء تداول البيانات القانونية ، تطوير البيانات القانونية ونماذج الاستخدام ، هذه قطعة.

** الجزء الآخر هو أنني شخصياً لا أريد ذلك ، لذا لن أفوض مالك البيانات. ** في حالة عدم وجود تصريح ، يجب على الدولة تعزيز حماية البيانات. إذا أراد أي شخص تطوير هذا الجزء من البيانات بشكل غير قانوني ، فيجب معاقبته والإشراف عليه قانونًا.يمكن استخدام تقنية Blockchain لتتبع مثل هذه السلوكيات. على سبيل المثال ، ما إذا كانت بياناتنا قد تم تسريبها ، وأين تم تسريبها ، لتتبع تدفق البيانات. من الممكن أيضًا تتبع قرابة البيانات وتحليلها ، والآن توجد تقنية قرابة البيانات. بشكل تقريبي ، ** من أين تأتي البيانات وأين تذهب؟ تحليل نسب البيانات هو في الواقع نوع من تحليل ارتباط البيانات وإمكانية تتبع البيانات. ** يعد استخدام سلالة الكلمات وصفًا حيويًا للغاية لخصائص البيانات وعمومياتها . يتم تسجيل كل شيء ، لذلك يمكن أيضًا تسجيل بيانات وتقنيات الأشخاص الآخرين ونشرها على الملأ واختراقها.

نص "القانون المدني" في بلدي على أحكام خاصة بشأن حماية المعلومات الشخصية في الفصل الخاص بحقوق الشخصية. تقارن المادة 127 من "القانون المدني" البيانات مع خاصية الشبكة الافتراضية ، مع إبراز خاصية خاصية البيانات. في التشريع المحلي ، تعكس أحكام المادة 12 من "لوائح بيانات بلدية شنغهاي" بشكل مباشر نموذج تخصيص الحقوق لـ "قسمين من الموارد البشرية والثروة". تنص هذه المادة على ما يلي: "تحمي هذه المدينة الحقوق الشخصية ومصالح الأشخاص الطبيعيين فيما يتعلق بمعلوماتهم الشخصية وفقًا للقانون." بالإضافة إلى حقوق الملكية القانونية والمصالح التي تم الحصول عليها في أنشطة ابتكار البيانات ذات الصلة في تطوير البيانات الرقمية. اقتصاد."

في 20 أغسطس 2021 ، صوت الاجتماع الثلاثين للجنة الدائمة للمجلس الوطني الثالث عشر لنواب الشعب الصيني على تمرير "قانون حماية المعلومات الشخصية لجمهورية الصين الشعبية" ، والذي سيدخل حيز التنفيذ في 1 نوفمبر 2021. يمكن العثور على التفاصيل على الإنترنت. إن الطبيعة القضائية للمعلومات الشخصية في "قانون حماية المعلومات الشخصية" هي أيضًا حماية الحقوق والمصالح الشخصية ، والتي بالكاد تنطوي على حقوق ملكية ومصالح المعلومات الشخصية.

** تقنية Tencent: ما نوع البيانات عالية الجودة المهمة لتدريب النماذج الكبيرة؟ **

** البروفيسور Zeng Xueyun: ** يجب أن تكون البيانات عبارة عن جميع سجلات الأنشطة البشرية الاقتصادية والاجتماعية والإنتاجية والإدارية والتجارية وحتى العسكرية. يتم إنتاج مثل هذا السجل في مختلف الصناعات والمجالات والجوانب. بقدر ما يتعلق الأمر بالبيانات الخام ، فهي ذات جودة عالية ومنخفضة. على سبيل المثال ، البيانات المالية والبيانات المالية ** للشركات المدرجة هي بيانات عالية الجودة ، وهي بيانات منظمة. ** لأن هذا النوع من البيانات المالية والمعلومات المالية قد تم تدقيقه من قبل المجتمع ومراجعته من قبل محاسبين عامين معتمدين ، وتشرف لجنة تنظيم الأوراق المالية الصينية على الكشف عن المعلومات ، لذلك فهي بيانات عالية الجودة. على سبيل المثال آخر ، البيانات الورقية في ** CNKI هي أيضًا بيانات عالية الجودة. ** ومع ذلك ، فإن البيانات التي يتم إنشاؤها على الإنترنت هي بيانات غير منظمة وغير موحدة. هذه البيانات هي نوع من البيانات الأصلية والفوضوية وغير المنظمة ، والتي تتطلب تنظيفًا دقيقًا قبل الحساب ، لذلك عادةً ما تنتقل البيانات عالية الجودة من عملية المعالجة غير المنظمة إلى المعالجة المنظمة. **

** تقنية Tencent: نظرًا لأنه يمكن إنتاج بيانات عالية الجودة باستمرار ، فلماذا يوجد مثل هذا القول بأن "البيانات عالية الجودة تُستنفد تقريبًا"؟ **

** البروفيسور Zeng Xueyun: ** أعتقد أن القدرة على إنتاج البيانات ومعالجتها لا يمكنها مواكبة طلب الأشخاص على البيانات ، كما أن إنتاجية سلسلة قيمة سلسلة التوريد بأكملها لإنتاج البيانات ومعالجتها لا تزال ضعيفة نسبيًا. لأننا نعلم أن البيانات تتفجر باستمرار ، ولكن البيانات عالية الجودة آخذة في النفاد.هذا يعني فقط أنه في العملية من البيانات إلى البيانات عالية الجودة ، فإننا نفتقر إلى نوع من الإنتاجية والقدرة على التكامل. في هذا الوقت ، هناك حاجة لبائعي البيانات. العديد من موردي البيانات الحاليين لدينا يستخدمون البيانات بشكل مباشر فقط ، ولكن لإنتاج البيانات ومعالجتها ، وكيفية إنتاج بيانات عالية الجودة ، والقدرة أو تصميم نموذج العمل في هذا المجال لا يزال غير كاف.

في الواقع ، يستخدم GPT-4 الخاص بـ OpenAI كمية كبيرة من البيانات التي ينتجها نموذج الجيل السابق GPT-3.5 للتدريب. قال مؤسس OpenAI أيضًا في مقابلة حديثة ، "البيانات التركيبية هي طريقة فعالة لحل النقص في بيانات النماذج الكبيرة. المفتاح هو أن هناك نظامًا كاملاً للتمييز بين البيانات التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي لا تتوفر . واستمر في تقديم التغذية الراجعة بناءً على تأثير النموذج المدرب ". هذه الشركة ليست قادرة على جمع الأموال فحسب ، بل يمكنها أيضًا التحكم في الكثير من قوة الحوسبة بهذه البساطة ، كما أن قدرة تكنولوجيا المنتج للبيانات هي أيضًا إحدى القدرات التنافسية الأساسية لهذه الشركة.

** تقنية Tencent: من أجل تحسين إنتاجية البيانات عالية الجودة ، ما هي الروابط الضرورية في التصميم الصناعي؟ **

** البروفيسور Zeng Xueyun: ** حول هذا السؤال ، يجب أن نفهم أولاً ما هي البيانات؟ ما هي البيانات التي لدينا؟ وماذا تفعل بالبيانات؟ أي أن إنتاج بيانات عالية الجودة لا يعني أن هناك قدرة إنتاجية للحصول على بيانات عالية الجودة ، ولا يعني أن هناك استعدادًا لإنتاج بيانات عالية الجودة. يجب أن يفهم البيانات من المصدر ما هي المشاكل في المجتمع التي يجب حلها بالبيانات؟ أين هو طلب السوق على البيانات؟ ثم ، من البيانات الأصلية إلى جانب الطلب ، كيف يجب أن ننتج في المنتصف؟ هذه السلسلة من المشاكل تتطلب تصميمًا صناعيًا ، والتفكير العام الحالي ليس كافيًا.

** Tencent Technology: عدم نضج الصناعة هو أحد جوانبها ، فهل يعني ذلك أيضًا أن الصناعة لا تزال عبارة عن محيط أزرق؟ **

** الأستاذ Zeng Xueyun: ** محيط أزرق مبكر جدًا. في الأيام الأولى ، كانت هناك بعض حالات الاتجار المباشر غير المشروع بالبيانات ، وفي وقت لاحق ، لم يعد بإمكان التشريعات الوطنية شراء وبيع البيانات نفسها بشكل مباشر ، ولم يعد المتاجرة بالبيانات الأولية. لا يمكن استخدام البيانات للمعاملات الأصلية. يجب أن تكون نتيجة ** الاستثمار في الإنتاج الخاص للفرد ** لإجراء المعاملات ، بدلاً من القول إن لدي بعض البيانات وأبيع البيانات مباشرةً. وهذا غير مسموح به.

** في عام 2022 (ديسمبر) ، تم إصدار "عشرون مادة من البيانات" **. قدمت "عشرون مادة من البيانات" متطلبات الفصل بين ملكية البيانات والملكية المتعددة لملكية البيانات وحقوق الإدارة و حقوق الانتفاع: التقسيم الذي ذكر أن البيانات يجب أن تدار في هذه الفئة الهرمية. هذا هو التصميم ذو المستوى الأعلى لإدارة البيانات والمخطط العام. يمكن القول أيضًا إنها بداية التطوير القياسي لصناعة البيانات المستقبلية. في هذا الوقت ، يدرك الناس أن البيانات ليست كاملة ، وأنهم بحاجة إلى فهم الحقوق والمصالح التي تتمتع بها البيانات ، وهذا أيضًا هو تقدم البحث الأصلي القائم على القانون إلى البحث القائم على الاقتصاد. ** لإنشاء سوق بيانات ، يجب أن يكون السوق سلوكًا اقتصاديًا. ** يتطلب هذا النوع من السلوك الاقتصادي استخدام العديد من الأدوات الاقتصادية والنظريات الاقتصادية ، لذا الآن ** من البحث في علم البيانات ، وحوكمة البيانات من قبل الدولة ، إلى البحث عن البيانات في الأوساط الأكاديمية ، والتحكم في البيانات في الصناعة ، يعد الاستخدام محيطًا أزرق ، وهي حالة بدأت للتو. **

** تقنية Tencent: من وجهة النظر هذه ، يمكن أن توجد البيانات كأصل معين للمؤسسة. ما نوع الأصل الذي تنتمي إليه البيانات؟ **

** البروفيسور Zeng Xueyun: ** تصنيف البيانات هو موضوع ساخن للغاية في الأوساط الأكاديمية. في معظم الحالات ، يعتقد الناس أن البيانات غير ملموسة وغير مرئية وغير ملموسة ، وتسمى الأصول غير الملموسة. ولكن في الواقع ، من تصنيف الاتحاد الدولي للاتصالات ، فإن البيانات أقرب إلى أصول المخزون ، لأن البيانات تتضمن أيضًا عملية الإنتاج والمعالجة. والبيانات نفسها هي أصل إلكتروني ملموس ، فلماذا هي أصل إلكتروني ملموس؟ ستشغل البيانات مساحة فعلية ، والكثير من البيانات نفسها لها شكل مادي ، وهو شكل مادي على جانب الشبكة. صورة ، يمكنك رؤية هذه الصورة الإلكترونية ؛ الصوت ، يمكنك سماع هذا الصوت ، والصورة ، يمكنك رؤية هذه الصورة ، لذا ** البيانات هي أصل رقمي ملموس. **

نحن نعلم أن أصول البيانات هي فئة أصول خاصة جدًا. سيقترح البعض أنه يمكن مقارنة البيانات بالطبيعة غير الملموسة للإطفاء ، أو مماثلة للأصول الثابتة للإهلاك. في الواقع ، يجب عليك أولاً تصنيف البيانات بشكل هرمي لمعرفة الفئة التي تنتمي إليها البيانات. ** بالنسبة لأنواع معينة من البيانات ، تتمتع أيضًا ** بإمكانية النمو والاندماج **. على سبيل المثال ، إذا كان من الممكن دمج جميع بيانات المكالمات الخاصة بشركة China Unicom مع بيانات الإيداع والاستثمارات المصرفية الشخصية ، فيمكن إنشاء صورة لهذا الشخص بمزيد من المعلومات من الاستثمار والتمويل إلى اتصالاته ومهنته. في هذا الوقت ، سيكون هناك تأثير تراكمي لقيمة البيانات الناتجة عن اندماج البيانات والبيانات. في هذا الوقت ، ** سيتم دمج البيانات وقابلة للنمو **. هناك أيضًا جزء من البيانات ** حساس للوقت ** ، وستتحلل قيمته بمرور الوقت. لذلك ، ما زلنا بحاجة إلى تحليل خصائص البيانات نفسها بشكل أكثر تحديدًا من أجل معرفة قيمتها المحاسبية ، و ** تتسم محاسبة قيمة البيانات بمزيد من التباين وعدم اليقين ** ، على عكس الأصول الثابتة ، الثابتة قيمة الأصول في ذلك الوقت تكوين الأصول أمر مؤكد ، ومع مرور الوقت ، تنخفض القيمة تدريجيًا ، لكن البيانات لا تنخفض بالضرورة بمرور الوقت ، وتحتوي البيانات على شكل أصول أكثر تعقيدًا.

** Tencent Technology: هل البيانات المستقبلية هي إحدى القدرات التنافسية الأساسية لشركات الذكاء الاصطناعي؟ هل يمكن قياس أصول البيانات كمياً وانعكاسها في تقييم الشركة؟ **

** البروفيسور Zeng Xueyun: ** بالنسبة لشركة الذكاء الاصطناعي ، ** البيانات هي جوهر قدرتها التنافسية. ** بالنسبة لشركة AI ، تحدد تجربة المنتج القيمة التجارية للشركة ، وتحدد إمكانات البيانات تجربة المنتج. ** بالنسبة لبلد ما ، البيانات هي القدرة التنافسية الرئيسية في المستقبل ، وهي أيضًا ذهب المستقبل ، تمامًا كما النفط هو ذهب العصر الصناعي ، و ** البيانات هي ذهب عصر اقتصاد الإنترنت. **

ولكن في الوقت الحاضر ، تواجه دول العالم بالفعل صعوبات في إدارة البيانات ، ولم تتولى أي دولة زمام المبادرة في تحقيق اختراقات في كيفية حل التوازن بين أمن البيانات ، وإدارة البيانات ، وتطوير البيانات واستخدامها. **

في هذا الصدد ، كانت الصين تدرك تمامًا أهمية البيانات. تدرك جميع الدول أيضًا أن البيانات هي إنتاجية جديدة ، لكن كيفية استخدام البيانات تتطلب لاعبين في السوق وتكنولوجيا ذكية وتنظيمًا وطنيًا ، لذلك ، لا يمكن حلها مشكلة بسيطة ، إنها مشكلات تعقيد النظام.

تعد الحوكمة الوطنية في الصين ترتيبًا مركزيًا نسبيًا من المستوى المركزي إلى المحلي ، لذلك لدينا بطبيعة الحال ميزة في دمج البيانات الضخمة في جميع أنحاء البلاد ، ولكن هذه الميزة لم تنعكس بعد ، وهي تكمن في تقييم ** البيانات هناك مشاكل في التقييم والتقدير ، ومشكلة إدخال البيانات في البيانات المحاسبية لم يتم حلها. ** لا يوجد حل جيد لهذه المشكلة في العالم.

** إذا كان من الممكن نقل البيانات من الأصول خارج الميزانية العمومية إلى الأصول في الميزانية العمومية ، فيمكن عندئذٍ حل محاسبة القيمة لإدارة البيانات وإدارة قيمة البيانات بشكل جيد ، وسيكون لمعاملات البيانات أساس موضوعي. ** الآن بيانات الشركة الخاصة بنا هي في الأساس أصول خارج الميزانية ، بدون تقييم ، وبدون قياس وإعداد تقارير في الميزانية العمومية ، لذلك ليس من الواضح مقدار البيانات التي تمتلكها الشركة ، وبالتالي فإن اقتصاديات البيانات من الصعب أيضًا لعمل إحصائيات عن القيمة. إذا لم يتم إدخال البيانات في الجدول ، فستفتقر معاملتها إلى أساس معقول ، ** لذا فإن إدخال البيانات في الجدول يمثل مشكلة رئيسية. ** بالنسبة لإحصاءات حجم البيانات ، وحساب أسعار البيانات ، وتسعير معاملات البيانات ، ** من إحصائيات الحجم إلى محاسبة الأسعار إلى أساس المعاملات ، ** تحتاج إلى إدخال الميزانية العمومية وبيان الدخل مع البيانات ، وإدخال محاسبة البيانات المالية هو مرفق أساسي. هذا المرفق الأساسي لم يتم حلها بعد.

** Tencent Technology: ما هي السوابق الدولية لتشريعات حقوق ملكية البيانات؟ **

** البروفيسور Zeng Xueyun: ** بحث حول تشريعات حقوق ملكية البيانات. في الوقت الحاضر ، لدى الدول الكبرى في جميع أنحاء العالم قوانين أساسية بشأن حماية البيانات ، وهي في وضع متزايد بشكل واضح لتعزيز حماية حقوق الشخصية في حقوق ملكية البيانات. ومع ذلك ، فإن القوانين واللوائح المتعلقة باستخدام البيانات مفقودة بشكل أساسي. اليابان لديها درجة معينة من التقدم في هذا الصدد. ينصب تركيز بلدي بشكل كبير على تعزيز تداول عناصر البيانات ، ولكن بدون دعم وتنظيم وتوجيه القوانين واللوائح ، فإنه يعتمد بشكل أساسي على الوثائق الإدارية ، التي لا تزال تعاني من الكثير من أوجه القصور التشريعية. في الوقت الحاضر ، هناك حاجة ملحة لقيادة الاتجاه الجديد للبناء القانوني العالمي بشكل مبتكر من حيث تسريع تنظيم حقوق ملكية البيانات وتداول عناصر البيانات. الوضع في الداخل والخارج على النحو التالي:

الجوانب الدولية: تعتبر اللائحة العامة لحماية البيانات (GDPR) التي أقرها الاتحاد الأوروبي في عام 2016 أكثر قوانين خصوصية البيانات شمولاً وتأثيراً. تتطور "اللوائح" في اتجاهين: تعزيز حقوق الأشخاص المعنيين بالبيانات ، وضمان التحكم في استخدام البيانات الشخصية ، ومراعاة أمن البيانات والتدفق الحر للبيانات. على أساس تأكيد وتحسين الحقوق الحالية للأفراد ، تنص اللائحة العامة لحماية البيانات على الحق في الحذف (المادة 17) والحق في إمكانية النقل (المادة 20) ، وما إلى ذلك ، لتحقيق تحكم أكثر فعالية في البيانات الشخصية لصاحب البيانات ، ولكن الأحكام لا يوجد توضيح بشأن نقل ملكية البيانات الشخصية وتوزيع حقوق الملكية.

على الرغم من أن الولايات المتحدة بدأت النظام والاستكشاف النظري للحماية القانونية لملكية البيانات في وقت سابق ، إلا أن معظم المعايير ذات الصلة مبعثرة في مشاريع قوانين مختلفة. تشريعات كل ولاية غير متوافقة ، لكنها تغطي مجموعة واسعة من المجالات ولديها بعض المرونة في تسوية المنازعات الفعلية لتشجيع استخدام البيانات. على سبيل المثال ، أدى "قانون خصوصية المستهلك في كاليفورنيا لعام 2018" الصادر في 2018 و "قانون خصوصية كاليفورنيا لعام 2020" الصادر في 2020 إلى زيادة تحديد حقوق البيانات ، والتي تغطي الحق في الوصول ، والحق في الحذف ، والحق في المعرفة ، إلخ. تعزز حقوق الخصوصية الشخصية للمستهلكين حماية حقوق ومصالح موضوعات البيانات أثناء نقل البيانات ، وهو ما يعكس أيضًا من الجانب إذن الولايات المتحدة لاستخدام القيمة الاقتصادية للبيانات. في عام 2017 ، صاغت اليابان "المبادئ التوجيهية لعقود حقوق استخدام البيانات". نظرت المبادئ التوجيهية بشكل كامل في عوامل مثل مساهمة عقود البيانات في إنشاء البيانات ، وعبء تكلفة التخزين والإدارة ، وعقود معاملات البيانات الموحدة لتعزيز معاملات البيانات. هذا يمثل تقدمًا كبيرًا ، ولكن لا يوجد حتى الآن تعريف واضح لحقوق ملكية البيانات.

في أوروبا ، يعتبر ميثاق الاتحاد الأوروبي للحقوق الأساسية واللائحة العامة لحماية البيانات الحق في حماية البيانات الشخصية حقًا خاصًا يتمتع به أصحاب البيانات ، والذي لا يتضمن أي حقوق ملكية. على الرغم من أن قوانين الاتحاد الأوروبي مثل اللائحة العامة لحماية البيانات لا تنص بوضوح على أن مراقبي البيانات يتمتعون بحقوق الملكية مع البيانات ككائن ، يمكن حماية حقوق ملكية البيانات الخاصة بهم ومصالحهم من خلال حماية قاعدة البيانات ، وحماية قانون حقوق النشر ، وحماية الأسرار التجارية ، وحماية قانون العقود ، وحماية قانون المنافسة .. الخ. بالإضافة إلى ذلك ، تلتزم وثيقة "بناء اقتصاد بيانات أوروبي" الصادرة عن المفوضية الأوروبية بإدخال "حقوق منتج البيانات" ، والتي تمنح مراقبي البيانات حقوق ملكية عالمية للبيانات غير الشخصية والبيانات الشخصية مجهولة المصدر ، مما يمكنهم من الاستخدام الحصري من البيانات ، بما في ذلك الحق في ترخيص الآخرين لاستخدام هذه البيانات. في الولايات المتحدة ، على الرغم من أن بعض الباحثين القانونيين يعتقدون أنه يجب منح الأفراد حقوق ملكية للمعلومات الشخصية ، فإن المحاكم عادة لا تعترف بحقوق الملكية هذه. في بعض الحالات ، قضت المحاكم الأمريكية بأن الشركات لديها حقوق ملكية في البيانات التي تحتفظ بها. تُظهر الخبرة القانونية المحلية والأجنبية بشأن ملكية البيانات أن "فصل الموارد البشرية والثروة" يجب أن يصبح الاقتراح النظري الأساسي لبناء نظام حقوق ملكية البيانات في بلدي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت