من الآن فصاعدًا ، يمكن استخدام كل كلمة تقولها علنًا على الإنترنت بواسطة ** Google ** لتدريب الذكاء الاصطناعي!
هذا صحيح ، بعد الرسم ، ستُستخدم ** الأعمال المكتوبة ** أيضًا لتغذية النماذج الكبيرة——
سواء كانت مدونات تقنية أو رمزًا أو أوراقًا أو أي شيء تنشره علنًا عبر الإنترنت ، يمكن طرحها في "Google Big Model Blender" ، حتى مع حقوق النشر.
هذا الأسبوع فقط ، قامت Google بتحديث سياسة الخصوصية الخاصة بها لتوضيح أنها تحتفظ بالحق في التخلص من جميع المحتويات العامة عبر الإنترنت لبناء أدوات الذكاء الاصطناعي الخاصة بها.
انفجر مستخدمو الإنترنت على الفور. شخص ما يحذر من أن "Google تقوم بالزحف إلى كل شيء":
بمجرد أن تتمكن Google من قراءة ما تكتبه ، فهذا يعني أنها "ملكيتها".
بعض مستخدمي الإنترنت لديهم فكرة أكثر تشاؤماً:
قريبًا ، سيكون جميع منتجي المحتوى من الذكاء الاصطناعي.
إذن ، ما الجديد في هذا الإصدار من سياسة الخصوصية؟
** لتدريب منتجات الذكاء الاصطناعي مثل Bard **
يجب أن تبدأ الأمور بسياسة الخصوصية المحدثة من Google هذه الأيام.
في أحدث سياسة للخصوصية ، أضافت Google بندًا نموذجيًا للذكاء الاصطناعي بشأن "البحث والتطوير":
تستخدم Google المعلومات لتحسين خدماتنا وتطوير منتجات وميزات وتقنيات جديدة لإفادة المستخدمين والجمهور.
على سبيل المثال ، نستخدم ** المعلومات العامة ** للمساعدة في تدريب نماذج الذكاء الاصطناعي من Google وإنشاء منتجات وميزات مفيدة (مثل ميزات Google Translate و Bard و Cloud AI).
بمعنى آخر ، هو استخدام جميع المعلومات العامة التي يمكن جمعها في تدريب المنتجات أو الوظائف ذات الصلة بالذكاء الاصطناعي مثل ** ترجمة Google ** و ** Bard ** و ** Cloud AI **.
إذن ، ما الذي تتضمنه هذه المعلومات العامة بالضبط؟
مثل معلومات الإنترنت والشبكة وأنشطة أخرى ، بما في ذلك معلومات حول مصطلحات البحث والتطبيقات وتفاعلات المتصفح مع خدمات Google ، واستخدام خدمات Google على مواقع الويب والتطبيقات التابعة لجهات خارجية.
بمعنى آخر ، ليس فقط المدونات والمحتويات الأخرى التي تم نشرها للعامة من قبل ، ولكن أيضًا ** Google Docs ** المنشورة عبر الإنترنت ، أو بعض المنشورات التي تحتوي على ** معلومات شخصية ** ، قد يتم جمعها أيضًا بواسطة Google for Large النموذج التدريبي.
بالطبع ، لا تزال هذه المحتويات مقصورة على "المعلومات العامة" في الوقت الحاضر.
لا يزال يتعين عدم الزحف إلى خدمات البريد الإلكتروني مثل Gmail ، التي توفرها Google ، في البيانات.
علاوة على ذلك ، صرحت Google بوضوح في سياسة الخصوصية الخاصة بها أنه يمكنها أيضًا استخدام هذه المعلومات الشخصية أو العامة لأسباب أخرى ، مثل منع التهديدات الأمنية أو مراجعة المعلومات أو صيانة الخدمة أو الإعلانات المخصصة أو القوانين.
ولكن لماذا تقوم Google بتحديث هذه السياسة في هذا المنعطف؟
** "الذكاء الاصطناعي يتحدى حقوق التأليف والنشر للنصوص" **
ربما يكون مرتبطًا أيضًا بعملية "الحد الحالية" لشركات مثل Reddit و Twitter.
أولاً ، في أبريل من هذا العام ، أعلنت Reddit أنها ستفرض رسومًا على الشركات التي تصل إلى API.
يعتقد الرئيس التنفيذي للشركة أن قاعدة بيانات Reddit ** ذات قيمة كبيرة ** ، لكنهم لا يريدون توفير هذه المحتويات القيمة لشركات التكنولوجيا الكبيرة مجانًا.
في وقت لاحق ، بدأ Twitter أيضًا في الحد من تدفق Twitter بسبب "** لا أريد لشركات الذكاء الاصطناعي أن تمارس الدعارة **".
هذه السلسلة من السياسات لها تأثير خطير على المستخدمين وأدوات الطرف الثالث. على سبيل المثال ، أثار Reddit احتجاجًا واسع النطاق على لوحة المناقشة. أغلق العديد من الوسطاء منتدياتهم الخاصة مباشرة للاحتجاج على نشاط Reddit. يدين العديد من الأشخاص ، والبعض الآخر حتى أن مستخدمي الإنترنت قالوا إن "تويتر قد قُتل".
ولكن على أي حال ، فإن السماح لبيانات البغايا بالذكاء الاصطناعي مجانًا أصبح الآن تناقضًا لا يمكن تجاهله.
فيما يتعلق بمسألة بيانات الزحف الخاصة بـ Google AI ، أعرب بعض مستخدمي الإنترنت عن شكوكهم:
لماذا قبل الإنترنت ، مثل محركات البحث ، كان لديها أيضًا عمليات مثل الزحف إلى البيانات ، لكن الناس كانوا يقاومون "زحف الذكاء الاصطناعي".
أجاب بعض مستخدمي الإنترنت:
إنها في الأساس قضية حق المؤلف. إذا اقتبست للتو من مادة محمية بحقوق الطبع والنشر ، فأنت لا تنتهك حقوق الطبع والنشر بالضرورة ، ولكن إذا استخدمت الذكاء الاصطناعي "لتحريك وتنظيف" المحتوى المحمي بحقوق الطبع والنشر ، وكان هذا الشيء قانونيًا ، فعندئذٍ في جوهره ** حقوق الطبع والنشر قد ماتت **.
ولهذا بالضبط فهو متشائم من هذا الأمر:
إذا قام شخص ما بنسخ مدونتك دون الإقرار بالمصدر ، أو استخدم كود المصدر المفتوح الخاص بك للخدمات المدفوعة ، أو استخدم إجاباتك على StackOverflow كطريقة للإجابة على الأسئلة ، يمكنك قبول أن هذا سيحدث؟
كل ما فعلته كان ** مجانيًا **. ولكن الآن إذا أرادت منظمة العفو الدولية أن أختفي ، فسأختفي.
بالطبع ، هناك أيضًا مستخدمو الإنترنت الذين قبلوا إدخال هذه السياسة ، ولا غنى عن الانتباه إلى وعي الجميع بالوقاية:
اطلع على السياسة الجديدة ولاحظ مقدار المعلومات التي يتم تسريبها عبر الإنترنت.
حسنا، ماذا تعتقد بشأن هذا؟
ارتباط مرجعي:
[1]
[2]
شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
جوجل AI يأكل كل شيء! الزحف إلى كل المحتوى العام لتدريب الذكاء الاصطناعي ، تم تحديث سياسة الخصوصية
المصدر الأصلي: Qubit
من الآن فصاعدًا ، يمكن استخدام كل كلمة تقولها علنًا على الإنترنت بواسطة ** Google ** لتدريب الذكاء الاصطناعي!
هذا صحيح ، بعد الرسم ، ستُستخدم ** الأعمال المكتوبة ** أيضًا لتغذية النماذج الكبيرة——
سواء كانت مدونات تقنية أو رمزًا أو أوراقًا أو أي شيء تنشره علنًا عبر الإنترنت ، يمكن طرحها في "Google Big Model Blender" ، حتى مع حقوق النشر.
انفجر مستخدمو الإنترنت على الفور. شخص ما يحذر من أن "Google تقوم بالزحف إلى كل شيء":
** لتدريب منتجات الذكاء الاصطناعي مثل Bard **
يجب أن تبدأ الأمور بسياسة الخصوصية المحدثة من Google هذه الأيام.
في أحدث سياسة للخصوصية ، أضافت Google بندًا نموذجيًا للذكاء الاصطناعي بشأن "البحث والتطوير":
بمعنى آخر ، هو استخدام جميع المعلومات العامة التي يمكن جمعها في تدريب المنتجات أو الوظائف ذات الصلة بالذكاء الاصطناعي مثل ** ترجمة Google ** و ** Bard ** و ** Cloud AI **.
مثل معلومات الإنترنت والشبكة وأنشطة أخرى ، بما في ذلك معلومات حول مصطلحات البحث والتطبيقات وتفاعلات المتصفح مع خدمات Google ، واستخدام خدمات Google على مواقع الويب والتطبيقات التابعة لجهات خارجية.
بمعنى آخر ، ليس فقط المدونات والمحتويات الأخرى التي تم نشرها للعامة من قبل ، ولكن أيضًا ** Google Docs ** المنشورة عبر الإنترنت ، أو بعض المنشورات التي تحتوي على ** معلومات شخصية ** ، قد يتم جمعها أيضًا بواسطة Google for Large النموذج التدريبي.
بالطبع ، لا تزال هذه المحتويات مقصورة على "المعلومات العامة" في الوقت الحاضر.
لا يزال يتعين عدم الزحف إلى خدمات البريد الإلكتروني مثل Gmail ، التي توفرها Google ، في البيانات.
علاوة على ذلك ، صرحت Google بوضوح في سياسة الخصوصية الخاصة بها أنه يمكنها أيضًا استخدام هذه المعلومات الشخصية أو العامة لأسباب أخرى ، مثل منع التهديدات الأمنية أو مراجعة المعلومات أو صيانة الخدمة أو الإعلانات المخصصة أو القوانين.
ولكن لماذا تقوم Google بتحديث هذه السياسة في هذا المنعطف؟
** "الذكاء الاصطناعي يتحدى حقوق التأليف والنشر للنصوص" **
ربما يكون مرتبطًا أيضًا بعملية "الحد الحالية" لشركات مثل Reddit و Twitter.
أولاً ، في أبريل من هذا العام ، أعلنت Reddit أنها ستفرض رسومًا على الشركات التي تصل إلى API.
يعتقد الرئيس التنفيذي للشركة أن قاعدة بيانات Reddit ** ذات قيمة كبيرة ** ، لكنهم لا يريدون توفير هذه المحتويات القيمة لشركات التكنولوجيا الكبيرة مجانًا.
في وقت لاحق ، بدأ Twitter أيضًا في الحد من تدفق Twitter بسبب "** لا أريد لشركات الذكاء الاصطناعي أن تمارس الدعارة **".
هذه السلسلة من السياسات لها تأثير خطير على المستخدمين وأدوات الطرف الثالث. على سبيل المثال ، أثار Reddit احتجاجًا واسع النطاق على لوحة المناقشة. أغلق العديد من الوسطاء منتدياتهم الخاصة مباشرة للاحتجاج على نشاط Reddit. يدين العديد من الأشخاص ، والبعض الآخر حتى أن مستخدمي الإنترنت قالوا إن "تويتر قد قُتل".
ولكن على أي حال ، فإن السماح لبيانات البغايا بالذكاء الاصطناعي مجانًا أصبح الآن تناقضًا لا يمكن تجاهله.
فيما يتعلق بمسألة بيانات الزحف الخاصة بـ Google AI ، أعرب بعض مستخدمي الإنترنت عن شكوكهم:
ارتباط مرجعي: [1] [2]