** الدليل: ** الآن ، أطلقت شركة OpenAI GPTBot - زاحف ويب يمكنه الحصول تلقائيًا على البيانات من الإنترنت بالكامل. سيتم استخدام البيانات الناتجة لتدريب نماذج الذكاء الاصطناعي مثل GPT-4 و GPT-5!
منذ بعض الوقت ، كان هناك اضطراب في الاستيلاء على بيانات مستخدمي النظام الأساسي ، وكان مستخدمو موقع Reddit يتجادلون.
اليوم ، أطلقت OpenAI أداة زاحف الويب GPTBot ، والتي يمكنها كشط بيانات موقع الويب تلقائيًا.
**كيف تستعمل؟ **
قالت شركة OpenAI في الوثيقة المنشورة إن زاحف الويب سيقوم بالتصفية لإزالة المصادر التي تتطلب وصولاً مدفوعًا ، ولكن أيضًا يزيل معلومات التعريف الشخصية (PII) أو النص الذي ينتهك سياساته.
تُستخدم البيانات التي تم التقاطها بواسطة GPTBot لتدريب GPT-4 أو GPT-5 ، والتي يمكن أن تحسن دقة وقدرات أنظمة الذكاء الاصطناعي المستقبلية.
يمكن التعرف على الأداة من خلال الكود التالي:
رمز وكيل المستخدم: GPTBotFull user-agent string: Mozilla / 5.0 AppleWebKit / 537.36 (KHTML ، مثل Gecko ؛ متوافق ؛ GPTBot / 1.0 ؛ +
** امنع الوصول إلى GPTBot **
من ناحية أخرى ، يمكنك أيضًا تعطيل GPTBot من الوصول إلى مواقع الويب عن طريق إضافتها إلى موقع robots.txt.
هذا يعني أنه يجب على مالكي مواقع الويب اتخاذ إجراءات طوعية لمنع OpenAI من الوصول إلى مواقع الويب الخاصة بهم وعدم استخدام بياناتهم الخاصة للتدريب.
وكيل المستخدم: GPTBotDisallow: /
** وصول GPTBot مخصص **
يمكنك أيضًا التحكم في وصول GPTBot إلى بعض محتويات موقع الويب من خلال الكود التالي.
بالنسبة إلى زاحف OpenAI ، سيتم استدعاء موقع الويب من خلال مجموعة من عناوين IP المسجلة على موقع OpenAI الإلكتروني.
** مناقشة ساخنة عبر الإنترنت **
أثار تحرك OpenAI مناقشات بين مستخدمي الإنترنت حول القضايا الأخلاقية لبرامج زحف الويب المستخدمة لتدريب نماذج الذكاء الاصطناعي.
"OpenAI لا تستشهد حتى بشكل معتدل. إنها تصنع أعمالًا مشتقة ولا تقتبس ، وبالتالي تحجب حقيقة وجودها."
قال مستخدمو الإنترنت إن هناك أخيرًا فرصة لمنع OpenAI من الاستيلاء على بيانات شبكتك لتدريب النموذج.
كما تم اقتراح إزالة الوظيفة الإضافية لمتصفح ChatGPT لبعض الوقت ، ويرجع ذلك جزئيًا إلى أنها سمحت بالوصول إلى المحتوى المحمي بنظام حظر الاشتراك غير المدفوع.
منذ بعض الوقت ، قدمت OpenAI طلب علامة تجارية لـ GPT-5 إلى مكتب براءات الاختراع الأمريكي في 18 يوليو ، مما يشير إلى أن الشركة تدرب على نظام ذكاء اصطناعي أكثر تقدمًا.
يبدو أن GPTBot سيساعد OpenAI في جمع المزيد من البيانات من الإنترنت لتدريب النموذج.
مراجع:
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
GPT-5 ليس بعيدًا! أطلقت OpenAI برنامج زحف الويب GPTBot ، الذي يجمع البيانات تلقائيًا ويمكن إيقاف تشغيله بشكل انتقائي
تحرير: الخوخ نعسان جدا
المصدر: Xinzhiyuan
** الدليل: ** الآن ، أطلقت شركة OpenAI GPTBot - زاحف ويب يمكنه الحصول تلقائيًا على البيانات من الإنترنت بالكامل. سيتم استخدام البيانات الناتجة لتدريب نماذج الذكاء الاصطناعي مثل GPT-4 و GPT-5!
منذ بعض الوقت ، كان هناك اضطراب في الاستيلاء على بيانات مستخدمي النظام الأساسي ، وكان مستخدمو موقع Reddit يتجادلون.
اليوم ، أطلقت OpenAI أداة زاحف الويب GPTBot ، والتي يمكنها كشط بيانات موقع الويب تلقائيًا.
**كيف تستعمل؟ **
قالت شركة OpenAI في الوثيقة المنشورة إن زاحف الويب سيقوم بالتصفية لإزالة المصادر التي تتطلب وصولاً مدفوعًا ، ولكن أيضًا يزيل معلومات التعريف الشخصية (PII) أو النص الذي ينتهك سياساته.
تُستخدم البيانات التي تم التقاطها بواسطة GPTBot لتدريب GPT-4 أو GPT-5 ، والتي يمكن أن تحسن دقة وقدرات أنظمة الذكاء الاصطناعي المستقبلية.
يمكن التعرف على الأداة من خلال الكود التالي:
رمز وكيل المستخدم: GPTBotFull user-agent string: Mozilla / 5.0 AppleWebKit / 537.36 (KHTML ، مثل Gecko ؛ متوافق ؛ GPTBot / 1.0 ؛ +
** امنع الوصول إلى GPTBot **
من ناحية أخرى ، يمكنك أيضًا تعطيل GPTBot من الوصول إلى مواقع الويب عن طريق إضافتها إلى موقع robots.txt.
هذا يعني أنه يجب على مالكي مواقع الويب اتخاذ إجراءات طوعية لمنع OpenAI من الوصول إلى مواقع الويب الخاصة بهم وعدم استخدام بياناتهم الخاصة للتدريب.
وكيل المستخدم: GPTBotDisallow: /
** وصول GPTBot مخصص **
يمكنك أيضًا التحكم في وصول GPTBot إلى بعض محتويات موقع الويب من خلال الكود التالي.
وكيل المستخدم: GPTBotAllow: / directory-1 / Disallow: / directory-2 /
** تصدير IP **
بالنسبة إلى زاحف OpenAI ، سيتم استدعاء موقع الويب من خلال مجموعة من عناوين IP المسجلة على موقع OpenAI الإلكتروني.
** مناقشة ساخنة عبر الإنترنت **
أثار تحرك OpenAI مناقشات بين مستخدمي الإنترنت حول القضايا الأخلاقية لبرامج زحف الويب المستخدمة لتدريب نماذج الذكاء الاصطناعي.
"OpenAI لا تستشهد حتى بشكل معتدل. إنها تصنع أعمالًا مشتقة ولا تقتبس ، وبالتالي تحجب حقيقة وجودها."
مراجع: