GPT-5 не за горами! OpenAI запустив веб-сканер GPTBot, який автоматично збирає дані та може бути вибірково відключений

Редагувати: Персик такий сонний

Джерело: Xinzhiyuan

Посібник: Щойно OpenAI запустив GPTBot — веб-сканер, який може автоматично отримувати дані з усього Інтернету. Отримані дані будуть використані для навчання моделей AI, таких як GPT-4 і GPT-5!

Деякий час тому виникла суматоха щодо захоплення даних користувачів платформи, і користувачі мережі Reddit сперечалися.

Сьогодні OpenAI запустив інструмент веб-сканера GPTBot, який може автоматично знімати дані веб-сайтів.

**як використовувати? **

В опублікованому документі OpenAI сказано, що веб-сканер фільтруватиме джерела, які потребують платного доступу, а також видалятиме особисту інформацію (PII) або текст, який порушує його політику.

Дані, отримані GPTBot, використовуються для навчання GPT-4 або GPT-5, що може підвищити точність і можливості майбутніх систем штучного інтелекту.

Інструмент можна ідентифікувати за таким кодом:

Маркер агента користувача: GPTBotFull рядок агента користувача: Mozilla/5.0 AppleWebKit/537.36 (KHTML, як Gecko; сумісний; GPTBot/1.0; +

Заборонити доступ до GPTBot

З іншого боку, ви також можете заборонити GPTBot доступ до веб-сайтів, додавши його на сайт robots.txt.

Це означає, що власники веб-сайтів повинні добровільно вжити заходів, щоб заборонити OpenAI доступ до їхніх веб-сайтів і не використовувати власні дані для навчання.

Агент користувача: GPTBotDisallow: /

Користувацький доступ GPTBot

Ви також можете контролювати доступ GPTBot до певного вмісту веб-сайту за допомогою наступного коду.

Агент користувача: GPTBotAllow: /directory-1/Disallow: /directory-2/

IP Експорт

Для веб-сканера OpenAI веб-сайт буде викликано з блоку IP-адрес, записаних на веб-сайті OpenAI.

Гаряча дискусія користувачів мережі

Цей крок OpenAI викликав дискусії серед користувачів мережі щодо етичних питань веб-сканерів, які використовуються для навчання моделей ШІ.

"OpenAI навіть не цитує помірно. Він створює похідні роботи, а не цитує, таким чином приховуючи той факт, що він є".

Користувачі мережі сказали, що нарешті з’явився шанс перешкодити OpenAI захоплювати ваші мережеві дані для навчання моделі.

Також було висловлено припущення, що надбудову для браузера ChatGPT було видалено на деякий час, частково через те, що вона дозволяла доступ до контенту за платним доступом.

Деякий час тому OpenAI подала заявку на торговельну марку GPT-5 до Патентного відомства США 18 липня, припускаючи, що компанія навчає більш просунуту систему ШІ.

Очевидно, GPTBot допоможе OpenAI зібрати більше даних з Інтернету для навчання моделі.

Література:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити