Кілька днів тому Google раптово оновив свою політику конфіденційності, давши зрозуміти, що він використовуватиме всі публічні дані в Інтернеті для навчання власної моделі ШІ.
Іншими словами, згідно з новою політикою Google може сканувати будь-яку інформацію, яку ви публічно публікуєте в Інтернеті, включаючи, але не обмежуючись, ваші публікації, ключові слова, які ви шукаєте, і відео, які ви переглядаєте.
Хіба це не доречний інтернет-стрік!
Незабаром після того, як на OpenAI було подано позов за порушення прав на дані, Google поспішив вдарити по рушниці.
На даному етапі існує висока ймовірність того, що це не має нічого спільного з платою за передачу даних. Якщо Google не збере цю хвилю безкоштовної вовни, дуже ймовірно, що він не зможе зібрати її в майбутньому. **
Ця справа ніколи не припинялася з тих пір, як ChatGPT став популярним.
Shichao спочатку дасть вам короткий виклад хронології.
У березні цього року Маск взяв на себе ініціативу в першому спробі стягнути плату за передачу даних, заявивши, що інтерфейс API Twitter більше не є безкоштовним.
Одразу після цього Reddit, американська версія поштової панелі, не витримала.
Минулого місяця кампанія Reddit «затемнення» була протестом проти офіційної політики тарифікації API.
Коли Шічао писав про це раніше, він все ще здогадувався, чи підуть представники Reddit зрештою на поступки.
Судячи з поточних подальших дій, було підтверджено, що більшість стороннього програмного забезпечення закрито, і Reddit має намір стягувати плату за дані.
У цей період Twitter знову відкоригував ліміт швидкості. Облікові записи, які не витрачають гроші на автентифікацію, можуть читати лише 600 публікацій на день. Мета також полягає в тому, щоб запобігти роботам захоплювати дані користувачів.
Невже дані такі цінні?
Ші Чао вважав, що в цьому все ще винен **AI. **
Якщо велика модель ШІ хоче стати розумнішою, їй потрібен постійний потік даних для «живлення».
Ті, хто зараз може створювати великі моделі, або мають власні дані, такі як Baidu, Ali та Tencent, або сканують чужі дані, ось ім’я OpenAI.
Оскільки багато веб-сайтів мають відкриті та безкоштовні інтерфейси API, такі гіганти, як Microsoft і OpenAI, отримали таку можливість.
Але сьогоднішній день відрізняється від минулого.Після того, як штучний інтелект відновить цінність даних, платформи з чіпами в руках, звичайно, абсолютно не бажають бути проститутованими за безцінь. **
Навіть генеральний директор Reddit Хоффман дав зрозуміти: він просто не хоче надавати дані гігантам безкоштовно.
Тому судове переслідування OpenAI, ймовірно, пов’язане з тим, що платформи об’єдналися, щоб «вбивати курей і мавп» і лікувати нездорові тенденції ШІ.
Однак, чи стане цього разу закон на боці OpenAI, сказати важко.
Оскільки авторське право на дані включає 3 ключові питання:
**1. Чи законна поведінка самого сканера даних? **
**2 Чи дані захищені авторським правом? **
**3. Чи захищені авторським правом роботи, створені з даних? **
Перш за все, перше питання, щоб отримати дані, це не що інше, як оплата покупок або збір загальнодоступних даних в Інтернеті.
Однак слід зазначити, що розголошені дані не є авторизованим використанням, і це також залежить від того, чи є на веб-сайті відповідні положення, які обмежують поведінку сканерів даних.
Якщо безпосередньо перевищено згоду власника авторських прав або дані отримано примусово в обхід обмежень веб-сайту, незаконне отримання даних комп’ютерної інформаційної системи вважається злочином.
Навіть якщо OpenAI стверджує, що сканує дані з загальнодоступних веб-сайтів, чи є сама поведінка сканування даних законною, залежить від того, чи надав власник авторських прав дозвіл.
По-друге, про те, чи самі дані є об’єктом авторського права.
Відповідно до закону про авторське право США, якщо дані, які використовуються для навчання моделі ШІ, підпадають під сферу «добросовісного використання», це не вважатиметься порушенням.
Але проблема полягає в цьому «добросовісному використанні».
Складові елементи «добросовісного використання» включають, чи йдеться про комерційне використання, чи захищено сам твір законом про авторське право, кількість використаних частин і вплив на сам твір після використання.
Подібно до новинних повідомлень і наукових досліджень, відповідні цитати цілком допустимі.
Чи може використання даних сотень мільйонів рівнів на моделях штучного інтелекту та комерційному програмному забезпеченні штучного інтелекту все ще вважатися «добросовісним використанням»?
Нарешті, існує проблема авторського права на створені твори ШІ.
Оскільки авторські права на навчальні дані невідомі, вміст, створений штучним інтелектом, природно матиме суперечки щодо авторських прав. Кілька днів тому Steam також видалив гру, згенеровану за допомогою AIGC, на тій підставі, що була проблема з авторським правом.
Візьмемо як приклад малювання штучним інтелектом. Генерація зображення еквівалентна процесу поділу та реорганізації. Хоча кінцевий результат абсолютно «новий», він все ще зберігає деякі характеристики тренувального зображення.
Проте, чи вважати цю ситуацію порушенням чи ні, у різних країнах існують різні думки.
Оскільки навчальні дані належать іншим особам, Бюро захисту авторських прав США визначило, що створені штучним інтелектом твори не захищені законом про авторські права та можуть навіть порушувати авторські права.
Ставлення японського уряду зовсім інше, кажучи, що японське законодавство не захищає авторські права на дані, які використовуються для навчання ШІ.
Принаймні за чинної законодавчої бази важко отримати єдину відповідь на вищезазначені запитання.
Оскільки нагляд недостатньо сильний, власник авторських прав не має іншого вибору, окрім як зробити це сам.Якщо потрібно стягнути плату, ту, яку потрібно повернути, потрібно повернути швидко.
▼Документи, на які подали позов OpenAI
Можна передбачити, що після Twitter і Reddit може з’явитися більше партій, які захищають авторські права на вміст і зводять високі стіни.
Для платформи це, звичайно, новий спосіб заробляти гроші.Незалежно від того, наскільки погані технологічні гіганти, вони витрачатимуть більше грошей.
Але для Інтернету в цілому це не дуже добре.
У той час Інтернет народився з геном відкритого обміну, наприклад Wikipedia і Twitter, які надавали інтерфейси API безкоштовно цілий рік, що робило розробникам дуже зручним виклик даних.
Але тепер, якщо дозволити так запровадити плату за передачу даних, важко сказати, яким буде результат.
Зрештою, дрібні розробники не мають можливості платити величезні збори за передачу даних. Якщо інновації відбуваються лише у гігантів, хіба це не чиста монополія?
Найголовніше те, що багато веб-сайтів, які зараз можна переглянути безкоштовно, можливо, доведеться переглянути пізніше. Це справжня критика для звичайних користувачів, таких як ми.
Насправді плату за передачу даних не можна повністю звинувачувати в платформі. Це дійсно змушує гігантів ШІ боятися «пограбування», що є безпорадним кроком для самозахисту.
Хоча цього разу у Google є «політика конфіденційності», важко сказати, яким буде результат.
Тому головне – побачити, коли впаде кувалда нагляду.
Уточнення авторських прав на дані є перешкодою, якої неможливо уникнути при розробці штучного інтелекту, і тепер вона, здається, також пов’язана з майбутнім напрямком розвитку Інтернету.
Цікаво, корабель ШІ підштовхне нас до більш відкритої чи закритої ери?
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Нехай великі AI-компанії так «крадуть», можливо, ми не побачимо безкоштовних сайтів
Джерело оригіналу: Bad review
Кілька днів тому Google раптово оновив свою політику конфіденційності, давши зрозуміти, що він використовуватиме всі публічні дані в Інтернеті для навчання власної моделі ШІ.
Незабаром після того, як на OpenAI було подано позов за порушення прав на дані, Google поспішив вдарити по рушниці.
Ця справа ніколи не припинялася з тих пір, як ChatGPT став популярним.
Shichao спочатку дасть вам короткий виклад хронології.
У березні цього року Маск взяв на себе ініціативу в першому спробі стягнути плату за передачу даних, заявивши, що інтерфейс API Twitter більше не є безкоштовним.
Минулого місяця кампанія Reddit «затемнення» була протестом проти офіційної політики тарифікації API.
У цей період Twitter знову відкоригував ліміт швидкості. Облікові записи, які не витрачають гроші на автентифікацію, можуть читати лише 600 публікацій на день. Мета також полягає в тому, щоб запобігти роботам захоплювати дані користувачів.
Ші Чао вважав, що в цьому все ще винен **AI. **
Ті, хто зараз може створювати великі моделі, або мають власні дані, такі як Baidu, Ali та Tencent, або сканують чужі дані, ось ім’я OpenAI.
Оскільки багато веб-сайтів мають відкриті та безкоштовні інтерфейси API, такі гіганти, як Microsoft і OpenAI, отримали таку можливість.
Навіть генеральний директор Reddit Хоффман дав зрозуміти: він просто не хоче надавати дані гігантам безкоштовно.
Однак, чи стане цього разу закон на боці OpenAI, сказати важко.
**1. Чи законна поведінка самого сканера даних? **
**2 Чи дані захищені авторським правом? **
**3. Чи захищені авторським правом роботи, створені з даних? **
Перш за все, перше питання, щоб отримати дані, це не що інше, як оплата покупок або збір загальнодоступних даних в Інтернеті.
Однак слід зазначити, що розголошені дані не є авторизованим використанням, і це також залежить від того, чи є на веб-сайті відповідні положення, які обмежують поведінку сканерів даних.
По-друге, про те, чи самі дані є об’єктом авторського права.
Відповідно до закону про авторське право США, якщо дані, які використовуються для навчання моделі ШІ, підпадають під сферу «добросовісного використання», це не вважатиметься порушенням.
Але проблема полягає в цьому «добросовісному використанні».
Подібно до новинних повідомлень і наукових досліджень, відповідні цитати цілком допустимі.
Чи може використання даних сотень мільйонів рівнів на моделях штучного інтелекту та комерційному програмному забезпеченні штучного інтелекту все ще вважатися «добросовісним використанням»?
Нарешті, існує проблема авторського права на створені твори ШІ.
Оскільки авторські права на навчальні дані невідомі, вміст, створений штучним інтелектом, природно матиме суперечки щодо авторських прав. Кілька днів тому Steam також видалив гру, згенеровану за допомогою AIGC, на тій підставі, що була проблема з авторським правом.
Оскільки навчальні дані належать іншим особам, Бюро захисту авторських прав США визначило, що створені штучним інтелектом твори не захищені законом про авторські права та можуть навіть порушувати авторські права.
Ставлення японського уряду зовсім інше, кажучи, що японське законодавство не захищає авторські права на дані, які використовуються для навчання ШІ.
▼Документи, на які подали позов OpenAI
Для платформи це, звичайно, новий спосіб заробляти гроші.Незалежно від того, наскільки погані технологічні гіганти, вони витрачатимуть більше грошей.
У той час Інтернет народився з геном відкритого обміну, наприклад Wikipedia і Twitter, які надавали інтерфейси API безкоштовно цілий рік, що робило розробникам дуже зручним виклик даних.
Зрештою, дрібні розробники не мають можливості платити величезні збори за передачу даних. Якщо інновації відбуваються лише у гігантів, хіба це не чиста монополія?
Найголовніше те, що багато веб-сайтів, які зараз можна переглянути безкоштовно, можливо, доведеться переглянути пізніше. Це справжня критика для звичайних користувачів, таких як ми.
Тому головне – побачити, коли впаде кувалда нагляду.
Уточнення авторських прав на дані є перешкодою, якої неможливо уникнути при розробці штучного інтелекту, і тепер вона, здається, також пов’язана з майбутнім напрямком розвитку Інтернету.
Цікаво, корабель ШІ підштовхне нас до більш відкритої чи закритої ери?