Несколько дней назад Google неожиданно обновила свою политику конфиденциальности, дав понять, что будет использовать все общедоступные данные в Интернете для обучения собственной модели ИИ.
Другими словами, в соответствии с новой политикой Google может сканировать любую информацию, которую вы публикуете в Интернете, включая, помимо прочего, ваши сообщения, ключевые слова, которые вы ищете, и видео, которые вы смотрите.
Разве это не уместная интернет-полоса!
Вскоре после того, как на OpenAI подали в суд за нарушение прав данных, Google поспешила ударить по пистолету.
На данном этапе есть большая вероятность, что это никак не связано с платой за передачу данных.Если Google не соберет эту волну бесплатной шерсти, очень вероятно, что он не сможет собрать ее в будущем. **
Это дело никогда не прекращалось с тех пор, как ChatGPT стал популярным.
Сначала Шичао расскажет вам, ребята, временную шкалу.
В марте этого года Маск впервые выступил против платы за передачу данных, заявив, что API-интерфейс Twitter больше не является бесплатным.
Сразу после этого Reddit, американская версия почтовой панели, больше не могла этого выносить.
В прошлом месяце кампания Reddit «затемнение» была протестом против официальной политики взимания платы с API.
Когда Шичао писал об этом ранее, он все еще гадал, пойдут ли в конце концов чиновники Reddit на уступки.
Судя по текущим наблюдениям, было подтверждено, что большая часть стороннего программного обеспечения отключена, и Reddit намерен взимать плату за данные.
В течение этого периода времени Twitter снова скорректировал ограничение скорости: аккаунты, которые не тратят деньги на аутентификацию, могут читать только 600 сообщений в день.Цель также состоит в том, чтобы предотвратить захват пользовательских данных роботами.
Так ли ценны данные?
Ши Чао чувствовал, что это все еще вина ** ИИ. **
Если большая модель ИИ хочет стать умнее, ей нужен постоянный поток данных для «подпитки».
Те, кто сейчас может делать большие модели, либо имеют свои данные, такие как Baidu, Ali и Tencent, либо сканируют чужие данные, вот имя OpenAI.
Поскольку многие веб-сайты имеют открытые и бесплатные интерфейсы API, такие гиганты, как Microsoft и OpenAI, получили возможность.
Но сегодняшний день отличается от прошлого: после того, как ИИ вновь наделил ценностью данных, платформы с чипами в руках, конечно же, абсолютно не желают заниматься проституцией понапрасну. **
Даже генеральный директор Reddit Хоффман дал понять: он просто не хочет предоставлять данные гигантам бесплатно.
Поэтому преследование OpenAI, вероятно, связано с тем, что платформы объединились, чтобы «убивать кур и обезьян» и лечить нездоровые тенденции ИИ.
Однако трудно сказать, будет ли на этот раз закон на стороне OpenAI.
Поскольку авторское право на данные включает в себя 3 ключевых вопроса:
**1. Законно ли поведение самого поискового робота? **
**2. Защищены ли данные авторским правом? **
**3. Защищены ли произведения, созданные на основе данных, авторским правом? **
Прежде всего, первый вопрос, для получения данных есть не что иное, как оплата покупок, либо сбор общедоступных данных в Интернете.
Однако следует отметить, что раскрытие данных не приравнивается к санкционированному использованию, а также зависит от наличия на веб-сайте соответствующих положений, ограничивающих поведение сканеров данных.
Если согласие владельца авторских прав превышено напрямую или данные получены принудительно в обход ограничений веб-сайта, это является преступлением в виде незаконного получения данных компьютерной информационной системы.
Даже если OpenAI утверждает, что сканирует данные с общедоступных веб-сайтов, законность самого поведения сканирования данных зависит от того, дал ли владелец авторских прав разрешение.
Во-вторых, о том, защищены ли сами данные авторским правом.
Согласно закону об авторском праве США, если данные, используемые для обучения модели ИИ, подпадают под действие «добросовестного использования», это не будет являться нарушением.
Но проблема заключается в этом «добросовестном использовании».
Составляющие элементы «добросовестного использования» включают в себя, связано ли коммерческое использование, защищено ли само произведение законом об авторском праве, количество используемых частей и влияние на само произведение после использования.
Подобно новостным репортажам и академическим исследованиям, уместные цитаты вполне допустимы.
Может ли использование данных сотен миллионов уровней в моделях ИИ и коммерческом программном обеспечении ИИ по-прежнему считаться «добросовестным использованием»?
Наконец, существует проблема авторского права на работы, созданные ИИ.
Поскольку авторские права на обучающие данные неясны, контент, созданный ИИ, естественно, будет иметь споры об авторских правах. Несколько дней назад Steam также удалил игру, созданную с помощью AIGC, на том основании, что возникла проблема с авторскими правами.
Возьмем в качестве примера рисование ИИ. Генерация изображения эквивалентна процессу разделения и реорганизации. Хотя конечный результат является совершенно «новым», он все же сохраняет некоторые характеристики тренировочного изображения.
Однако расценивать такую ситуацию как нарушение или нет, в разных странах существуют разные мнения.
Поскольку обучающие данные принадлежат другим лицам, Бюро регистрации авторских прав США определило, что работы, созданные с помощью ИИ, не защищены законом об авторском праве и даже могут нарушать авторские права.
Позиция японского правительства совершенно иная, заявив, что японское законодательство не защищает авторские права на данные, используемые для обучения ИИ.
По крайней мере, в рамках действующей законодательной базы трудно получить единый ответ на поставленные выше вопросы.
Поскольку надзор недостаточно силен, у правообладателя нет иного выбора, кроме как сделать это самому.
▼Документы, поданные в суд на OpenAI
Можно предвидеть, что после Twitter и Reddit может появиться больше сторон, защищающих авторские права, воздвигающих высокие стены.
Это дело для платформы, конечно, новый способ заработка, какими бы плохими ни были технологические гиганты, они потратят больше денег.
Но для интернета в целом это нехорошо.
В то время Интернет родился с геном открытого обмена, таким как Википедия и Твиттер, которые круглый год бесплатно предоставляли API-интерфейсы, что делало разработчикам очень удобным обращение к данным.
Но сейчас, если разрешить такие тарифы на передачу данных, трудно сказать, каков будет результат.
В конце концов, у мелких разработчиков нет возможности платить огромные сборы за передачу данных, и если инновации происходят только у гигантов, разве это не чистая монополия?
Самое главное, что многие веб-сайты, которые можно посмотреть бесплатно сейчас, возможно, придется просмотреть позже, что является настоящим критом для обычных пользователей, таких как мы.
На самом деле, плата за передачу данных не может быть полностью возложена на платформу, это действительно заставляет гигантов ИИ бояться «грабить», что является беспомощным шагом для самозащиты.
Хотя на этот раз у Google есть «политика конфиденциальности», трудно сказать, каков будет результат.
Поэтому ключ в том, чтобы увидеть, когда упадет кувалда надзора.
Уточнение авторских прав на данные — это препятствие, которого нельзя избежать в развитии ИИ, и теперь, похоже, оно также связано с будущим направлением Интернета.
Интересно, подтолкнет ли нас ИИ-корабль в более открытую или закрытую эру?
Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Пусть крупные ИИ-компании вот так «воруют», мы можем не увидеть бесплатных сайтов
Первоисточник: Плохой обзор
Несколько дней назад Google неожиданно обновила свою политику конфиденциальности, дав понять, что будет использовать все общедоступные данные в Интернете для обучения собственной модели ИИ.
Вскоре после того, как на OpenAI подали в суд за нарушение прав данных, Google поспешила ударить по пистолету.
Это дело никогда не прекращалось с тех пор, как ChatGPT стал популярным.
Сначала Шичао расскажет вам, ребята, временную шкалу.
В марте этого года Маск впервые выступил против платы за передачу данных, заявив, что API-интерфейс Twitter больше не является бесплатным.
В прошлом месяце кампания Reddit «затемнение» была протестом против официальной политики взимания платы с API.
В течение этого периода времени Twitter снова скорректировал ограничение скорости: аккаунты, которые не тратят деньги на аутентификацию, могут читать только 600 сообщений в день.Цель также состоит в том, чтобы предотвратить захват пользовательских данных роботами.
Ши Чао чувствовал, что это все еще вина ** ИИ. **
Те, кто сейчас может делать большие модели, либо имеют свои данные, такие как Baidu, Ali и Tencent, либо сканируют чужие данные, вот имя OpenAI.
Поскольку многие веб-сайты имеют открытые и бесплатные интерфейсы API, такие гиганты, как Microsoft и OpenAI, получили возможность.
Даже генеральный директор Reddit Хоффман дал понять: он просто не хочет предоставлять данные гигантам бесплатно.
Однако трудно сказать, будет ли на этот раз закон на стороне OpenAI.
**1. Законно ли поведение самого поискового робота? **
**2. Защищены ли данные авторским правом? **
**3. Защищены ли произведения, созданные на основе данных, авторским правом? **
Прежде всего, первый вопрос, для получения данных есть не что иное, как оплата покупок, либо сбор общедоступных данных в Интернете.
Однако следует отметить, что раскрытие данных не приравнивается к санкционированному использованию, а также зависит от наличия на веб-сайте соответствующих положений, ограничивающих поведение сканеров данных.
Во-вторых, о том, защищены ли сами данные авторским правом.
Согласно закону об авторском праве США, если данные, используемые для обучения модели ИИ, подпадают под действие «добросовестного использования», это не будет являться нарушением.
Но проблема заключается в этом «добросовестном использовании».
Подобно новостным репортажам и академическим исследованиям, уместные цитаты вполне допустимы.
Может ли использование данных сотен миллионов уровней в моделях ИИ и коммерческом программном обеспечении ИИ по-прежнему считаться «добросовестным использованием»?
Наконец, существует проблема авторского права на работы, созданные ИИ.
Поскольку авторские права на обучающие данные неясны, контент, созданный ИИ, естественно, будет иметь споры об авторских правах. Несколько дней назад Steam также удалил игру, созданную с помощью AIGC, на том основании, что возникла проблема с авторскими правами.
Поскольку обучающие данные принадлежат другим лицам, Бюро регистрации авторских прав США определило, что работы, созданные с помощью ИИ, не защищены законом об авторском праве и даже могут нарушать авторские права.
Позиция японского правительства совершенно иная, заявив, что японское законодательство не защищает авторские права на данные, используемые для обучения ИИ.
▼Документы, поданные в суд на OpenAI
Это дело для платформы, конечно, новый способ заработка, какими бы плохими ни были технологические гиганты, они потратят больше денег.
В то время Интернет родился с геном открытого обмена, таким как Википедия и Твиттер, которые круглый год бесплатно предоставляли API-интерфейсы, что делало разработчикам очень удобным обращение к данным.
В конце концов, у мелких разработчиков нет возможности платить огромные сборы за передачу данных, и если инновации происходят только у гигантов, разве это не чистая монополия?
Самое главное, что многие веб-сайты, которые можно посмотреть бесплатно сейчас, возможно, придется просмотреть позже, что является настоящим критом для обычных пользователей, таких как мы.
Поэтому ключ в том, чтобы увидеть, когда упадет кувалда надзора.
Уточнение авторских прав на данные — это препятствие, которого нельзя избежать в развитии ИИ, и теперь, похоже, оно также связано с будущим направлением Интернета.
Интересно, подтолкнет ли нас ИИ-корабль в более открытую или закрытую эру?