За «Первым случаем кражи данных большой модели»

Текст: Чжу Лин

**Источник: **Финансовая ассоциация

Источник изображения: сгенерировано Unbounded AI‌

Когда компания OpenAI столкнулась с обвинением в «краже данных» и была активно вовлечена в многочисленные коллективные и индивидуальные судебные процессы, «первый случай кражи данных большой модели ИИ» в Китае был на грани разоблачения, но в конце концов обе стороны разрешили конфликт. недоразумение.Есть ли другая причина "недоразумения"?Есть секрет?

Недавно Bishen Composition, продукт для письма с помощью ИИ, в который инвестировала Century Tianhong, опубликовала заявление, в котором говорится, что 4 августа она решила перестать думать об обучении и возбудить судебный процесс против связанных с этим инцидентов с поиском данных. **

Bishen Composition заявила, что после тщательного расследования и откровенного общения с Xueersi обе стороны достигли соглашения по спорным условиям, две стороны устранили недоразумение и будут продолжать углублять сотрудничество для совместного продвижения разведки. технологий ИИ в сфере образования.

Репортер из «Kechuangban Daily» спросил Bishen Composition о причинах урегулирования и причине недоразумения. Соответствующее ответственное лицо сказало: «Инцидент был четко объяснен в заявлении, и никаких других ответов не будет».

Полтора раунда "воздушного крика"

Еще два месяца назад Penshen Composition опубликовала заявление во второй половине дня 13 июня, обвинив своего партнера Xueersi в «краже» данных инвентаризации состава для обучения готовящейся к выпуску крупномасштабной модели искусственного интеллекта. Bishen Composition заявила, что разрешит спор в судебном порядке, потребовав от Xueersi выплаты компенсации в размере 1 юаня, принесения публичных извинений, удаления просканированных данных и назвав это «первым случаем кражи данных большой модели ИИ» в Китае. **

Той ночью ** Сюэрси быстро ответил, что использование данных Bishen Composition входит в рамки нормального сотрудничества, согласованного в договоре между двумя сторонами, и «субъективные предположения» ** Bishen Composition «серьезно не соответствуют фактам».

14 июня Penshen Composition извлекла объемы вызовов и скриншоты журналов сервера, чтобы опровергнуть ответ Сюэрси, пытаясь доказать, что Сюэрси использовал технологию «краулера» для незаконного доступа и кэширования 2,58 миллиона данных на сервере приложения Penshen Composition всего за несколько дней. , это типичное поведение «сбора баз данных», которое серьезно нарушает права на данные Bishen Composition.

После этого Сюэрси не дал публичного ответа.Репортер «Kechuangban Daily» позвонил в материнскую компанию Сюэрси, TAL, для интервью, но сотрудники телеграфной службы отказались перевести репортера в соответствующий отдел.

20 июня Шиджи Тяньхун, второй акционер компании Beijing Yi Yi Liang Hua Technology Co., Ltd., принадлежащей Pen God, заявил на интерактивной платформе, что компания также обращает внимание на ход инцидента. Ранее из-за упоминания Bishen Composition на интерактивной платформе цена акций Century Tianhong выросла более чем на 100% в течение 10 торговых дней подряд с 24 апреля.

Откуда берутся 5 миллионов композиционных материалов

Еще в 2019 году Blue Media Exchange задала Сун Цзявэю, основателю Penshen Composition, вопрос: **Как решить проблему авторского права огромного количества данных информационного контента, накопленных за кулисами Penshen? **

Сун Цзявэй тогда откровенно сказал, что общается и сотрудничает с некоторыми правообладателями. Кроме того, команда Pen God изо всех сил старается собирать материалы для общественных работ, такие как стихи и известные цитаты. **Автор этого отчета предсказал, что проблема авторских прав может стать долгосрочной проблемой для Pen God в будущем. **

Данные как один из основных элементов ИИ, согласно Penshen Composition и Shiji Tianhong, накопили более 5 миллионов композиционных материалов.

Century Tianhong ранее заявлял на интерактивной платформе, что большие данные Penshen Composition поступают из собственного накопления, а модель алгоритма разработана и обучена компанией самостоятельно.

8 мая Шэньчжэньская фондовая биржа направила Шиджи Тяньхуну письмо с обеспокоенностью, ** в котором просила объяснить, предоставила ли компания данные, необходимые для обучения модели искусственного интеллекта «Pen Shen Composition» для одного и двух штрихов; если это так, его необходимо объединить с соответствующей информацией компании. Метод и источник получения данных и т. д., в соответствии с «Законом о безопасности данных» и другими соответствующими нормативными актами, объяснить законность получения, обработки и использования соответствующих данных; ясно ли право собственности на соответствующие активы данных, есть ли потенциальные споры, есть ли другие соглашения сторон и договоренности о льготах.

В ответ на письмо с обеспокоенностью Century Tianhong заявила, что было проверено, что все данные, необходимые для обучения модели искусственного интеллекта «Pen Shen Composition», накапливаются в ходе ее собственного бизнеса. До сих пор компания не предоставляла услуги клиентам, использующим «Pen Shen Composition», и не предоставляла Ии Ляншу данные, необходимые для обучения модели искусственного интеллекта «Pen Shen Composition». В будущем, если возникнет потребность в закупке данных для обучения модели искусственного интеллекта «Pen Shen Composition» одним и двумя штрихами, компания будет строго следовать «Закону о безопасности данных» и другим соответствующим правилам, чтобы гарантировать, что получение, обработка и использование соответствующих данных являются законными, а права собственности на активы данных ясны., При условии отсутствия потенциальных споров, проведите переговоры, чтобы определить конкретный метод делового сотрудничества.

Bishen Composition сообщила репортеру Kechuangban Daily: ** «Когда пользователи используют наши услуги в приложении Bishen Composition, согласно соглашению, мы будем накапливать большое количество оригинальных композиционных материалов пользователей и становимся нашими активами». ** Это Это также причина, по которой Xueersi сотрудничает с нами.Если Xueersi накапливает данные с нуля, затраты времени очень высоки, и нет возможности накапливать данные того же порядка в краткосрочной перспективе».

Репортер «Kechuangban Daily» заметил, что в соответствии с соглашением об обслуживании пользователей Pen God Composition контент, публикуемый пользователями в Pen God Composition, предоставляет Pen God Composition бесплатную и безотзывную неисключительную лицензию.

**Кто именно чью композицию скопировал? **

Ван Хаосюань, только что окончивший университет, сказал репортеру «Kechuangban Daily», что когда он искал свое имя в Интернете на втором курсе, он обнаружил, что композиция, которую он написал в младших классах средней школы, появилась на платформе композиции penshen. **

Ван Хаосюань сказал, что сочинение было рекомендовано учителем младших классов средней школы для публикации во внутреннем журнале, который не издается публично, и что он потратил много усилий на его написание. Он был зол на то, что Penshen Composition использовала его композицию без его разрешения.

Ван Хаосюань считает, что это нарушило право на распространение информации о его произведениях в Интернете. Он провел переговоры с сотрудниками Penshen Composition, но отношение другой стороны было не очень хорошим, он только удалил состав и перестал отвечать на сообщение. На адвокатское письмо, которое он поручил отправить адвокату в Бишенскую композицию, ответа не последовало.

Ван Хаосюань решил подать в суд на Bishen Composition, чтобы защитить свои права, и дело было возбуждено судом. Только за неделю до суда с ним связался адвокат Bishen Composition, надеясь на примирение. Адвокат сказал, что статья была размещена кем-то другим на веб-сайте Bishen Composition, и что Bishen Composition несет ответственность только за ее размещение.

После посредничества судьи Ван Хаосюань и Bishen Composition наконец пришли к соглашению, и Ван Хаосюань получил компенсацию.

Однако Ван Хаосюань предположил, что его статья может быть гораздо больше, чем та, которая нарушает состав кисти, но об этом не знает больше людей. Более того, платформа Bishen Composition ориентирована на учащихся начальных и средних классов, и даже если они знают, что их статьи были нарушены, у них может не быть достаточной осведомленности для защиты своих прав.

Репортер из «Kechuangban Daily» обнаружил, что, когда Bishen Composition обвинила Сюэ Эрси, в приложении Bishen Composition было большое количество композиций по сравнению с исходным текстом, и не отображалась такая информация, как автор и время выпуска. ** Репортеры сравнили и обнаружили, что эти композиции были опубликованы на некоммерческих веб-сайтах, таких как Xiaohe Composition. **

Изображение слева представляет собой композицию, связанную с нарушением прав, а изображение справа — оригинальную композицию.

В связи с этим Penshen Composition ответила репортеру «Kechuangban Daily» в то время, сказав: «Для авторов нормально вносить более одной рукописи. Эти статьи загружаются пользователями, и пользователи несут ответственность за авторские права и подлинность статей. Если кто-то еще выдвинет возражения против авторских прав на статью и представит доказательства, мы удалим ее в соответствии с законом после предварительной проверки. Статья является ранней статьей, и отображение на тот момент было не идеальным."

Однако Xiaohe Composition.com сообщил репортеру «Kechuangban Daily»: «Если композиции, появляющиеся на других веб-сайтах, публикуются Xiaohe Composition. Вначале все они были станциями сбора, начиная с копирования статей из Xiaohe Composition Network, ** но поскольку процесс слишком громоздкий, защита прав отсутствует».

На странице описания авторских прав Xiaohe Composition.com указано: "Авторские права на композицию, опубликованную Xiaohe Composition.com, принадлежат автору, и любые онлайн-СМИ запрещены к перепечатке. Перепечатка другими бумажными СМИ должна быть получена с согласия этого сайта и заплатите автору. Серьезное предупреждение небольшому количеству веб-сайтов и компаний-разработчиков программного обеспечения, немедленно прекратите копирование содержимого этого сайта».

Мэн Бо, юрист пекинской юридической фирмы Jingshi, сообщил репортеру «Kechuangban Daily», что произведения, упомянутые в Законе об авторском праве, относятся к интеллектуальным достижениям, которые являются оригинальными в области литературы, искусства и науки и могут быть воспроизведены в некоторых материальная форма. Согласно статье 6 «Положения об авторском праве», авторское право возникает с момента завершения создания произведения. Авторское право авторов литературных, художественных и научных произведений, а также права и интересы, связанные с авторским правом, охраняются законом. Согласно положениям статьи 52 «Закона об авторском праве» лица, нарушающие авторские права и смежные с ними права, в зависимости от обстоятельств несут гражданско-правовую ответственность в виде прекращения нарушения, устранения последствий, принесения извинений и возмещения убытков.

После «обезвоживания» данных состав значительно уменьшается

Репортер из «Kechuangban Daily» обнаружил, что вышеупомянутая композиция, связанная с нарушением прав, исчезла из результатов поиска приложения Bishen Composition, а открытие ссылки для обмена также показывает, что «композиция была удалена с полок, потому что она не оригинал." **

**Однако после того, как данные были «обезвожены», количество эссе в приложении Bishenzuowen значительно уменьшилось.**Корреспондент «Kechuangban Daily» провел поиск по некоторым поисковым словам на снимке экрана журнала доступа Xueersi, ранее показанном Bishenzuowen, Xueersi ранее посещал несколько страниц с высокочастотными поисковыми запросами (Bishen Composition сказал, что каждая страница будет возвращать 30 результатов поиска), и в настоящее время в результатах поиска остались только одна или две композиции.

Однако Penshen Composition не изменила введение, касающееся количества композиций, и стоимость членства не уменьшилась, а увеличилась. Стоит отметить, что эксклюзивная привилегия «Изменение композиций за секунды», предоставляемая Penshen Composition членам, предположительно позволяет создавать новые композиции путем «стирки рукописей одним щелчком мыши».

Стоимость годового членства в Penshen Composition увеличилась по сравнению с двумя месяцами ранее.

Кроме того, приложение Penshen Composition было названо и уведомлено Государственным управлением киберпространства Китая в сентябре 2020 года за распространение плохо ориентированной и вульгарной информации. Согласно «Net Letter China», в то время в колонке «Family Square» приложения Penshen Composition APP было много групп поддержки знаменитостей, и на платформе было большое количество «мужского и женского» и «любовного» контента. это не способствует физическому и психическому здоровью несовершеннолетних. Репортер заметил, что в настоящее время в Pen God Composition нет групп или связанного контента.

Pen God Composition также заявила в своем заявлении, что продолжит усиливать регулирование и защиту использования данных, чтобы обеспечить безопасное и надлежащее использование данных пользователями, партнерами и компаниями.

** После бурного роста, высококачественных данных и построения соответствия или неизбежного выбора для изучения модели APP и отраслевого искусственного интеллекта, чтобы перейти на зрелую стадию. **

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить