За «першим випадком крадіжки великих модельних даних»

Текст: Zhu Ling

**Джерело: **Фінансова асоціація

Джерело зображення: створено Unbounded AI‌

Коли OpenAI зіткнувся з звинуваченням у «злодії даних» і був залучений у численні колективні та індивідуальні позови, «перший випадок крадіжки даних великої моделі штучного інтелекту» в Китаї був на межі вибуху, але врешті обидві сторони вирішили проблему. непорозуміння. Чи є якась інша причина "непорозуміння"? Є секрет?

Нещодавно Bishen Composition, продукт для написання на основі штучного інтелекту, інвестований компанією Century Tianhong, опублікував заяву, в якій говориться, що 4 серпня він вирішив припинити думати про навчання та розпочати судовий процес проти пов’язаних інцидентів із пошуком даних. **

Bishen Composition заявив, що після поглибленого розслідування та відвертого спілкування з Xueersi обидві сторони досягли згоди щодо спірних умов, обидві сторони усунули непорозуміння і продовжуватимуть поглиблювати співпрацю та спільно сприяти розвідці. технології ШІ у сфері освіти .

Репортер "Kechuangban Daily" запитав Bishen Composition про причини угоди та причину непорозуміння. Відповідна відповідальна особа сказала: "Інцидент було чітко пояснено в заяві, і жодних інших відповідей не буде".

Півтора раунди "повітряного крику"

Повертаючись до двох місяців тому, Penshen Composition оприлюднила заяву вдень 13 червня, звинувативши свого партнера Xueersi у «крадіжці» інвентарних даних композиції для навчання майбутньої великомасштабної моделі продукту AI. Bishen Composition заявила, що вирішить суперечку через судові процедури, вимагаючи від Xueersi виплати 1 юаня компенсації, публічних вибачень, видалення просканованих даних і називає це «першим випадком крадіжки даних великої моделі ШІ» в Китаї. **

Тієї ночі ** Xueersi швидко відповів, що використання даних Bishen Composition підпадає в рамки нормальної співпраці, узгодженої в контракті між двома сторонами, і ** «суб’єктивні припущення» Bishen Composition «серйозно не відповідають фактам».

14 червня Penshen Composition вилучила обсяги викликів і скріншоти серверних журналів, щоб спростувати відповідь Xueersi, намагаючись довести, що Xueersi використовував технологію «сканера» для незаконного доступу та кешування 2,58 мільйонів даних на сервері Penshen’s Composition APP всього за кілька днів. , це типова поведінка «підбирання баз даних», яка серйозно порушує права на дані Bishen Composition.

Після цього Xueersi не зробив публічної відповіді. Репортер "Kechuangban Daily" викликав материнську компанію Xueersi TAL для інтерв'ю, але персонал електропроводки відмовився перевести репортера до відповідного відділу.

20 червня Шидзі Тяньхун, другий акціонер компанії Beijing Yi Yi Liang Hua Technology Co., Ltd., яка належить Pen God, заявив на інтерактивній платформі, що компанія також звертає увагу на хід інциденту. Раніше через згадування Bishen Composition на інтерактивній платформі ціна акцій Century Tianhong зросла більш ніж на 100% протягом 10 торгових днів поспіль з 24 квітня.

Звідки беруться 5 мільйонів композиційних матеріалів

Ще в 2019 році Blue Media Exchange поставив Сон Цзявею, засновнику Penshen Composition, запитання: **Як вирішити проблему авторського права на величезну кількість інформативного контенту, накопиченого за лаштунками Penshen? **

Сонг Цзявей тоді відверто сказав, що спілкувався та співпрацював з деякими власниками авторських прав. Крім того, команда Pen God намагається зібрати матеріали для громадських робіт, такі як вірші та відомі цитати. **Автор цього звіту передбачив, що проблема з авторським правом може стати довгостроковою проблемою для Pen God у майбутньому. **

За даними Penshen Composition і Shiji Tianhong, дані як один із основних елементів штучного інтелекту накопичили понад 5 мільйонів композиційних матеріалів.

Раніше Century Tianhong заявляв на інтерактивній платформі, що великі дані Penshen Composition надходять із власного накопичення, а модель алгоритму самостійно розробляє та навчає компанія.

8 травня Шеньчженьська фондова біржа надіслала Shiji Tianhong лист із занепокоєнням, ** у якому просила пояснити, чи надала компанія дані, необхідні для навчання моделі AI «Pen Shen Composition» для одного та двох ударів; якщо так, то її потрібно об’єднати з відповідною інформацією компанії. Метод і джерело отримання даних тощо, відповідно до «Закону про безпеку даних» та інших відповідних нормативних актів, пояснити законність отримання, обробки та використання відповідних даних; чи зрозуміло право власності на відповідні активи даних, чи існують потенційні суперечки, чи існують угоди з іншими сторонами та домовленості про переваги.

У відповідь на лист із занепокоєнням компанія Century Tianhong заявила, що було підтверджено, що всі дані, необхідні для навчання моделі штучного інтелекту «Pen Shen Composition», накопичуються в ході її власної діяльності. До цього часу компанія не надавала послуг клієнтам, які використовують «Pen Shen Composition», а також не надала Yiyi Liangshu дані, необхідні для навчання моделі ШІ «Pen Shen Composition». У майбутньому, якщо виникне попит на закупівлю даних для навчання моделі штучного інтелекту «Композиція Pen Shen» з одним і двома штрихами, компанія суворо дотримуватиметься «Закону про безпеку даних» та інших відповідних норм, щоб гарантувати, що отримання відповідних даних, обробка та використання є законними, а права власності на активи даних чіткі. За умови відсутності потенційних суперечок, домовтеся, щоб визначити конкретний метод ділової співпраці.

Bishen Composition сказав репортеру «Kechuangban Daily»: «Коли користувачі користуються нашими послугами в додатку Bishen Composition, згідно з угодою, ми накопичуватимемо велику кількість оригінальних композиційних матеріалів користувачів і станемо нашим активом. Це це також причина, чому Xueersi співпрацює з нами. Якщо Xueersi накопичує дані з нуля, витрати часу є дуже високими, і немає можливості накопичити дані такого ж порядку за короткий термін».

Репортер «Kechuangban Daily» зауважив, що згідно з угодою про обслуговування користувача Pen God Composition, вміст, опублікований користувачами в Pen God Composition, надає Pen God Composition безкоштовну та безвідкличну невиключну ліцензію.

**Хто саме чий твір скопіював? **

Ван Хаосюань, який щойно закінчив університет, розповів репортеру «Kechuangban Daily», що коли він шукав своє ім’я в Інтернеті на другому курсі, він виявив, що композиція, яку він написав у молодшій школі, з’явилася на платформі композиції penshen. **

Ван Хаосюань сказав, що твір був рекомендований вчителем молодшої школи для публікації у внутрішньому журналі, який не видається публічно, і він витратив багато зусиль, щоб його написати. Він був злий, що Penshen Composition використала його композицію без його дозволу.

Ван Хаосюань вважає, що це порушило право на поширення інформації про його роботи в Інтернеті. Він вів переговори зі співробітниками Penshen Composition, але ставлення іншої сторони було поганим. Він лише видалив композицію та перестав відповідати на повідомлення. Адвокатський лист, який він доручив надіслати адвокату Бішен Композиції, не отримав відповіді.

Ван Хаосюань вирішив подати до суду на Bishen Composition, щоб захистити свої права, і справу було подано до суду. Лише за тиждень до суду адвокат Bishen Composition зв’язався з ним, сподіваючись примиритися. Адвокат сказав, що статтю опублікував хтось інший на веб-сайті Bishen Composition, і що Bishen Composition відповідає лише за її показ.

Після посередництва судді Wang Haoxuan і Bishen Composition нарешті досягли мирової угоди, і Wang Haoxuan отримав компенсацію.

Однак Ван Хаосюань припустив, що його стаття може бути набагато більшою, ніж та, яка порушує склад пензля, але більше людей про це не знають. Крім того, платформа Bishen Composition орієнтована на учнів початкової та середньої школи. Навіть якщо вони знають, що їхні статті були порушені, вони не обов’язково мають знати, щоб захистити свої права.

Журналіст «Kechuangban Daily» виявив, що коли Bishen Composition звинуватив Сюе Ерсі, у програмі Bishen Composition APP була велика кількість композицій порівняно з оригінальним текстом, і не було відображено жодної інформації, як-от автор і час випуску. **Репортери порівняли та виявили, що ці композиції були опубліковані на некомерційних веб-сайтах, таких як Xiaohe Composition. **

На зображенні ліворуч зображено композицію, пов’язану з порушенням авторських прав, а на зображенні праворуч — оригінальна композиція

У зв’язку з цим Penshen Composition відповів тодішньому репортеру «Kechuangban Daily», сказавши: «Це нормально, коли автори вносять більше одного рукопису. Ці статті завантажуються користувачами, і користувачі несуть відповідальність за авторські права та автентичність статей. Якщо хтось інший висуне заперечення щодо авторських прав статті та надасть докази, ми видалимо їх відповідно до закону після попередньої перевірки. Стаття є ранньою статтею, і відображення на той час не було ідеальним».

Проте Xiaohe Composition.com сказав репортеру «Kechuangban Daily»: «Якщо композиції, що з’являються на інших веб-сайтах, публікує Xiaohe Composition. Спочатку всі вони були станціями збору, починаючи з копіювання статей із Xiaohe Composition Network, ** але оскільки процес надто громіздкий, захист прав відсутній».

На сторінці опису авторських прав на Xiaohe Composition.com зазначено: "Авторські права на композицію, опубліковану на Xiaohe Composition.com, належать автору, і будь-які онлайн-медіа заборонено передруковувати. Передрук на інших паперових носіях повинен отримати згоду цього сайту та заплатити автору. Суворе попередження для невеликої кількості веб-сайтів і компаній, що займаються програмним забезпеченням, негайно припиніть копіювання вмісту цього сайту".

Мен Бо, юрист пекінської юридичної фірми Jingshi, сказав репортеру "Kechuangban Daily", що твори, про які йдеться в Законі про авторське право, стосуються інтелектуальних досягнень, які є оригінальними у сферах літератури, мистецтва та науки та можуть бути відтворені в деяких матеріальна форма. Відповідно до статті 6 «Положення про дію Закону про авторське право» авторське право виникає з дати завершення створення твору. Авторське право авторів літературних, художніх і наукових творів, права та інтереси, пов'язані з авторським правом, охороняються законом. Відповідно до положень статті 52 «Закону про авторське право» порушник авторського права і суміжних прав відповідно до обставин несе цивільну відповідальність у вигляді припинення порушення, усунення наслідків, принесення вибачень та відшкодування збитків.

Після «зневоднення» даних склад значно зменшується

Журналіст «Kechuangban Daily» виявив, що вищезазначена композиція, пов’язана з порушенням прав, зникла з результатів пошуку в додатку Bishen Composition, а відкриття посилання для спільного доступу також показує, що «композицію було видалено з полиць, оскільки вона не оригінально». **

**Однак після того, як дані були «зневоднені», кількість есе в Bishenzuowen APP значно зменшилася.**Репортер «Kechuangban Daily» здійснив пошук за деякими пошуковими словами на скріншоті журналу доступу Xueersi, який раніше показав Bishenzuowen , Xueersi раніше відвідував кілька сторінок із високочастотними пошуковими термінами (Bishen Composition сказав, що кожна сторінка повертатиме 30 результатів композиції), і наразі в результатах пошуку залишилося лише одна або дві композиції.

Проте Penshen Composition не змінила введення щодо кількості композицій, і ціна членства не зменшилася, а зросла. Варто зазначити, що ексклюзивний привілей «Змінювати композиції за секунди», наданий Penshen Composition членам, підозрюється, що вони можуть створювати нові композиції, «промиваючи рукописи одним клацанням миші».

Річна ціна членства Penshen Composition зросла порівняно з двома місяцями тому

Крім того, у вересні 2020 року Державна адміністрація кіберпростору Китаю назвала програму Penshen Composition і повідомила про неї за поширення невдалої та вульгарної інформації. За даними «Net Letter China», на той час у колонці «Family Square» Penshen Composition APP було багато груп підтримки знаменитостей, а на платформі була велика кількість «чоловіків і жінок» і «кохання». що не сприяло фізичному та психічному здоров’ю неповнолітніх. Журналіст помітив, що наразі в Pen God Composition немає груп або пов’язаного вмісту.

Pen God Composition також зазначив у заяві, що продовжить посилювати регулювання та захист використання даних, щоб забезпечити безпечне та відповідне використання даних користувачами, партнерами та компаніями.

** Після бурхливого зростання, високоякісних даних і побудови відповідності або неминучого вибору для вивчення APP і галузевої моделі ШІ для переходу на зрілу стадію. **

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити