Detrás del "primer caso de robo de datos de modelos grandes"

Texto: Zhu Ling

**Fuente: **Asociación Financiera

Fuente de la imagen: Generada por Unbounded AI‌

Cuando OpenAI enfrentó la acusación de "ladrón de datos" y estuvo profundamente involucrado en múltiples demandas colectivas e individuales, el "primer caso de robo de datos de modelo grande de IA" de China estuvo a punto de estallar, pero al final las dos partes resolvieron el problema. malentendido. ¿Hay alguna otra razón detrás del "malentendido"? ¿Tienes un secreto?

Recientemente, Bishen Composition, un producto de escritura asistido por IA invertido por Century Tianhong, emitió un comunicado diciendo que había decidido el 4 de agosto dejar de pensar en aprender e iniciar una demanda contra incidentes de recuperación de datos relacionados. **

Bishen Composition declaró que después de una investigación profunda y una comunicación franca con Xueersi, las dos partes llegaron a un acuerdo sobre los términos en disputa, las dos partes eliminaron el malentendido y continuarán profundizando la cooperación y promoviendo conjuntamente la exploración. de la tecnología de IA en el campo de la educación.

Un reportero de "Kechuangban Daily" le preguntó a Bishen Composición sobre las razones del acuerdo y el motivo del malentendido. La persona a cargo relevante dijo: "El incidente se ha explicado claramente en la declaración y no se darán otras respuestas".

Una ronda y media de "gritos de aire"

Volviendo a hace dos meses, Penshen Composition emitió un comunicado en la tarde del 13 de junio, acusando a su socio Xueersi de "robar" los datos del inventario de composición para entrenar el próximo producto modelo de IA a gran escala. Bishen Composition declaró que resolverá la disputa a través de procedimientos judiciales, requiriendo que Xueersi pague 1 yuan en compensación, se disculpe públicamente, elimine los datos rastreados y lo llame "el primer caso de robo de datos de modelo grande de IA" en China. **

Esa noche, ** Xueersi respondió rápidamente que el uso de los datos de Bishen Composición caía dentro del alcance de la cooperación normal acordada en el contrato entre las dos partes, y ** la "especulación subjetiva" de Bishen Composición era "seriamente inconsistente con los hechos".

El 14 de junio, Penshen Composition sacó volúmenes de llamadas y capturas de pantalla de los registros del servidor para refutar la respuesta de Xueersi, tratando de demostrar que Xueersi usó tecnología de "rastreador" para acceder ilegalmente y almacenar en caché 2,58 millones de datos en el servidor de la aplicación de composición de Penshen en solo unos días Segundo , es un comportamiento típico de "recolección de bases de datos", que viola gravemente los derechos de datos de Bishen Composición.

Posteriormente, Xueersi no dio una respuesta pública. El reportero de "Kechuangban Daily" llamó a la empresa matriz de Xueersi, TAL, para una entrevista, pero el personal de cableado se negó a transferir al reportero al departamento correspondiente.

El 20 de junio, Shiji Tianhong, el segundo accionista de Beijing Yi Yi Liang Hua Technology Co., Ltd., que pertenece a Pen God, dijo en la plataforma interactiva que la empresa también está prestando atención al progreso del incidente. Anteriormente, debido a la mención de Bishen Composición en la plataforma interactiva, el precio de las acciones de Century Tianhong aumentó más del 100 % durante 10 días hábiles consecutivos desde el 24 de abril.

De dónde vienen los 5 millones de materiales de composición

Ya en 2019, Blue Media Exchange le hizo una pregunta a Song Jiawei, el fundador de Penshen Composition: ** ¿Cómo resolver el problema de los derechos de autor de la gran cantidad de datos de contenido informativo acumulados en el backstage de Penshen? **

Song Jiawei dijo francamente en ese momento que se estaba comunicando y cooperando con algunos propietarios de derechos de autor. Además, el equipo de Pen God hace todo lo posible para recopilar materiales para obras públicas, como poemas y citas célebres. **El autor de este informe predijo que el tema de los derechos de autor podría ser un problema a largo plazo para Pen God en el futuro. **

Los datos como uno de los elementos centrales de la IA, según Penshen Composition y Shiji Tianhong, han acumulado más de 5 millones de materiales de composición.

Century Tianhong declaró anteriormente en la plataforma interactiva que los grandes datos de Penshen Composición provienen de su propia acumulación, y el modelo de algoritmo es desarrollado y entrenado por la empresa.

El 8 de mayo, la Bolsa de Valores de Shenzhen emitió una carta de preocupación a Shiji Tianhong, **en la que pedía que explicara si la empresa proporcionó los datos necesarios para entrenar el modelo de IA de "Composición Pen Shen" para un trazo y dos trazos; si es así, debe combinarse con la información relevante de la empresa El método y la fuente de adquisición de datos, etc., de acuerdo con la "Ley de Seguridad de Datos" y otras regulaciones relevantes, explicar la legalidad de la obtención, procesamiento y uso de datos relevantes; si la propiedad de los derechos de propiedad de los activos de datos relevantes está clara, si existen disputas potenciales, si hay Acuerdos de otras partes y Arreglos de Beneficios.

En respuesta a la carta de preocupación, Century Tianhong afirmó que se ha verificado que los datos necesarios para entrenar el modelo de IA de "Composición Pen Shen" se acumulan en el curso de su propio negocio. Hasta ahora, la empresa no ha brindado servicios a los clientes que utilizan "Composición Pen Shen", ni ha proporcionado los datos necesarios para la capacitación del modelo de inteligencia artificial "Composición Pen Shen" a Yiyi Liangshu. En el futuro, si hay una demanda de adquisición de datos para el entrenamiento del modelo de IA de "Composición Pen Shen" con un trazo y dos trazos, la empresa seguirá estrictamente la "Ley de seguridad de datos" y otras regulaciones relevantes para garantizar que la adquisición, el procesamiento y el uso de datos relevantes son legales, y los derechos de propiedad de los activos de datos son claros. , Bajo la premisa de que no hay disputas potenciales, negocie para determinar el método de cooperación comercial específico.

Bishen Composición le dijo al reportero de "Kechuangban Daily": ** "Cuando los usuarios utilizan nuestros servicios en la aplicación Bishen Composición, de acuerdo con el acuerdo, acumularemos una gran cantidad de materiales de composición originales de los usuarios y se convertirán en nuestros activos. ** Esto es también la razón por la que Xueersi cooperó con nosotros. Si Xueersi acumula datos desde cero, el costo de tiempo es muy alto y no hay forma de acumular datos del mismo orden de magnitud en el corto plazo".

El reportero de "Kechuangban Daily" notó que de acuerdo con el acuerdo de servicio de usuario de Pen God Composition, el contenido publicado por los usuarios en Pen God Composition otorga una licencia no exclusiva, irrevocable y gratuita a Pen God Composition.

**¿Quién copió exactamente la composición de quién? **

Wang Haoxuan, quien acaba de graduarse de la universidad, le dijo al reportero de "Kechuangban Daily" que cuando estaba buscando su nombre en Internet en su segundo año, descubrió que una composición que escribió en la escuela secundaria apareció en la plataforma de composición de penshen. . **

Wang Haoxuan dijo que un maestro de secundaria recomendó que la composición se publicara en una revista interna que no se publica públicamente, y dedicó un gran esfuerzo a escribirla. Estaba enojado porque Penshen Composición usó su composición sin su permiso.

Wang Haoxuan cree que esto ha violado el derecho a difundir información sobre sus obras en Internet. Había negociado con el personal de Composición de Penshen, pero la actitud de la otra parte no fue buena, solo borró la composición y dejó de responder el mensaje. La carta de abogado que le encargó a un abogado que enviara a Bishen Composición no ha recibido respuesta.

Wang Haoxuan decidió demandar a Bishen Composition para defender sus derechos y el caso fue archivado por el tribunal. No fue hasta una semana antes del juicio que el abogado de Bishen Composición lo contactó, con la esperanza de reconciliarse. El abogado dijo que el artículo fue publicado por otra persona en el sitio web de Composición de Bishen, y que Composición de Bishen solo era responsable de mostrarlo.

Después de la mediación del juez, Wang Haoxuan y Bishen Composition finalmente llegaron a un acuerdo y Wang Haoxuan recibió una compensación.

Sin embargo, Wang Haoxuan especula que su artículo puede ser mucho más que el que infringe los derechos de autor de la composición del dios del pincel, pero más personas no lo saben. Además, la plataforma de composición de Bishen está dirigida a estudiantes de primaria y secundaria. Incluso si saben que sus artículos han sido infringidos, es posible que no tengan la conciencia necesaria para proteger sus derechos.

Un reportero de "Kechuangban Daily" descubrió que cuando Bishen Composición acusó a Xue Ersi, había una gran cantidad de composiciones en la aplicación Bishen Composición en comparación con la escritura original, y no se mostró información como el autor y el tiempo de publicación. **Los reporteros compararon y encontraron que estas composiciones habían sido publicadas en sitios web no comerciales como Xiaohe Composition. **

La imagen de la izquierda es una composición que involucra problemas de infracción, y la imagen de la derecha es una composición original.

En este sentido, Penshen Composition respondió al reportero del "Kechuangban Daily" en ese momento, diciendo: "Es normal que los autores contribuyan con más de un manuscrito. Estos artículos los cargan los usuarios, y los usuarios son responsables de los derechos de autor y autenticidad de los artículos. Si alguien más presenta objeciones a los derechos de autor del artículo y presenta evidencia, lo eliminaremos de acuerdo con la ley después de una verificación preliminar. El artículo es uno de los primeros y la visualización en ese momento no era perfecta".

Sin embargo, Xiaohe Composición.com le dijo al reportero de "Kechuangban Daily", "Si las composiciones que aparecen en otros sitios web son publicadas por Xiaohe Composición. Al principio, todas eran estaciones de recolección, comenzando con la copia de artículos de Xiaohe Composición Red, ** pero debido a que el proceso es demasiado engorroso, no hay protección de derechos”.

La página de descripción de los derechos de autor de Xiaohe Composición.com muestra: "Los derechos de autor de la composición publicada por Xiaohe Composición.com pertenecen al autor, y se prohíbe la reimpresión en cualquier medio en línea. La reimpresión por otros medios en papel debe obtener el consentimiento de este sitio y pague al autor. Advertencia severa a un pequeño número de sitios web y compañías de software, dejen de copiar el contenido de este sitio de inmediato".

Meng Bo, un abogado del bufete de abogados Beijing Jingshi, le dijo al reportero del "Diario Kechuangban" que las obras a las que se hace referencia en la Ley de derechos de autor se refieren a logros intelectuales que son originales en los campos de la literatura, el arte y la ciencia y pueden reproducirse en algunos. forma tangible. De acuerdo con el artículo 6 del “Reglamento para la Aplicación de la Ley de Derechos de Autor”, los derechos de autor se generarán a partir de la fecha en que finalice la creación de la obra. Los derechos de autor de los autores de obras literarias, artísticas y científicas, y los derechos e intereses relacionados con los derechos de autor están protegidos por ley. De acuerdo con lo dispuesto en el artículo 52 de la "Ley de Derecho de Autor", los infractores de derechos de autor y derechos conexos incurrirán, según las circunstancias, en responsabilidades civiles tales como detener la infracción, eliminar el impacto, pedir disculpas e indemnizar las pérdidas.

Después de que los datos se "deshidraten", la composición se reduce considerablemente

Un reportero del "Diario de Kechuangban" descubrió que la composición mencionada anteriormente que involucra problemas de infracción ha desaparecido de los resultados de búsqueda de la aplicación de composición Bishen, y abrir el enlace para compartir también muestra que "la composición se ha eliminado de los estantes porque es no es original." **

**Sin embargo, después de que los datos fueran "deshidratados", la cantidad de ensayos en la aplicación Bishenzuowen disminuyó significativamente. **El reportero de "Kechuangban Daily" buscó de acuerdo con algunas palabras de búsqueda en la captura de pantalla del registro de acceso de Xueersi que mostró anteriormente el Bishenzuowen, Xueersi había visitado previamente varias páginas de términos de búsqueda de alta frecuencia (Bishen Composición dijo que cada página devolvería 30 resultados de composición), y actualmente solo quedan una o dos composiciones en los resultados de búsqueda.

Sin embargo, Penshen Composición no modificó la introducción relacionada con el número de composiciones, y el precio de membresía no disminuyó sino que aumentó. Vale la pena mencionar que se sospecha que el privilegio exclusivo de "Cambiar composiciones en segundos" proporcionado por Penshen Composition a los miembros puede generar nuevas composiciones "lavando manuscritos con un solo clic".

El precio de membresía anual de Penshen Composition ha aumentado en comparación con hace dos meses.

Además, la aplicación de composición Penshen fue nombrada y notificada por la Administración Estatal del Ciberespacio de China en septiembre de 2020 por promover información vulgar y mal orientada. Según "Net Letter China", había muchos grupos de apoyo de celebridades en la columna "Family Square" de la aplicación de composición Penshen en ese momento, y había una gran cantidad de contenido de "hombres y mujeres" y "amor" en la plataforma. que no sea propicio para la salud física y mental de los menores. El reportero notó que actualmente no hay grupos o contenido relacionado involucrado en Pen God Composition.

Pen God Composition también declaró en la declaración que continuará fortaleciendo la regulación y la protección del uso de datos para garantizar el uso seguro y compatible de los datos por parte de los usuarios, socios y empresas.

** Después del crecimiento salvaje, los datos de alta calidad y la construcción de cumplimiento, o la elección inevitable para aprender la aplicación y el modelo de inteligencia artificial de la industria para ingresar a la etapa madura. **

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)