¡La IA de Google se lo está comiendo todo! Rastrear todo el contenido público para entrenar IA, la política de privacidad se ha actualizado

2023-07-10 09:52:10

Fuente original: Qubit

Fuente de la imagen: Generada por Unbounded AI‌

¡De ahora en adelante, cada palabra que digas públicamente en Internet puede ser utilizada por Google para entrenar la IA!

Así es, después de pintar, las obras escritas también se usarán para alimentar modelos grandes——

Ya se trate de blogs de tecnología, código, documentos o cualquier cosa que publique públicamente en línea, puede incluirse en "Google Big Model Blender", incluso con derechos de autor.

Esta misma semana, Google actualizó su política de privacidad para dejar en claro que se reservan el derecho de recopilar todo el contenido público en línea para crear sus herramientas de IA.

Los internautas explotaron de inmediato. Alguien advierte que "Google está rastreando todo":

Una vez que Google puede leer lo que escribes, significa que es su "propiedad".

Algunos internautas tienen una idea más pesimista:

Pronto, todos los productores de contenido serán AI.

Entonces, ¿qué pasa con esta versión de la Política de privacidad?

Para entrenar productos de IA como Bard

Las cosas tienen que comenzar con la política de privacidad actualizada de Google en estos días.

En su última política de privacidad, Google agregó una cláusula de modelo de IA sobre "investigación y desarrollo":

Google usa la información para mejorar nuestros servicios y desarrollar nuevos productos, funciones y tecnologías para beneficiar a nuestros usuarios y al público. Por ejemplo, usamos información pública para ayudar a entrenar los modelos de IA de Google y crear productos y funciones útiles (como las funciones de Google Translate, Bard y Cloud AI).

En otras palabras, es utilizar toda la información pública que se pueda recopilar en la capacitación de productos o funciones relacionadas con la IA, como Google Translate, Bard y Cloud AI.

Entonces, ¿qué incluye exactamente esta información pública?

Como Internet, la red y otra información de actividad, incluida información sobre términos de búsqueda, aplicaciones e interacciones del navegador con los servicios de Google, y el uso de los servicios de Google en sitios web y aplicaciones de terceros.

En otras palabras, no solo los blogs y otro contenido que se haya hecho público anteriormente, sino también los Documentos de Google publicados en línea, o algunas publicaciones que contengan información personal, también pueden ser recopilados por Google para la capacitación de modelos grandes.

Por supuesto, estos contenidos todavía se limitan a la "información pública" en la actualidad.

Los servicios de correo electrónico como Gmail, proporcionado por Google, aún no deben rastrearse en los datos.

Además, Google también establece claramente en su política de privacidad que también puede utilizar dicha información personal o pública por otros motivos, como la prevención de amenazas a la seguridad, la revisión de la información, el mantenimiento del servicio, la publicidad personalizada o las leyes.

Pero, ¿por qué Google está actualizando esta política en este momento?

"AI está desafiando los derechos de autor del texto"

Quizás también esté relacionado con la operación de "limitación de corriente" de empresas como Reddit y Twitter.

Primero, en abril de este año, Reddit anunció que cobraría a las empresas que accedieran a la API.

El director general de la empresa cree que la base de datos de Reddit es muy valiosa, pero no quiere proporcionar este valioso contenido a las grandes empresas de tecnología de forma gratuita.

Más tarde, Twitter también comenzó a limitar el flujo de Twitter con el motivo de "No quiero que las empresas de IA prostituyan los datos".

Esta serie de políticas tiene un grave impacto en los usuarios y las herramientas de terceros. Por ejemplo, Reddit desencadenó una protesta en un foro de discusión a gran escala. Muchos moderadores cerraron directamente sus propios foros para protestar por la actividad de Reddit. Mucha gente está condenando y algunos Los internautas incluso dijeron que "Twitter ha sido asesinado".

Pero en cualquier caso, dejar que la IA prostituya datos de forma gratuita es ahora una contradicción que no se puede ignorar.

Con respecto al asunto de los datos de rastreo de Google AI, algunos internautas expresaron dudas:

Por qué antes de Internet, como los motores de búsqueda, también tenían operaciones como el rastreo de datos, pero las personas se resistían al "rastreo de IA".

Algunos internautas respondieron:

Es esencialmente un problema de derechos de autor. Si solo cita material con derechos de autor, entonces no necesariamente infringe los derechos de autor, pero si usa IA para "revolver y limpiar" contenido con derechos de autor, y esto está legalizado, entonces, en esencia, los derechos de autor están muertos.

Precisamente por eso es pesimista sobre este asunto:

Si alguien copia su blog sin reconocer la fuente, o usa su código fuente abierto para servicios pagos, o usa sus respuestas en StackOverflow como un método para responder preguntas, ¿puede aceptar que esto suceda? Todo lo que hice fue gratis. Pero ahora, si la IA quiere que desaparezca, desapareceré.

Por supuesto, también hay internautas que han aceptado la introducción de esta política, y es indispensable estar alerta a la conciencia de prevención de cada uno:

Lea detenidamente la nueva política y observe cuánta información estamos filtrando en línea.

Entonces, ¿qué piensas sobre esto?

Link de referencia: [1] [2]

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 me gusta

Recompensa
1
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
GT 2025 Q2 Burn Completed
15k Popularidad
Join Gate VIP to Win MacBook
2k Popularidad
Trump’s Tariff Policy
46k Popularidad
4BTC
30479k Popularidad
5contentstar
10720k Popularidad
6NADA
11186k Popularidad
7BOME
11565k Popularidad
8BTC
30479k Popularidad
9SMILE
9062k Popularidad
10比特币
13455k Popularidad

Anclado