A IA do Google está comendo tudo! Rastreie todo o conteúdo público para IA de treinamento, a política de privacidade foi atualizada

2023-07-10 09:52:10

Fonte original: Qubit

Fonte da imagem: Gerada por Unbounded AI‌

A partir de agora, cada palavra que você disser publicamente na Internet poderá ser usada pelo Google para treinar IA!

Isso mesmo, após a pintura, obras escritas também serão usadas para alimentar modelos grandes——

Quer se trate de blogs de tecnologia, códigos, artigos ou qualquer coisa que você publique publicamente on-line, pode ser lançado no "Google Big Model Blender", mesmo com direitos autorais.

Nesta semana, o Google atualizou sua política de privacidade para deixar claro que se reserva o direito de coletar todo o conteúdo público online para criar suas ferramentas de IA.

Os internautas explodiram imediatamente. Alguém avisa que "o Google está rastreando tudo":

Uma vez que o Google pode ler o que você escreve, isso significa que é sua "propriedade".

Alguns internautas têm uma ideia mais pessimista:

Em breve, todos os produtores de conteúdo serão IA.

Então, o que há com esta versão da Política de Privacidade?

Para treinar produtos de IA, como Bard

As coisas precisam começar com a política de privacidade atualizada do Google atualmente.

Em sua política de privacidade mais recente, o Google adicionou uma cláusula de modelo de IA sobre "pesquisa e desenvolvimento":

O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias para beneficiar nossos usuários e o público. Por exemplo, usamos informações públicas para ajudar a treinar os modelos de IA do Google e criar produtos e recursos úteis (como Google Tradutor, Bard e recursos de IA em nuvem).

Em outras palavras, é usar todas as informações públicas que podem ser coletadas no treinamento de produtos ou funções relacionadas à IA, como Google Translate, Bard e Cloud AI.

Então, o que exatamente essa informação pública inclui?

Como Internet, rede e outras informações de atividade, incluindo informações sobre termos de pesquisa, aplicativos e interações do navegador com os serviços do Google e o uso dos serviços do Google em sites e aplicativos de terceiros.

Em outras palavras, não apenas os blogs e outros conteúdos que foram tornados públicos antes, mas também Google Docs publicados on-line ou algumas postagens contendo informações pessoais também podem ser coletados pelo treinamento de modelo do Google for Large.

Claro, esses conteúdos ainda estão limitados a "informações públicas" no momento.

Serviços de e-mail como o Gmail, fornecido pelo Google, ainda não devem ser rastreados nos dados.

Além disso, o Google também afirmou claramente em sua política de privacidade que também pode usar essas informações pessoais ou públicas para outros motivos, como prevenção de ameaças à segurança, revisão de informações, manutenção de serviços, publicidade personalizada ou leis.

Mas por que o Google está atualizando esta política neste momento?

"IA está desafiando os direitos autorais do texto"

Talvez também esteja relacionado à operação de "limitação atual" de empresas como Reddit e Twitter.

Primeiro, em abril deste ano, o Reddit anunciou que cobraria pelas empresas que acessassem a API.

O CEO da empresa acredita que o banco de dados do Reddit é muito valioso, mas eles não querem fornecer esse conteúdo valioso para grandes empresas de tecnologia gratuitamente.

Mais tarde, o Twitter também começou a limitar o fluxo do Twitter com o motivo de "Não quero que empresas de IA prostituam dados".

Esta série de políticas tem um impacto sério sobre os usuários e ferramentas de terceiros. Por exemplo, o Reddit desencadeou um protesto em grande escala no fórum de discussão. Muitos moderadores fecharam diretamente seus próprios fóruns para protestar contra a atividade do Reddit. Muitas pessoas estão condenando, e alguns os internautas até disseram que "o Twitter foi morto".

Mas, de qualquer forma, deixar a IA prostituir dados de graça agora é uma contradição que não pode ser ignorada.

Em relação à questão dos dados de rastreamento do Google AI, alguns internautas expressaram dúvidas:

Por que antes da Internet, como os mecanismos de pesquisa, também havia operações como rastreamento de dados, mas as pessoas eram resistentes ao "rastreamento de IA".

Alguns internautas responderam:

É essencialmente uma questão de direitos autorais. Se você apenas citar material protegido por direitos autorais, não estará necessariamente infringindo direitos autorais, mas se usar IA para "mexer e limpar" conteúdo protegido por direitos autorais e isso for legalizado, então, em essência, direitos autorais estão mortos.

É justamente por isso que ele é pessimista sobre o assunto:

Se alguém copiar seu blog sem reconhecer a fonte, ou usar seu código-fonte aberto para serviços pagos, ou usar suas respostas no StackOverflow como um método de responder a perguntas, você pode aceitar que isso aconteça? Tudo o que fiz foi gratuito. Mas agora, se a IA quiser que eu desapareça, então eu vou desaparecer.

Claro que também há internautas que aceitaram a introdução desta política, sendo indispensável estar atento à sensibilização de prevenção de cada um:

Examine a nova política e observe quanta informação estamos vazando online.

Então, o que você pensa sobre isso?

Link de referência: [1] [2]

Ver original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 Curtidas

Recompensa
1
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
GT 2025 Q2 Burn Completed
13k Popularidade
Michael Saylor Hints at Buying BTC
10k Popularidade
BTC
30453k Popularidade
4contentstar
10720k Popularidade
5NADA
11186k Popularidade
6BOME
11565k Popularidade
7BTC
30453k Popularidade
8SMILE
9062k Popularidade
9比特币
13442k Popularidade

Marcar

sitemap