A IA do Google está comendo tudo! Rastreie todo o conteúdo público para IA de treinamento, a política de privacidade foi atualizada

Fonte original: Qubit

Fonte da imagem: Gerada por Unbounded AI‌

A partir de agora, cada palavra que você disser publicamente na Internet poderá ser usada pelo Google para treinar IA!

Isso mesmo, após a pintura, obras escritas também serão usadas para alimentar modelos grandes——

Quer se trate de blogs de tecnologia, códigos, artigos ou qualquer coisa que você publique publicamente on-line, pode ser lançado no "Google Big Model Blender", mesmo com direitos autorais.

Nesta semana, o Google atualizou sua política de privacidade para deixar claro que se reserva o direito de coletar todo o conteúdo público online para criar suas ferramentas de IA.

Os internautas explodiram imediatamente. Alguém avisa que "o Google está rastreando tudo":

Uma vez que o Google pode ler o que você escreve, isso significa que é sua "propriedade".

Alguns internautas têm uma ideia mais pessimista:

Em breve, todos os produtores de conteúdo serão IA.

Então, o que há com esta versão da Política de Privacidade?

Para treinar produtos de IA, como Bard

As coisas precisam começar com a política de privacidade atualizada do Google atualmente.

Em sua política de privacidade mais recente, o Google adicionou uma cláusula de modelo de IA sobre "pesquisa e desenvolvimento":

O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias para beneficiar nossos usuários e o público. Por exemplo, usamos informações públicas para ajudar a treinar os modelos de IA do Google e criar produtos e recursos úteis (como Google Tradutor, Bard e recursos de IA em nuvem).

Em outras palavras, é usar todas as informações públicas que podem ser coletadas no treinamento de produtos ou funções relacionadas à IA, como Google Translate, Bard e Cloud AI.

Então, o que exatamente essa informação pública inclui?

Como Internet, rede e outras informações de atividade, incluindo informações sobre termos de pesquisa, aplicativos e interações do navegador com os serviços do Google e o uso dos serviços do Google em sites e aplicativos de terceiros.

Em outras palavras, não apenas os blogs e outros conteúdos que foram tornados públicos antes, mas também Google Docs publicados on-line ou algumas postagens contendo informações pessoais também podem ser coletados pelo treinamento de modelo do Google for Large.

Claro, esses conteúdos ainda estão limitados a "informações públicas" no momento.

Serviços de e-mail como o Gmail, fornecido pelo Google, ainda não devem ser rastreados nos dados.

Além disso, o Google também afirmou claramente em sua política de privacidade que também pode usar essas informações pessoais ou públicas para outros motivos, como prevenção de ameaças à segurança, revisão de informações, manutenção de serviços, publicidade personalizada ou leis.

Mas por que o Google está atualizando esta política neste momento?

"IA está desafiando os direitos autorais do texto"

Talvez também esteja relacionado à operação de "limitação atual" de empresas como Reddit e Twitter.

Primeiro, em abril deste ano, o Reddit anunciou que cobraria pelas empresas que acessassem a API.

O CEO da empresa acredita que o banco de dados do Reddit é muito valioso, mas eles não querem fornecer esse conteúdo valioso para grandes empresas de tecnologia gratuitamente.

Mais tarde, o Twitter também começou a limitar o fluxo do Twitter com o motivo de "Não quero que empresas de IA prostituam dados".

Esta série de políticas tem um impacto sério sobre os usuários e ferramentas de terceiros. Por exemplo, o Reddit desencadeou um protesto em grande escala no fórum de discussão. Muitos moderadores fecharam diretamente seus próprios fóruns para protestar contra a atividade do Reddit. Muitas pessoas estão condenando, e alguns os internautas até disseram que "o Twitter foi morto".

Mas, de qualquer forma, deixar a IA prostituir dados de graça agora é uma contradição que não pode ser ignorada.

Em relação à questão dos dados de rastreamento do Google AI, alguns internautas expressaram dúvidas:

Por que antes da Internet, como os mecanismos de pesquisa, também havia operações como rastreamento de dados, mas as pessoas eram resistentes ao "rastreamento de IA".

Alguns internautas responderam:

É essencialmente uma questão de direitos autorais. Se você apenas citar material protegido por direitos autorais, não estará necessariamente infringindo direitos autorais, mas se usar IA para "mexer e limpar" conteúdo protegido por direitos autorais e isso for legalizado, então, em essência, direitos autorais estão mortos.

É justamente por isso que ele é pessimista sobre o assunto:

Se alguém copiar seu blog sem reconhecer a fonte, ou usar seu código-fonte aberto para serviços pagos, ou usar suas respostas no StackOverflow como um método de responder a perguntas, você pode aceitar que isso aconteça? Tudo o que fiz foi gratuito. Mas agora, se a IA quiser que eu desapareça, então eu vou desaparecer.

Claro que também há internautas que aceitaram a introdução desta política, sendo indispensável estar atento à sensibilização de prevenção de cada um:

Examine a nova política e observe quanta informação estamos vazando online.

Então, o que você pensa sobre isso?

Link de referência: [1] [2]

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)