A partir de agora, cada palavra que você disser publicamente na Internet poderá ser usada pelo Google para treinar IA!
Isso mesmo, após a pintura, obras escritas também serão usadas para alimentar modelos grandes——
Quer se trate de blogs de tecnologia, códigos, artigos ou qualquer coisa que você publique publicamente on-line, pode ser lançado no "Google Big Model Blender", mesmo com direitos autorais.
Nesta semana, o Google atualizou sua política de privacidade para deixar claro que se reserva o direito de coletar todo o conteúdo público online para criar suas ferramentas de IA.
Os internautas explodiram imediatamente. Alguém avisa que "o Google está rastreando tudo":
Uma vez que o Google pode ler o que você escreve, isso significa que é sua "propriedade".
Alguns internautas têm uma ideia mais pessimista:
Em breve, todos os produtores de conteúdo serão IA.
Então, o que há com esta versão da Política de Privacidade?
Para treinar produtos de IA, como Bard
As coisas precisam começar com a política de privacidade atualizada do Google atualmente.
Em sua política de privacidade mais recente, o Google adicionou uma cláusula de modelo de IA sobre "pesquisa e desenvolvimento":
O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias para beneficiar nossos usuários e o público.
Por exemplo, usamos informações públicas para ajudar a treinar os modelos de IA do Google e criar produtos e recursos úteis (como Google Tradutor, Bard e recursos de IA em nuvem).
Em outras palavras, é usar todas as informações públicas que podem ser coletadas no treinamento de produtos ou funções relacionadas à IA, como Google Translate, Bard e Cloud AI.
Então, o que exatamente essa informação pública inclui?
Como Internet, rede e outras informações de atividade, incluindo informações sobre termos de pesquisa, aplicativos e interações do navegador com os serviços do Google e o uso dos serviços do Google em sites e aplicativos de terceiros.
Em outras palavras, não apenas os blogs e outros conteúdos que foram tornados públicos antes, mas também Google Docs publicados on-line ou algumas postagens contendo informações pessoais também podem ser coletados pelo treinamento de modelo do Google for Large.
Claro, esses conteúdos ainda estão limitados a "informações públicas" no momento.
Serviços de e-mail como o Gmail, fornecido pelo Google, ainda não devem ser rastreados nos dados.
Além disso, o Google também afirmou claramente em sua política de privacidade que também pode usar essas informações pessoais ou públicas para outros motivos, como prevenção de ameaças à segurança, revisão de informações, manutenção de serviços, publicidade personalizada ou leis.
Mas por que o Google está atualizando esta política neste momento?
"IA está desafiando os direitos autorais do texto"
Talvez também esteja relacionado à operação de "limitação atual" de empresas como Reddit e Twitter.
Primeiro, em abril deste ano, o Reddit anunciou que cobraria pelas empresas que acessassem a API.
O CEO da empresa acredita que o banco de dados do Reddit é muito valioso, mas eles não querem fornecer esse conteúdo valioso para grandes empresas de tecnologia gratuitamente.
Mais tarde, o Twitter também começou a limitar o fluxo do Twitter com o motivo de "Não quero que empresas de IA prostituam dados".
Esta série de políticas tem um impacto sério sobre os usuários e ferramentas de terceiros. Por exemplo, o Reddit desencadeou um protesto em grande escala no fórum de discussão. Muitos moderadores fecharam diretamente seus próprios fóruns para protestar contra a atividade do Reddit. Muitas pessoas estão condenando, e alguns os internautas até disseram que "o Twitter foi morto".
Mas, de qualquer forma, deixar a IA prostituir dados de graça agora é uma contradição que não pode ser ignorada.
Em relação à questão dos dados de rastreamento do Google AI, alguns internautas expressaram dúvidas:
Por que antes da Internet, como os mecanismos de pesquisa, também havia operações como rastreamento de dados, mas as pessoas eram resistentes ao "rastreamento de IA".
Alguns internautas responderam:
É essencialmente uma questão de direitos autorais. Se você apenas citar material protegido por direitos autorais, não estará necessariamente infringindo direitos autorais, mas se usar IA para "mexer e limpar" conteúdo protegido por direitos autorais e isso for legalizado, então, em essência, direitos autorais estão mortos.
É justamente por isso que ele é pessimista sobre o assunto:
Se alguém copiar seu blog sem reconhecer a fonte, ou usar seu código-fonte aberto para serviços pagos, ou usar suas respostas no StackOverflow como um método de responder a perguntas, você pode aceitar que isso aconteça?
Tudo o que fiz foi gratuito. Mas agora, se a IA quiser que eu desapareça, então eu vou desaparecer.
Claro que também há internautas que aceitaram a introdução desta política, sendo indispensável estar atento à sensibilização de prevenção de cada um:
Examine a nova política e observe quanta informação estamos vazando online.
Então, o que você pensa sobre isso?
Link de referência:
[1]
[2]
Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
A IA do Google está comendo tudo! Rastreie todo o conteúdo público para IA de treinamento, a política de privacidade foi atualizada
Fonte original: Qubit
A partir de agora, cada palavra que você disser publicamente na Internet poderá ser usada pelo Google para treinar IA!
Isso mesmo, após a pintura, obras escritas também serão usadas para alimentar modelos grandes——
Quer se trate de blogs de tecnologia, códigos, artigos ou qualquer coisa que você publique publicamente on-line, pode ser lançado no "Google Big Model Blender", mesmo com direitos autorais.
Os internautas explodiram imediatamente. Alguém avisa que "o Google está rastreando tudo":
Para treinar produtos de IA, como Bard
As coisas precisam começar com a política de privacidade atualizada do Google atualmente.
Em sua política de privacidade mais recente, o Google adicionou uma cláusula de modelo de IA sobre "pesquisa e desenvolvimento":
Em outras palavras, é usar todas as informações públicas que podem ser coletadas no treinamento de produtos ou funções relacionadas à IA, como Google Translate, Bard e Cloud AI.
Como Internet, rede e outras informações de atividade, incluindo informações sobre termos de pesquisa, aplicativos e interações do navegador com os serviços do Google e o uso dos serviços do Google em sites e aplicativos de terceiros.
Em outras palavras, não apenas os blogs e outros conteúdos que foram tornados públicos antes, mas também Google Docs publicados on-line ou algumas postagens contendo informações pessoais também podem ser coletados pelo treinamento de modelo do Google for Large.
Claro, esses conteúdos ainda estão limitados a "informações públicas" no momento.
Serviços de e-mail como o Gmail, fornecido pelo Google, ainda não devem ser rastreados nos dados.
Além disso, o Google também afirmou claramente em sua política de privacidade que também pode usar essas informações pessoais ou públicas para outros motivos, como prevenção de ameaças à segurança, revisão de informações, manutenção de serviços, publicidade personalizada ou leis.
Mas por que o Google está atualizando esta política neste momento?
"IA está desafiando os direitos autorais do texto"
Talvez também esteja relacionado à operação de "limitação atual" de empresas como Reddit e Twitter.
Primeiro, em abril deste ano, o Reddit anunciou que cobraria pelas empresas que acessassem a API.
O CEO da empresa acredita que o banco de dados do Reddit é muito valioso, mas eles não querem fornecer esse conteúdo valioso para grandes empresas de tecnologia gratuitamente.
Mais tarde, o Twitter também começou a limitar o fluxo do Twitter com o motivo de "Não quero que empresas de IA prostituam dados".
Esta série de políticas tem um impacto sério sobre os usuários e ferramentas de terceiros. Por exemplo, o Reddit desencadeou um protesto em grande escala no fórum de discussão. Muitos moderadores fecharam diretamente seus próprios fóruns para protestar contra a atividade do Reddit. Muitas pessoas estão condenando, e alguns os internautas até disseram que "o Twitter foi morto".
Mas, de qualquer forma, deixar a IA prostituir dados de graça agora é uma contradição que não pode ser ignorada.
Em relação à questão dos dados de rastreamento do Google AI, alguns internautas expressaram dúvidas:
Link de referência: [1] [2]