Toda a internet agora pertence à IA do Google

Google Bard sendo exibido no Google IO 2023.

A atualização mais recente do Google em sua política de privacidade fará com que a empresa tenha liberdade para vasculhar a web em busca de qualquer conteúdo que possa beneficiar a construção e melhoria de suas ferramentas de IA.

“O Google usa informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias que beneficiem nossos usuários e o público”, diz a nova política do Google. “Por exemplo, usamos informações disponíveis publicamente para ajudar a treinar os modelos de IA do Google e criar produtos e recursos como o Google Tradutor, Bardo, e capacidades de Cloud AI.”

Vídeos recomendados

Gizmodo observa que a política foi atualizada para dizer “modelos de IA” quando anteriormente dizia “para modelos de linguagem”. Além disso, a política adicionou Bard e Cloud AI, quando anteriormente mencionava apenas o Google Tradutor, para o qual Dados coletados.

A política de privacidade, que foi atualizada no fim de semana, parece especialmente sinistra porque indica que qualquer informação que você produz on-line está disponível para o Google usar para treinar seus modelos de IA.

A redação mencionada parece descrever não apenas aqueles no ecossistema do Google de uma forma ou outro, mas é detalhado de forma que a marca possa ter acesso a informações de qualquer parte do a teia.

As principais questões que envolvem o desenvolvimento em massa da inteligência artificial são questões sobre privacidade, plágio e se a IA pode dissipar informações corretas. Versões iniciais de chatbots como ChatGPT são baseados em modelos de linguagem grandes (LLMs) que já usaram fontes públicas, como o arquivo da Web de rastreamento comum, WebText2, Books1, Books2 e Wikipedia como dados de treinamento.

O início do ChatGPT era famoso por ficar preso em informações além de 2021 e, posteriormente, preencher as respostas com dados falsos. Provavelmente, esse pode ser um dos motivos pelos quais o Google deseja acesso irrestrito aos dados da Web para beneficiar ferramentas como a Bard, para ter treinamento no mundo real e potencialmente em tempo real para seus modelos de IA.

O Gizmodo também observou que o Google poderia usar essa nova política para coletar conteúdo antigo, mas ainda gerado por humanos, como comentários há muito esquecidos ou postagens de blog, para ainda ter uma ideia de como o texto e a fala humanos são desenvolvidos e distribuído. Ainda assim, resta saber exatamente como o Google usará os dados que coleta.

Várias plataformas de mídia social, incluindo Twitter e Reddit, que são as principais fontes de informações atualizadas, já limitou seu acesso público no despertar do Popularidade do chatbot de IA, para desgosto de todas as suas comunidades.

Ambas as plataformas fecharam o acesso gratuito a suas APIs, o que restringe os usuários de baixar grandes quantidades de postagens para compartilhar em outro lugar, sob o pretexto de proteger sua propriedade intelectual. Em vez disso, isso quebrou muitas das ferramentas de terceiros que fazem o Twitter e o Reddit funcionarem sem problemas.

Tanto o Twitter quanto o Reddit tiveram que lidar com outros contratempos e controvérsias, à medida que as preocupações de seus proprietários aumentavam com a IA assumindo o controle.

Recomendações dos editores

  • As melhores ferramentas de edição de vídeo AI
  • OpenAI, fabricante do ChatGPT, enfrenta investigação da FTC sobre leis de proteção ao consumidor
  • Avanços da IA ​​podem vir do cérebro das abelhas, dizem cientistas
  • Os melhores chatbots de IA para experimentar: ChatGPT, Bard e mais
  • OpenAI revela a localização de seu primeiro posto avançado internacional

Atualize seu estilo de vidaO Digital Trends ajuda os leitores a acompanhar o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais perspicazes e prévias exclusivas.