Allt internet tillhör nu Googles AI

Google Bard visas upp på Google IO 2023.

Googles senaste uppdatering av sin integritetspolicy kommer att göra det så att företaget har fritt utbud för att skrapa webben efter allt innehåll som kan gynna att bygga och förbättra dess AI-verktyg.

"Google använder information för att förbättra våra tjänster och för att utveckla nya produkter, funktioner och tekniker som gynnar våra användare och allmänheten", säger den nya Google-policyn. "Vi använder till exempel allmänt tillgänglig information för att träna Googles AI-modeller och bygga produkter och funktioner som Google Translate, Bard, och Cloud AI-funktioner."

Rekommenderade videor

Gizmodo noterar att policyn har uppdaterats för att säga "AI-modeller" när det tidigare sa "för språkmodeller." Dessutom lade policyn till Bard och Cloud AI, när den tidigare bara nämnde Google Translate, för vilken den insamlade data.

Integritetspolicyn, som uppdaterades under helgen, verkar särskilt illavarslande eftersom den indikerar att all information du producerar online är tillgänglig för Google att använda för att träna sin AI-modeller.

Den ovannämnda formuleringen verkar inte bara beskriva de i Googles ekosystem på ett sätt eller en annan men är detaljerad på ett sådant sätt att varumärket skulle kunna ha tillgång till information från vilken del av webben.

Stora frågor kring massutvecklingen av artificiell intelligens är frågor om integritet, plagiat och om AI kan skingra korrekt information. Tidiga versioner av chatbots som ChatGPT är baserade på stora språkmodeller (LLMs) som redan använde offentliga källor, såsom det gemensamma genomsökningswebbarkivet, WebText2, Books1, Books2 och Wikipedia som träningsdata.

Tidiga ChatGPT var ökända för att ha fastnat i information efter 2021 och därefter fyllt i svar med falska uppgifter. Detta kan sannolikt vara en av anledningarna till att Google vill ha obegränsad tillgång till webbdata för att gynna verktyg som Bard, för att ha verklig och potentiellt realtidsutbildning för sina AI-modeller.

Gizmodo noterade också att Google kunde använda denna nya policy för att samla in gammalt, men fortfarande mänskligt genererat innehåll, som t.ex. sedan länge bortglömda recensioner eller blogginlägg, för att fortfarande ha en känsla för hur mänsklig text och tal utvecklas och distribuerad. Ändå återstår det att se exakt hur Google kommer att använda den data som samlas in.

Flera sociala medieplattformar, inklusive Twitter och Reddit, som är stora källor till uppdaterad information har redan begränsat deras offentliga tillgång i kölvattnet av AI chatbot popularitet, till förtret för hela deras samhällen.

Båda plattformarna har stängt fri tillgång till sina API: er, vilket begränsar användare från att ladda ner enorma mängder inlägg för att dela på andra ställen, under sken av att skydda deras immateriella rättigheter. Detta bröt istället många av tredjepartsverktygen som gör att både Twitter och Reddit fungerar smidigt.

Både Twitter och Reddit har varit tvungna att ta itu med andra motgångar och kontroverser när deras ägares oro ökar över att AI tar över.

Redaktörens rekommendationer

  • De bästa AI-videoredigeringsverktygen
  • ChatGPT-tillverkaren OpenAI står inför FTC-utredning över konsumentskyddslagar
  • AI-genombrott kan komma via binas hjärnor, säger forskare
  • De bästa AI-chatbotarna att prova: ChatGPT, Bard och mer
  • OpenAI avslöjar platsen för sin första internationella utpost

Uppgradera din livsstilDigitala trender hjälper läsarna att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.