Googles siste oppdatering av personvernreglene vil gjøre det slik at selskapet har ledig rekkevidde for å skrape nettet etter alt innhold som kan være til nytte for å bygge og forbedre AI-verktøyene.
«Google bruker informasjon for å forbedre tjenestene våre og for å utvikle nye produkter, funksjoner og teknologier som kommer brukerne våre og publikum til gode», heter det i den nye Google-retningslinjen. «For eksempel bruker vi offentlig tilgjengelig informasjon for å hjelpe med å trene Googles AI-modeller og bygge produkter og funksjoner som Google Translate, Bard, og Cloud AI-funksjoner."
Anbefalte videoer
Gizmodo bemerker at policyen har blitt oppdatert til å si "AI-modeller" når den tidligere sa "for språkmodeller." I tillegg la policyen til Bard og Cloud AI, da den tidligere bare nevnte Google Translate, som den var for innsamlet data.
Personvernreglene, som ble oppdatert i løpet av helgen, fremstår som spesielt illevarslende fordi den indikerer at all informasjon du produserer på nettet er tilgjengelig for Google å bruke til opplæring av sine AI-modeller.
Den nevnte ordlyden ser ut til å beskrive ikke bare de i Googles økosystem på én måte eller en annen, men er detaljert på en slik måte at merket kan ha tilgang til informasjon fra hvilken som helst del av nettet.
Store spørsmål rundt masseutviklingen av kunstig intelligens er spørsmål om personvern, plagiering og om AI kan fordrive korrekt informasjon. Tidlige versjoner av chatbots som ChatGPT er basert på store språkmodeller (LLMs) som brukte allerede offentlige kilder, for eksempel det vanlige gjennomsøkingsnettarkivet, WebText2, Books1, Books2 og Wikipedia som treningsdata.
Tidlig ChatGPT var beryktet for å bli sittende fast på informasjon utover 2021 og deretter fylle ut svar med falske data. Dette kan sannsynligvis være en av grunnene til at Google ønsker uhindret tilgang til nettdata til fordel for verktøy som Bard, for å ha real-world og potensielt sanntidsopplæring for sine AI-modeller.
Gizmodo bemerket også at Google kunne bruke denne nye policyen til å samle inn gammelt, men fortsatt menneskeskapt innhold, som f.eks. lenge glemte anmeldelser eller blogginnlegg, for fortsatt å ha en følelse av hvordan menneskelig tekst og tale utvikles og distribuert. Det gjenstår likevel å se nøyaktig hvordan Google vil bruke dataene den samler inn.
Flere sosiale medieplattformer, inkludert Twitter og Reddit, som er viktige kilder til oppdatert informasjon har allerede begrenset offentlig tilgang i kjølvannet av AI chatbot popularitet, til irritasjon for hele lokalsamfunnene deres.
Begge plattformene har stengt fri tilgang til API-ene deres, noe som begrenser brukerne fra å laste ned enorme mengder innlegg for deling andre steder, under dekke av å beskytte deres intellektuelle eiendom. Dette ødela i stedet mange av tredjepartsverktøyene som får både Twitter og Reddit til å fungere problemfritt.
Både Twitter og Reddit har måttet håndtere andre tilbakeslag og kontroverser ettersom eiernes bekymringer øker om AI tar over.
Redaktørenes anbefalinger
- De beste AI-videoredigeringsverktøyene
- ChatGPT-produsenten OpenAI står overfor FTC-undersøkelse over forbrukerbeskyttelseslover
- AI-gjennombrudd kan komme via hjernen til bier, sier forskere
- De beste AI-chatbotene å prøve ut: ChatGPT, Bard og mer
- OpenAI avslører plasseringen av sin første internasjonale utpost
Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.