Alt internettet tilhører nu Googles AI

Google Bard bliver vist frem ved Google IO 2023.

Googles seneste opdatering af dets privatlivspolitik vil gøre det, så virksomheden har fri rækkevidde til at skrabe nettet efter alt indhold, der kan gavne opbygning og forbedring af dets AI-værktøjer.

"Google bruger oplysninger til at forbedre vores tjenester og til at udvikle nye produkter, funktioner og teknologier, der gavner vores brugere og offentligheden," hedder det i den nye Google-politik. "For eksempel bruger vi offentligt tilgængelige oplysninger til at hjælpe med at træne Googles AI-modeller og bygge produkter og funktioner som Google Translate, Bard, og Cloud AI-funktioner."

Anbefalede videoer

Gizmodo bemærker, at politikken er blevet opdateret til at sige "AI-modeller", når den tidligere sagde "for sprogmodeller." Derudover tilføjede politikken Bard og Cloud AI, da den tidligere kun nævnte Google Translate, som den var for indsamlede data.

Privatlivspolitikken, som blev opdateret i weekenden, fremstår især ildevarslende, fordi den angiver, at enhver information, du producerer online, er tilgængelig, som Google kan bruge til at træne sin AI modeller.

Den førnævnte formulering synes ikke kun at beskrive dem i Googles økosystem på én måde eller en anden, men er detaljeret på en sådan måde, at brandet kunne have adgang til information fra enhver del af internettet.

Store spørgsmål omkring masseudviklingen af ​​kunstig intelligens er spørgsmål om privatliv, plagiat og om AI kan fordrive korrekt information. Tidlige versioner af chatbots såsom ChatGPT er baseret på store sprogmodeller (LLM'er), der brugte allerede offentlige kilder, såsom det fælles crawl-webarkiv, WebText2, Books1, Books2 og Wikipedia som træningsdata.

Tidlig ChatGPT var berygtet for at sidde fast på information efter 2021 og efterfølgende udfylde svar med falske data. Dette kunne sandsynligvis være en af ​​grundene til, at Google ville have uhindret adgang til webdata til gavn for værktøjer som Bard, for at have real-world og potentielt real-time træning til sine AI-modeller.

Gizmodo bemærkede også, at Google kunne bruge denne nye politik til at indsamle gammelt, men stadig menneskeskabt indhold, som f.eks. længe glemte anmeldelser eller blogindlæg, for stadig at have en fornemmelse af, hvordan menneskelig tekst og tale udvikles og fordelt. Alligevel er det stadig at se, præcis hvordan Google vil bruge de data, den indsamler.

Adskillige sociale medieplatforme, herunder Twitter og Reddit, som er store kilder til opdateret information har allerede begrænset deres offentlige adgang i kølvandet på AI chatbot popularitet, til ærgrelse for hele deres samfund.

Begge platforme har lukket fri adgang til deres API'er, hvilket begrænser brugerne i at downloade enorme mængder af indlæg til deling andre steder under dække af at beskytte deres intellektuelle ejendom. Dette brød i stedet mange af tredjepartsværktøjerne, der får både Twitter og Reddit til at køre glat.

Både Twitter og Reddit har været nødt til at håndtere andre tilbageslag og kontroverser, efterhånden som deres ejeres bekymringer for at AI tager over.

Redaktørens anbefalinger

  • De bedste AI-videoredigeringsværktøjer
  • ChatGPT-producenten OpenAI står over for FTC-undersøgelse over forbrugerbeskyttelseslove
  • AI-gennembrud kan komme via biernes hjerner, siger videnskabsmænd
  • De bedste AI-chatbots at prøve: ChatGPT, Bard og mere
  • OpenAI afslører placeringen af ​​sin første internationale forpost

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.