Google begynder at udrulle sin nye Knowledge Graph-teknologi til sine engelsktalende brugere i USA. Selvom den nye tjeneste vil dukke op som et supplement til Googles normale websøgeresultater - snarere end en separat tjeneste i sig selv - den repræsenterer en fundamentalt anderledes måde at henvende sig på Søg. I stedet for at returnere rangerede søgeresultater baseret på bogstavelige søgetermer (eller nogle søgetermer, eller muligvis korrigerede versioner af nogle søgetermer), forsøger Knowledge Graph i det væsentlige at tilknytte søgning forespørgsler med ting og sager den kender til: steder, mennesker, bøger, film, begivenheder - you name it. Knowledge Graph er et forsøg på at opnå semantisk søgning, der forsøger at returnere resultater baseret på betydningen af det, brugere søger efter, i stedet for blot bogstavelige matches.
Kan vidensgrafen ændre den måde, vi søger på? Og hvad kan det betyde for Googles grundlæggende forretning - og websteder, der er afhængige af Google til at bringe trafik til deres websteder?
Anbefalede videoer
Vidensgraf under motorhjelmen
Selvom Knowledge Graph er en fundamentalt ny slags søgetilbud fra Google, følger den gennemtrådte veje, som Google har fulgt i årevis med sin almindelige søgetjeneste. Og Google er omhyggelig med at introducere det på en måde, der ikke er voldsomt forstyrrende for dens markedsdominerende søgning.
Relaterede
- Googles ChatGPT-rival er netop lanceret i søgning. Sådan prøver du det
- Ups – Google Bard AI-demoen modbevises af det første søgeresultat
- Google har netop afsløret, hvad du fandt mest fascinerende i 2022
Google har i årevis været i stand til at besvare et udvalg af simple faktuelle forespørgsler direkte fra søgningen bar, og endda lave noget matematik — praktisk for folk, der er mere tilbøjelige til at have en webbrowser kørende end en lommeregner. Prøv det: Google bør give direkte svar på ting som "hovedstaden i surinam" eller "kvadratrod 3952.”
Med Knowledge Graph vil Google også droppe søgeforespørgsler i komplekse databaser med indbyrdes relaterede oplysninger om … ting, i mangel af bedre vilkår. På nogle måder fungerer disse databaser meget som et traditionelt opslag: de returnerer poster med vigtige informationer om en bestemt ting. For en person kan det være noget som deres fødselsdato (og måske dødsdato), deres nationaliteter, titler eller embeder, de måtte have haft, fulde juridiske navn og mere.
For en bygning kan disse datasæt omfatte ting som dens placering, hvornår den blev bygget, dens overordnede størrelse, dens type (f.eks. monument, butikslokale, kommerciel plads, bolig, um...rumstation?). Men ud over hvad der svarer til nogle få fakta og nogle nøgleord, samler disse databaseposter også direkte links til relaterede objekter i databasen (som igen linker til andre relaterede objekter, og så videre). Med al sandsynlighed er arten af disse links også defineret. For eksempel kan et indlæg omkring en person indeholde links til denne persons forældre, ægtefælle(r) og børn, og andre væsentlige relationer og være i stand til at skelne mellem familiemedlemmer og andre typer relationer. Databasen ville ikke gøre sit arbejde, hvis et datasæt om George H. W. Bush (USA's 41. præsident) linkede ikke til datasættet på George W. Bush (den 43. præsident) - og begge ville linke til Condoleezza Rice, men på forskellige måder. Et datasæt om den store pyramide bør indeholde links til Cheops og Khufu og Sfinxen - men også til mausoleet ved Halicarnassus. (Kan du gætte hvorfor?)
Disse datasæt udgør hjertet af semantisk søgning - og de er ikke billige. Først og fremmest er de enorme: Summen af menneskelig viden kan kun være en lille plet i ansigtet af alle de information i universet, men bare at skrabe tjenesten kan nemt producere hundredvis af millioner (eller milliarder) af datasæt. (Til sammenligning har den engelske version af Wikipedia knappe 4 millioner eller deromkring artikler.) Disse datasæt er ikke nemme at få fat i: de skal omhyggeligt kompileres fra pålidelige kilder. Desuden skal de være organiseret og designet på en sådan måde, at oplysningerne kan tilgås og manipuleres på nyttige måder (og i realtid til Googles formål). Og datasættene skal være i stand til at klare den formbare natur af "viden". For bare et par år siden var Pluto en planet, og Vioxx var en FDA-godkendt slidgigtbehandling.
Google bygger tilsyneladende sine databaser ved hjælp af teknologier og metoder erhvervet med Metaweb tilbage i 2010 - selvom Metawebs Freebase semantisk database forbliver tilgængelig for alle. Google bruger Freebase til data sammen med information hentet fra Wikipedia og CIA World Factbook. Google påstande dens Knowledge Graph-database har allerede indgange for omkring 500 millioner objekter (bemærk venligst, at objekterne ikke kan sammenlignes direkte med Wikipedia-artikler) og omkring 3,5 milliarder "fakta". Vi satte "faktum" i anførselstegn, fordi det engang var et "kendsgerning", at Jorden var flad og mennesker ikke kunne flyve. Viden er glat.
Vidensgraf på skærmen
Googles indledende implementering af Knowledge Graph er designet til at udvide virksomhedens eksisterende søgeresultatlister i stedet for at erstatte dem. På samme måde som Google nogle gange viser forhåndsvisninger af sider i et panel til højre for søgeresultaterne i et standard webbrowservindue, vil Knowledge Graph-resultater blive vist i paneler ved siden af søgeresultaterne. Ikke alle søgetermer vil producere videnskartpaneler: Forespørgsler skal matche veldefinerede objekter i vidensdiagrammet. (Bare rolig, hvis du ikke kan se resultaterne fra Knowledge Graph endnu; Google ruller stadig funktionen ud, og lige nu er den begrænset til engelsktalende brugere i USA.)
Knowledge Graph-panelerne søger at vise en oversigt over de vigtigste og mest søgte oplysninger om en forespørgsel uden at kræve, at brugerne læser gennem to-linjers resuméer af en webside eller klikker videre til en anden websted. For en person kan disse nøglefakta omfatte fødsels- og dødsdatoer, betydningsfulde personer forbundet med dem og hurtige højdepunkter af titler, præstationer eller hvad der ellers gør denne person betydningsfuld. For andre enheder vil Google forsøge at fremkomme med nøgleoplysninger, statistikker og associationer. Panelet Knowledge Graph vil også håndtere disambiguation. Hvis mere end én Knowledge Graph-enhed matcher en søgeforespørgsel, giver Google adgang til dem alle.
Måske mere væsentligt, når brugere først interagerer med en videngraf-enhed, kan de inden for nogle grænser surfe på links til relationer til disse entiteter. For eksempel burde trække en vidensgraf-indgang op på Dashiell Hammett give brugerne mulighed for straks at springe til en vidensgraf-oversigt over Den tynde mand og Malteserfalken - og måske til resuméer om Lillian Helman og antikommunistiske heksejagter efter Anden Verdenskrig.
Knowledge Graph vil ikke være begrænset til browserbaserede søgninger: Google udruller i øjeblikket Knowledge Graph-søgeresultater til de fleste enheder, der kører Android 2.2 eller nyere (igen, kun USA på engelsk) i feltet Hurtig søgning og browserbaseret søgende. Knowledge Graph-søgeresultater vil også blive introduceret til kommende versioner af Googles søgeapp til iOS-enheder. Brugere kan navigere gennem oplysningerne i vidensgrafen ved at trykke eller stryge frem og tilbage gennem indholdet.
Det er vigtigt at bemærke, at dette blot er de første steder, Knowledge Graph dukker op i Googles tjenester. Bag kulisserne kan du forvente, at Knowledge Graph-søgeresultater begynder at informere en bred vifte af Google-tjenester, især efterhånden som dets korpus af datasæt og "fakta" vokser. Knowledge Graph-søgninger vil sandsynligvis aldrig erstatte Googles traditionelle søgeordsbaserede søgning - semantisk søgning og bogstavelig søgning er en slags to forskellige værktøjer, der er gode til to separate opgaver - men i teorien ville det ikke være overraskende, hvis Knowledge Graph en dag bidrog til så meget som en fjerdedel af Googles interaktioner med søgning brugere.
Crowdsourcing... eller Google-farvede klasser?
Så hvordan vælger Knowledge Graph information til sine resuméer? Indtil videre har Google ikke været særlig eksplicit om metoden bag Knowledge Graphs præsentation. I min (begrænsede) stikprøve synes en god del af de data, Google prioriterer til sine resuméer, at være ret konsistente: datoer, relationer, og et enkelt "betydelig præstation"-felt for mennesker (som kunne mærkes noget som "Opdagelser" eller "Besættelse" eller "Titel"). Steder får lokationer og datoer, og et udvalg af andre felter, der kunne være præcis, hvad nogen ønsker, eller helt upassende. For eksempel, hvis du kigger på Empire State Building, virker det passende at angive gadeadressen... men det er ikke helt så passende for for eksempel Stonehenge. Lignende mærkværdigheder kan ske med telefonnumre: hvor mange mennesker har brug for øjeblikkelig adgang til et telefonnummer til Taj Mahal?
Google siger, at det prioriterer de oplysninger, det præsenterer i vidensdiagramresuméer ved hjælp af "menneskelig visdom". Og det gør Google ikke mener faktisk ting, som mennesker fortæller dem, eller som fageksperter eller databasekuratorer indsamler - det betyder at lave indirekte antagelser om brugernes hensigter ved at logge søgeadfærd og holde styr på, hvad de klikker på, ikke klikker på og kigger efter efter at have udført en Søg. Kort fortalt bruger Google crowdsourcing til at forsøge at afgøre, hvilke "fakta" der er de bedste at præsentere i et vidensdiagram.
For eksempel siger Google, at vidensdiagrammet, den præsenterer for Tom Cruise, besvarer 37 procent af Google-søgebrugeres opfølgende forespørgsler om skuespilleren, når de søger efter ham. Det tal på 37 procent lyder betryggende videnskabeligt og præcist, men der er absolut ingen måde at vurdere om Googles vurdering af søgebrugeres samlede adfærd har noget at gøre med, hvad en bestemt bruger – synes godt om du - vil vide. Da Google virker så stolt af det tal på 37 procent, lad os vende det på hovedet: Google siger 63 procent af tiden, kan den ikke præsentere nogen information om et emne, som dens søgebrugere finder relevant.
Googles holdning er let at forstå: Når det er muligt, ønsker det straks at præsentere den information, som brugerne søger. Den eneste måde Google virkelig kan vurdere det på er ved at se på, hvordan folk bruger dens søgemaskine og forsøge at gætte.
Crowdsourcing har sine farer. Ligesom Google træder i grumset vand, når det vælger det prioritere søgeresultater fra Google+ i Search Plus Your World er der farer ved at stole på crowdsourcing for at prioritere præsentationen af information og "fakta". Lige fordi Googles søgepublikum måske ikke kender (eller er særlig interesseret) om visse oplysninger, betyder det ikke, at det ikke er vigtigt eller relevant. Der er masser af tilfælde, hvor "mængdens" opfattelse af fakta er forkert. De fleste mennesker tror, at skizofreni betyder at have flere personligheder, drikke mælk eller spise is øger slimproduktionen, og Marie Antoinette sagde "Lad dem spise kage." Alligevel er ingen af disse ting rigtigt.
At stole på crowdsourcing for at vurdere vigtigheden af information skaber også potentiale for misbrug. Lad os sige, at en regering ønskede at udlede misinformation om dissidenter, en politisk kampagne ønskede at smøre en modstander, eller hackere ønskede at lege med søgeresultater bare for at grine? På nogenlunde samme måde har Googles søgeresultater været "Googlebombet,” kunne crowdsourcing bruges til at manipulere Knowledge Graph. Fornuftige mennesker vil ikke tro på alt, hvad de læser; på samme måde vil "fakta" præsenteret af semantiske søgemaskiner ikke være pålidelige - og i nogle tilfælde vil crowdsourcing gøre dem endnu mindre.
Gør Google mere klæbrig
På den praktiske side vil Googles vidensgraf have én umiddelbar effekt: Det vil gøre Googles søgeresultater mere klæbrige. Når Knowledge Graph kan give et direkte svar på en søgebrugers spørgsmål - eller lade dem navigere hurtigt til det via relaterede emner - vil brugerne blive på Google-tjenester. Det betyder, at Google indsamler flere data om brugernes søgninger og adfærd (uanset om de er logget ind på en Google-konto eller ej). Det lader til gengæld Google yderligere forfine sin målrettede annonceringsplatform.
Det betyder også, at tjenester som Wikipedia, der ofte besvarer den samme slags vidensspecifikke forespørgsler målrettet af Knowledge Graph vil se et fald i mængden af webtrafik, de modtager fra Google. I Wikipedias tilfælde svarer det direkte til færre muligheder for at søge samfundsstøtte; for andre tjenester, vil det direkte oversætte til et lavere antal annoncevisninger og (dermed) lavere indtjening. For folk, der tilbyder websteder og tjenester baseret på at give diskrete fakta og oplysninger - og det inkluderer alt fra Wikipedia til IMDb til online-forhandlere til telefonbøger og virksomhedskataloger til (tænkeligt) crowd-sourcede tjenester som Yelp og endda offentlige registre...Knowledge Graph kan langsomt udhule deres virksomheder.
Redaktørens anbefalinger
- Sådan bruger du Google SGE - prøv selv den søgegenerative oplevelse
- Du behøver ikke bruge Bing – Google Search har også AI nu
- Hvordan ChatGPT kunne hjælpe Microsoft med at detronisere Google Søgning
- Google Chrome får en af Microsoft Edges bedste funktioner
- Googles nye privatlivsværktøj fortæller dig, om dine personlige oplysninger blev lækket