Inside Knowledge Graph: căutarea semantică aprofundată a Google

Google Knowledge Graph

Google începe să lanseze noua sa tehnologie Knowledge Graph pentru utilizatorii săi vorbitori de engleză din Statele Unite. Deși noul serviciu va apărea ca un adjuvant al rezultatelor obișnuite de căutare pe web ale Google, mai degrabă decât un serviciu separat în sine — reprezintă un mod fundamental diferit de abordare căutare. În loc să returnați rezultate de căutare clasate pe baza termenilor de căutare literali (sau a unor termeni de căutare sau versiuni eventual corectate ale unora dintre termenii de căutare), Knowledge Graph încearcă în esență să asocieze căutarea interogări cu chestie știe despre: locuri, oameni, cărți, filme, evenimente - cum ar fi. Knowledge Graph este un efort de a realiza căutare semantică, încercând să returneze rezultate pe baza semnificației a ceea ce caută utilizatorii, în loc de potriviri literale.

Poate Knowledge Graph să schimbe modul în care căutăm? Și ce ar putea însemna aceasta pentru afacerea fundamentală a Google – și pentru site-urile care se bazează pe Google pentru a aduce trafic pe site-urile lor?

Videoclipuri recomandate

Knowledge Graph sub capotă

Google Knowledge Graph (Curie)

Deși Knowledge Graph este un tip fundamental nou de ofertă de căutare de la Google, acesta urmează căile bine bătute pe care Google le urmărește de ani de zile cu serviciul său de căutare principal. Iar Google are grijă să-l introducă într-un mod care să nu perturbe teribil de căutarea care domina piața.

Legate de

  • Rivalul ChatGPT al Google tocmai s-a lansat în căutare. Iată cum să-l încerci
  • Hopa — demonstrația Google Bard AI este respinsă de primul rezultat al căutării
  • Google tocmai a dezvăluit ceea ce ați considerat cel mai fascinant în 2022

De ani de zile, Google a reușit să răspundă la o selecție de întrebări simple de fapt direct din căutare bară și chiar să faceți niște calcule - la îndemână pentru persoanele care au șanse mai mari să aibă un browser web care rulează decât un calculator. Încercați: Google ar trebui să ofere răspunsuri directe la lucruri precum „capitala Surinamului” sau ”rădăcină pătrată 3952.”

Cu Knowledge Graph, Google va plasa, de asemenea, interogări de căutare în baze de date complexe de informații interconectate despre... ei bine, lucruri, din lipsa unor termeni mai buni. Într-un fel, aceste baze de date funcționează la fel ca o căutare tradițională: returnează înregistrări cu informații importante despre un anumit lucru. Pentru o persoană, aceasta ar putea fi ceva asemănător cu data nașterii (și poate data morții), naționalitățile, titlurile sau funcțiile pe care le-ar fi ocupat, numele legal complet și multe altele.

Pentru o clădire, aceste seturi de date pot include lucruri precum locația sa, când a fost construită, dimensiunea sa totală, tipul ei (să zicem, monument, spațiu comercial, spațiu comercial, reședință, um... stație spațială?). Cu toate acestea, pe lângă câteva fapte simple și câteva cuvinte cheie, aceste intrări în baza de date adună și legături directe către legate de obiecte din baza de date (care, la rândul lor, leagă la alte obiecte înrudite și așa mai departe). După toate probabilitățile, natura acelor legături este de asemenea definită. De exemplu, o intrare în jurul unei persoane poate conține link-uri către părinții, soțul (soții) și copiii acelei persoane și alte relații semnificative și să poată face distincția între membrii familiei și alte tipuri de relații. Baza de date nu și-ar face treaba dacă un set de date pe George H. W. Bush (al 41-lea președinte al Statelor Unite) nu s-a conectat la setul de date despre George W. Bush (al 43-lea președinte) - și ambele s-ar lega de Condoleezza Rice, dar în moduri diferite. Un set de date despre Marea Piramidă ar trebui să includă legături către Keops și Khufu și Sfinxul - dar și către Mausoleul de la Halicarnas. (Poți ghici De ce?)

Aceste seturi de date reprezintă inima căutării semantice - și nu sunt ieftine. În primul rând, sunt uriașe: suma cunoștințelor umane poate fi doar o mică pată în fața tuturor informații din univers, dar doar eliminarea serviciului poate produce cu ușurință sute de milioane (sau miliarde) de seturi de date. (În comparație, versiunea în limba engleză a Wikipedia are aproximativ 4 milioane de articole.) Aceste seturi de date nu sunt ușor de obținut: trebuie să fie compilate cu minuțiozitate din surse de încredere. În plus, acestea trebuie să fie organizate și proiectate astfel încât informațiile să poată fi accesate și manipulate în moduri utile (și în timp real, pentru scopurile Google). Și seturile de date trebuie să fie capabile să facă față naturii maleabile a „cunoașterii”. La urma urmei, cu doar câțiva ani în urmă, Pluto era o planetă, iar Vioxx era un tratament pentru osteoartrita aprobat de FDA.

Se pare că Google își construiește bazele de date folosind tehnologii și metode achiziționate cu Metaweb în 2010 – deși Metaweb Freebase baza de date semantică rămâne disponibilă oricui. Google folosește Freebase pentru date, împreună cu informații culese de pe Wikipedia și CIA World Factbook. Google creanțe baza de date Knowledge Graph are deja intrări pentru aproximativ 500 de milioane de obiecte (rețineți că obiectele nu pot fi comparate direct cu articole Wikipedia) și aproximativ 3,5 miliarde de „fapte”. Am pus „fapt” între ghilimele pentru că odată a fost un „fapt” că Pământul era plat și oameni nu putea zbura. Cunoașterea este alunecoasă.

Knowledge Graph pe ecran

Implementarea inițială de către Google a Knowledge Graph este concepută pentru a spori listele existente ale companiei cu rezultatele căutării, mai degrabă decât să le înlocuiască. Așa cum Google afișează uneori previzualizări ale paginilor dintr-un panou în partea dreaptă a rezultatelor căutării într-o fereastră standard de browser web, rezultatele Knowledge Graph vor apărea în panouri lângă rezultatele căutării. Nu toți termenii de căutare vor produce panouri Knowledge Graph: Interogările vor trebui să se potrivească cu obiecte bine definite din Knowledge Graph. (Nu vă faceți griji dacă nu vedeți încă rezultatele Knowledge Graph; Google încă lansează funcția și, în acest moment, este limitată la utilizatorii care vorbesc engleza din Statele Unite.)

Panourile Knowledge Graph caută să afișeze un rezumat al informațiilor cheie și cele mai căutate despre o interogare fără a solicita utilizatorilor să citească rezumatele pe două rânduri ale unei pagini Web sau să facă clic pe alta site-ul. Pentru o persoană, aceste fapte cheie ar putea include datele de naștere și de deces, persoane semnificative asociate cu acestea și evidențierea rapidă a titlurilor, realizărilor sau ce altceva face ca persoana respectivă să fie semnificativă. Pentru alte entități, Google va încerca să scoată la suprafață informații cheie, statistici și asocieri. Panoul Knowledge Graph se va ocupa, de asemenea, de dezambiguizare. Dacă mai multe entități Knowledge Graph corespund unei interogări de căutare, Google oferă acces la toate acestea.

Poate mai semnificativ, odată ce utilizatorii interacționează cu o entitate Knowledge Graph, pot, în anumite limite, să navigheze pe legăturile relațiilor cu acele entități. De exemplu, apariția unei intrări Knowledge Graph pe Dashiell Hammett ar trebui să permită utilizatorilor să sară imediat la un rezumat Knowledge Graph al Omul Subțire și Soimul maltez — și, poate, la rezumate despre Lillian Helman și vânătoarea de vrăjitoare anticomuniste de după cel de-al Doilea Război Mondial.

Knowledge Graph nu va fi limitat la căutări bazate pe browser: Google lansează în prezent rezultatele căutării Knowledge Graph la majoritatea dispozitivelor care rulează Android 2.2 sau o versiune ulterioară (din nou, numai în S.U.A. în engleză) în caseta de căutare rapidă și bazată pe browser căutători. Rezultatele căutării Knowledge Graph vor fi prezentate și în versiunile viitoare ale aplicației de căutare Google pentru dispozitivele iOS. Utilizatorii pot naviga prin informații în Knowledge Graph atingând sau glisând înainte și înapoi prin conținut.

Google Knowledge Graph (mobil)

Este important să rețineți că acestea sunt doar primele locuri în care Knowledge Graph apare în serviciile Google. În culise, vă puteți aștepta ca rezultatele căutării Knowledge Graph să înceapă să informeze o mare varietate de servicii Google, în special pe măsură ce corpul său de seturi de date și „fapte” crește. Căutările în Knowledge Graph probabil nu vor fi niciodată a inlocui Căutarea tradițională bazată pe cuvinte cheie de la Google - căutarea semantică și căutarea literală sunt un fel de două instrumente diferite, bune pentru două sarcini separate - dar, teoretic, nu ar fi surprinzător dacă Knowledge Graph ar contribui într-o zi la un sfert din interacțiunile Google cu căutarea. utilizatorii.

Crowdsourcing... sau cursuri color Google?

Deci, cum alege Knowledge Graph informații pentru rezumatele sale? Până acum, Google nu a fost foarte explicit cu privire la metodologia din spatele prezentării Knowledge Graph. În eșantionarea mea (limitată), o bună parte din datele pe care Google le acordă prioritate pentru rezumatele sale par a fi destul de consistente: date, relații, și un singur câmp de „realizare semnificativă” pentru oameni (care ar putea fi etichetat cu ceva de genul „Descoperiri” sau „Ocupație” sau "Titlu"). Locațiile obțin locații și date și o selecție de alte câmpuri care ar putea fi exact ceea ce își dorește cineva sau complet nepotrivite. De exemplu, dacă vă uitați la Empire State Building, furnizarea adresei străzii pare adecvată... dar nu este la fel de potrivită pentru, de exemplu, Stonehenge. Ciudățenii similare se pot întâmpla cu numerele de telefon: câți oameni au nevoie de acces instantaneu la un număr de telefon pentru Taj Mahal?

Google Knowledge Graph (Taj Mahal)

Google spune că prioritizează informațiile pe care le prezintă în rezumatele Knowledge Graph folosind „înțelepciunea umană”. Și prin asta, Google nu înseamnă de fapt lucruri pe care oamenii le spun sau pe care experții în subiecte sau curatorii de baze de date le colectează - înseamnă a face presupuneri indirecte despre intențiile utilizatorilor, înregistrând comportamentele de căutare și urmărind ceea ce fac clic, nu fac clic și caută după ce au făcut o căutare. Pe scurt, Google folosește crowdsourcing pentru a încerca să determine care „fapte” sunt cele mai bune de prezentat într-un rezumat Knowledge Graph.

De exemplu, Google spune că informațiile rezumate Knowledge Graph pe care le prezintă pentru Tom Cruise răspund la 37% dintre întrebările de urmărire ale utilizatorilor căutării Google despre actor atunci când îl caută. Acest număr de 37 la sută sună liniştitor de ştiinţific şi precis, dar nu există absolut nicio modalitate de a evalua dacă evaluarea de către Google a comportamentului agregat al utilizatorilor de căutare are vreo legătură cu ceea ce un anumit utilizator - ca tu - vrea sa stie. Deoarece Google pare atât de mândru de această cifră de 37 la sută, să ne întoarcem pe cap: Google spune 63 la sută din timp, nu poate prezenta nicio informație despre un subiect pe care îl găsesc utilizatorii de căutare relevante.

Poziția Google este ușor de înțeles: ori de câte ori este posibil, dorește să prezinte imediat informațiile pe care utilizatorii săi le caută. Singurul mod în care Google poate evalua cu adevărat acest lucru este să analizeze modul în care oamenii își folosesc motorul de căutare și să încerce să ghicească.

Crowdsourcing-ul are pericolele sale. La fel cum Google calcă în ape tulburi atunci când alege prioritizează rezultatele căutării din Google+ în Search Plus Your World, există pericole în a te baza pe crowdsourcing pentru a prioritiza prezentarea informațiilor și a „faptelor”. Doar deoarece publicul de căutare Google poate să nu știe (sau să le pese în mod special) de anumite informații nu înseamnă că nu sunt importante sau relevante. Există o mulțime de cazuri în care percepția „mulțimii” asupra faptelor este greșită. Majoritatea oamenilor cred că schizofrenia înseamnă a avea personalități multiple, a bea lapte sau a mânca înghețată crește producția de mucus, iar Marie Antoinette a spus „Lasă-i să mănânce prăjitură”. Totuși, niciunul dintre aceste lucruri nu este Adevărat.

Bazarea pe crowdsourcing pentru a evalua importanța informațiilor creează, de asemenea, potențial de abuz. Să spunem că un guvern a vrut să semăneze dezinformări despre dizidenți, o campanie politică a vrut să ofenseze un adversar sau hackerii au vrut să se joace cu rezultatele căutării doar pentru râs? În același mod, rezultatele căutării Google au fost „Googlebombed”, crowdsourcing-ul ar putea fi folosit pentru a manipula Knowledge Graph. Oamenii sensibili nu vor crede tot ce citesc; în mod similar, „faptele” prezentate de motoarele de căutare semantice nu vor fi de încredere – iar în unele cazuri, crowdsourcing-ul le va face și mai puțin.

Faceți Google mai lipicioasă

Din punct de vedere practic, Knowledge Graph de la Google va avea un impact imediat: va face rezultatele căutării Google mai lipicioase. Ori de câte ori Knowledge Graph poate oferi un răspuns direct la întrebarea unui utilizator de căutare – sau îi permite să navigheze rapid la el prin subiecte conexe – utilizatorii vor rămâne pe serviciile Google. Aceasta înseamnă că Google colectează mai multe date despre căutările și comportamentele utilizatorilor (indiferent dacă aceștia sunt sau nu conectați la un cont Google). Aceasta, la rândul său, îi permite Google să-și rafinească și mai mult platforma de publicitate vizată.

De asemenea, înseamnă că servicii precum Wikipedia care răspund adesea la aceleași tipuri de cunoștințe specifice interogările vizate de Knowledge Graph vor înregistra o scădere a cantității de trafic web pe care îl primesc de la Google. În cazul Wikipedia, asta corespunde direct cu mai puține oportunități de a solicita sprijinul comunității; pentru alte servicii, acest lucru se va traduce direct într-un număr mai mic de afișări de anunțuri și (prin urmare) venituri mai mici. Pentru cei care oferă site-uri și servicii bazate pe furnizarea de fapte și informații discrete - și asta include totul, de la Wikipedia la IMDb și la comercianții cu amănuntul online la cărțile telefonice și directoarele de afaceri către (probabil) servicii aglomerate precum Yelp și chiar înregistrările publice... Knowledge Graph le-ar putea eroda încet. afacerilor.

Recomandările editorilor

  • Cum să utilizați Google SGE — încercați singur experiența generativă de căutare
  • Nu trebuie să utilizați Bing – Căutarea Google are și acum AI
  • Cum ar putea ChatGPT să ajute Microsoft să detroneze Căutarea Google
  • Google Chrome primește una dintre cele mai bune caracteristici ale Microsoft Edge
  • Noul instrument de confidențialitate al Google vă informează dacă informațiile dvs. personale au fost scurse