Inside Knowledge Graph: a Google mélyreható szemantikai keresése

Google Tudásgráf

A Google megkezdi új Knowledge Graph technológiájának bevezetését angolul beszélő felhasználói számára az Egyesült Államokban. Bár az új szolgáltatás a Google normál internetes keresési eredményeinek kiegészítéseként fog felbukkanni – inkább mint egy önálló szolgáltatás – alapvetően más megközelítési módot képvisel keresés. Ahelyett, hogy a szó szerinti keresési kifejezések (vagy egyes keresési kifejezések, ill egyes keresési kifejezések esetleg javított változatai), a Tudásgráf lényegében megpróbálja társítani a keresést lekérdezések dolog tud a következőkről: helyekről, emberekről, könyvekről, filmekről, eseményekről – te nevezed. A Tudásgráf az elérésre irányuló erőfeszítés szemantikus keresés, amely a felhasználók által keresett kifejezések jelentése alapján próbálja visszaadni a találatokat a szó szerinti egyezések helyett.

Megváltoztathatja-e a Tudásgráf a keresés módját? És mit jelenthet ez a Google alapvető üzleti tevékenysége számára – és azon webhelyek számára, amelyek a Google-ra támaszkodnak, hogy forgalmat irányítsanak webhelyeikre?

Ajánlott videók

Tudásgráf a motorháztető alatt

Google Tudásgráf (Curie)

Bár a Knowledge Graph egy alapvetően új típusú keresési ajánlat a Google-tól, jól bejáratott utakat követ, amelyeket a Google már évek óta követ a mainstream keresőszolgáltatásával. A Google pedig ügyel arra, hogy olyan módon vezesse be, ami ne zavarja túlságosan a piacot meghatározó keresését.

Összefüggő

  • A Google ChatGPT riválisa most indult a keresésben. Íme, hogyan próbálja ki
  • Hoppá! A Google Bard AI demóját az első keresési eredmény cáfolja
  • A Google most felfedte, mi volt a leglenyűgözőbb 2022-ben

A Google évek óta képes válaszolni néhány egyszerű ténykérdésre közvetlenül a keresésből bárban, és még számolni is kell – praktikus azok számára, akiknél nagyobb valószínűséggel fut webböngésző, mint a számológép. Próbáld ki: a Google-nak közvetlen választ kell adnia olyan dolgokra, mint példáulsuriname fővárosa” vagy „négyzetgyök 3952.”

A Knowledge Graph segítségével a Google a keresési lekérdezéseket összetett adatbázisokba helyezi, amelyek egymással összefüggő információkat tartalmaznak… nos, dolgok, jobb feltételek híján. Bizonyos szempontból ezek az adatbázisok a hagyományos kereséshez hasonlóan működnek: rekordokat adnak vissza egy adott dologról szóló fontos információval. Egy személy esetében ez lehet például a születési dátuma (és talán a halálozási dátuma), a nemzetiségük, az esetleg betöltött címük vagy tisztségük, a teljes hivatalos neve stb.

Egy épület esetében ezek az adatkészletek olyan dolgokat tartalmazhatnak, mint a helye, az építkezés ideje, a teljes mérete, a típusa (mondjuk műemlék, üzlethelyiség, kereskedelmi terület, lakóhely, hm… űrállomás?). Azonban amellett, hogy néhány puszta tény és néhány kulcsszó, ezek az adatbázis-bejegyzések összegyűjtik a közvetlen linkeket is összefüggő objektumok az adatbázisban (amelyek viszont más kapcsolódó objektumokhoz kapcsolódnak, és így tovább). Valószínűleg ezeknek a kapcsolatoknak a természete is meghatározott. Például egy személy körüli bejegyzés tartalmazhat hivatkozásokat az adott személy szüleire, házastársára és gyermekeire, és más jelentős kapcsolatokat, és tudjon különbséget tenni a családtagok és más típusú kapcsolatok között. Az adatbázis nem tenné a dolgát, ha egy adatkészlet George H. W. Bush (az Egyesült Államok 41. elnöke) nem hivatkozott a George W. Bush (a 43. elnök) – és mindkettő Condoleezza Rice-hoz kapcsolódik, de más-más módon. A Nagy Piramisról szóló adatkészletnek tartalmaznia kell a Kheopszra és Khufura, valamint a Szfinxre – de a halikarnasszusi mauzóleumra is – hivatkozásokat. (Kitalálod miért?)

Ezek az adatkészletek alkotják a szemantikus keresés szívét – és nem olcsók. Először is, hatalmasak: az emberi tudás összessége csak egy apró folt az összes információ az univerzumban, de ha csak a szolgáltatást lekaparjuk, akkor könnyen százmilliók (vagy milliárdok) keletkezhetnek adathalmazok. (Összehasonlításképpen: a Wikipédia angol verziójában alig 4 millió szócikk található.) Ezeket az adatkészleteket nem könnyű megszerezni: megbízható forrásokból gondosan kell összeállítani őket. Ezenkívül azokat úgy kell megszervezni és megtervezni, hogy az információk hasznos módon (és valós időben, a Google céljaira) hozzáférhetőek és manipulálhatók legyenek. És az adatkészleteknek képesnek kell lenniük megbirkózni a „tudás” férfias természetével. Végtére is, alig néhány évvel ezelőtt a Plútó bolygó volt, a Vioxx pedig az FDA által jóváhagyott osteoarthritis kezelésére szolgáló gyógyszer.

A Google láthatóan a Metawebnél 2010-ben szerzett technológiák és módszerek segítségével építi adatbázisait – bár a Metaweb Freebase szemantikai adatbázis bárki számára elérhető marad. A Google a Freebase-t használja adatokhoz, valamint a Wikipédiából és a CIA World Factbook. Google állítja a Tudásgráf adatbázisa már körülbelül 500 millió objektumhoz tartalmaz bejegyzéseket (kérjük, vegye figyelembe, hogy az objektumokat nem lehet közvetlenül összehasonlítani Wikipédia cikkek) és mintegy 3,5 milliárd „tény”. A „tény” szót idézőjelbe tesszük, mert egykor „tény” volt, hogy a Föld lapos és emberek nem tudott repülni. A tudás csúszós.

Tudásgráf a képernyőn

A Google által a Knowledge Graph kezdeti implementációja a vállalat meglévő keresési találati listájának bővítésére szolgál, nem pedig lecserélésére. Ahogyan a Google néha egy normál webböngésző ablakban a keresési eredmények jobb oldalán lévő panelen megjeleníti az oldalak előnézetét, a Tudásgráf eredményei a keresési eredmények melletti paneleken jelennek meg. Nem minden keresési kifejezés hoz létre Tudásgráf paneleket: A lekérdezéseknek meg kell felelniük a Tudásgráf jól meghatározott objektumainak. (Ne aggódjon, ha még nem látja a Tudásgráf eredményeit; A Google még mindig bevezeti a funkciót, és jelenleg az Egyesült Államok angolul beszélő felhasználóira korlátozódik.)

A Tudásgráf panelek egy lekérdezéssel kapcsolatos legfontosabb és legkeresettebb információk összegzését kívánják megjeleníteni. anélkül, hogy a felhasználóknak át kellene olvasniuk egy weboldal kétsoros összefoglalóját, vagy át kellene kattintaniuk egy másik oldalra webhely. Egy személy számára ezek a kulcsfontosságú tények magukban foglalhatják a születési és halálozási dátumokat, a hozzájuk kapcsolódó jelentős személyeket, valamint a címek, teljesítmények gyors kiemelését vagy azt, hogy mi teszi az adott személyt jelentőssé. Más entitások esetében a Google megpróbálja megjeleníteni a kulcsfontosságú információkat, statisztikákat és összefüggéseket. A Tudásgráf panel az egyértelműsítést is kezeli. Ha egynél több Tudásgráf entitás felel meg egy keresési lekérdezésnek, a Google mindegyikhez hozzáférést biztosít.

Talán még ennél is fontosabb, hogy miután a felhasználók interakcióba lépnek egy Tudásgráf entitással, bizonyos korlátok között böngészhetnek az adott entitásokhoz fűződő kapcsolatok linkjein. Például egy Tudásgráf-bejegyzés felhúzása a Dashiell Hammett webhelyen lehetővé teszi a felhasználók számára, hogy azonnal a Tudásgráf összefoglalójához ugorjanak. A vékony ember és A máltai sólyom - és talán összefoglalók Lillian Helmanről és a második világháború utáni antikommunista boszorkányüldözésekről.

A Tudásgráf nem korlátozódik a böngészőalapú keresésekre: a Google jelenleg a Knowledge Graph keresési eredményeit vezeti be a legtöbb Android 2.2 vagy újabb rendszert futtató eszközre (ismét csak az Egyesült Államokban, angolul) a Gyorskereső mezőben és böngészőalapú keresők. A Knowledge Graph keresési eredményeit a Google iOS-eszközökre készült keresőalkalmazásának hamarosan megjelenő verziói is bemutatják. A felhasználók a Tudásgráf információi között navigálhatnak, ha megérintik vagy előre-hátra csúsztatják a tartalmat.

Google Tudásgráf (mobil)

Fontos megjegyezni, hogy ezek csak az első helyek, ahol a Knowledge Graph megjelenik a Google szolgáltatásaiban. A színfalak mögött arra számíthat, hogy a Tudásgráf keresési eredményei a Google szolgáltatások széles skáláját fogják tájékoztatni, különösen az adathalmazok és a „tények” állományának növekedésével. A Tudásgráf keresések valószínűleg soha nem fognak cserélje ki A Google hagyományos kulcsszó alapú keresése – a szemantikus keresés és a szó szerinti keresés két különböző eszköz, amely két különböző feladatra alkalmas – de elméletileg nem lenne meglepő, ha a Tudásgráf egy napon akár a Google kereséssel folytatott interakcióinak negyedéhez is hozzájárulna. felhasználókat.

Crowdsourcing… vagy Google színes osztályok?

Tehát hogyan választja ki a Tudásgráf információkat az összefoglalóihoz? A Google eddig nem nagyon nyilatkozott a Knowledge Graph prezentációja mögött meghúzódó módszertanról. Az én (korlátozott) mintavételemben a Google által az összefoglalókhoz prioritásként kezelt adatok jó része meglehetősen konzisztensnek tűnik: dátumok, kapcsolatok, és egyetlen „jelentős teljesítmény” mező az emberek számára (amely lehet „Felfedezések” vagy „Foglalkozás” vagy "Cím"). A helyek megkapják a helyeket és a dátumokat, valamint számos más mezőt, amelyek pontosan olyanok lehetnek, amelyeket valaki szeretne, vagy teljesen nem megfelelő. Például, ha az Empire State Building-et nézi, az utcanév megadása megfelelőnek tűnik… de mondjuk Stonehenge számára nem egészen megfelelő. Hasonló furcsaságok történhetnek a telefonszámokkal: hány embernek kell azonnal hozzáférnie egy telefonszámhoz a Tádzs Mahalhoz?

Google Tudásgráf (Taj Mahal)

A Google azt állítja, hogy az „emberi bölcsesség” felhasználásával előtérbe helyezi a Tudásgráf összefoglalóiban közölt információkat. És emiatt a Google nem valójában olyan dolgokat jelent, amelyeket az emberek mondanak nekik, vagy amelyeket a téma szakértői vagy adatbázis-kurátorai gyűjtenek – ez azt jelenti, hogy közvetett feltételezéseket tesznek a felhasználók szándékairól azáltal, hogy naplózza a keresési viselkedést, és figyelemmel kíséri, hogy mire kattintanak, mire nem kattintanak, és mire keresnek keresés. Dióhéjban a Google a crowdsourcing segítségével próbálja meghatározni, hogy mely „tények” a legjobbak a Tudásgráf összefoglalójában.

Például a Google azt állítja, hogy a Tudásgráf összefoglaló információi, amelyeket Tom Cruise számára mutat be, a Google keresőfelhasználóinak a színészre vonatkozó további kérdéseinek 37 százalékára választ adnak, amikor rákeresnek. Ez a 37 százalékos szám megnyugtatóan tudományosan és precízen hangzik, de egyáltalán nem lehet értékelni hogy a Google keresési felhasználók összesített viselkedésére vonatkozó értékelésének van-e köze ahhoz, hogy egy adott felhasználó mit? mint te - akarja tudni. Mivel a Google nagyon büszke a 37 százalékos adatra, fordítsuk a fejére: a Google szerint 63 az esetek százalékában nem tud semmilyen információt felmutatni egy olyan témáról, amelyet a kereső felhasználói találnak ide vonatkozó.

A Google álláspontja könnyen érthető: amikor csak lehetséges, azonnal meg akarja jeleníteni a felhasználók által keresett információkat. A Google csak úgy tudja igazán értékelni ezt, ha megvizsgálja, hogyan használják az emberek a keresőmotorját, és megpróbálnak találgatni.

A közösségi beszerzésnek megvannak a maga veszélyei. Ahogy a Google is zavaros vizeken lépked, amikor úgy dönt előnyben részesítheti a Google+ keresési eredményeit A Search Plus Your World alkalmazásban veszélyeket rejt magában, ha a crowdsourcingra hagyatkozik az információk és a „tények” bemutatásának előtérbe helyezésében. Éppen mert a Google keresési közönsége nem tud (vagy nem különösebben törődik vele) bizonyos információkkal, ez nem jelenti azt, hogy nem fontosak vagy ide vonatkozó. Rengeteg olyan eset van, amikor a „tömeg” tényfelfogása téves. A legtöbb ember azt gondolja, hogy a skizofrénia több személyiséget, tejet iszik vagy fagylaltot jelent növeli a nyálkatermelést, és Marie Antoinette azt mondta: „Egyenek tortát”. De ezek közül egyik sem az igaz.

Ha a crowdsourcingra hagyatkozik az információ fontosságának felmérésére, az visszaélések lehetőségét is teremti. Tegyük fel, hogy egy kormány félretájékoztatja a másként gondolkodókról, egy politikai kampány akart bekenni egy ellenfelet, vagy hackerek akartak játszani a keresési eredményekkel pusztán a nevetés miatt? Ugyanúgy, mint a Google keresési eredményeiGoogle bombázott”, a crowdsourcing felhasználható a Knowledge Graph manipulálására. Az értelmes emberek nem hisznek el mindent, amit olvasnak; hasonlóképpen a szemantikus keresőmotorok által bemutatott „tények” nem lesznek megbízhatóak – és bizonyos esetekben a crowdsourcing még kevésbé lesz megbízható.

A Google ragadósabbá tétele

Ami a gyakorlati oldalt illeti, a Google Tudásgráfja azonnali hatással lesz: ragadósabbá teszi a Google keresési eredményeit. Amikor a Tudásgráf közvetlen választ tud adni egy keresőfelhasználó kérdésére – vagy lehetővé teszi számukra, hogy gyorsan eljussanak hozzá a kapcsolódó témákon keresztül –, a felhasználók a Google szolgáltatásaiban maradnak. Ez azt jelenti, hogy a Google több adatot gyűjt a felhasználók kereséseiről és viselkedéséről (függetlenül attól, hogy bejelentkeztek-e Google-fiókba vagy sem). Ez viszont lehetővé teszi a Google számára, hogy tovább finomítsa célzott hirdetési platformját.

Ez azt is jelenti, hogy az olyan szolgáltatások, mint a Wikipédia, gyakran ugyanazokra a tudásspecifikus kérdésekre válaszolnak a Knowledge Graph által megcélzott lekérdezéseknél csökkenni fog a beérkező webforgalom mennyisége Google. A Wikipédia esetében ez közvetlenül azt jelenti, hogy kevesebb lehetőség van a közösség támogatására; más szolgáltatások esetében ez közvetlenül a hirdetésmegjelenítések számának csökkenését és (tehát) alacsonyabb bevételt eredményez. Azoknak, akik diszkrét tényeken és információkon alapuló webhelyeket és szolgáltatásokat kínálnak – és ez magában foglal mindent a Wikipédiától az IMDb-n át az online kiskereskedőkig a telefonkönyvekre és az üzleti címjegyzékekre (elképzelhető) a tömegből származó szolgáltatásokra, mint például a Yelp, és még nyilvános nyilvántartásokra is… A Knowledge Graph lassan tönkreteheti vállalkozásokat.

Szerkesztői ajánlások

  • A Google SGE használata – próbálja ki saját maga a keresési generatív élményt
  • Nem kell használnia a Binget – a Google Keresésben is van mesterséges intelligencia
  • Hogyan segíthet a ChatGPT a Microsoftnak letaszítani a trónról a Google Keresést?
  • A Google Chrome megkapja a Microsoft Edge egyik legjobb funkcióját
  • A Google új adatvédelmi eszköze tudatja Önnel, ha személyes adatai kiszivárogtak