Intelligensebb keresés: Miért engedi, hogy a „szemantikus keresés” végül megértse a Google-t

Miért-szemantikus-keresés-végre-engedi-a-Google-megérteni

A Wall Street Journalban megjelent Amir Efrati egy cikkel vonta fel a szemöldökét (előfizetés szükséges) szerint a Google azon dolgozik, hogy megelőzze riválisait az internetes keresésben az úgynevezett „szemantikus keresés” technológia bevezetésével. Az ötlet az, hogy a Google keresőmezője nem csak egy olyan hely lenne, ahol a felhasználók beírhatnak kulcsszavakat vagy speciálisan kialakított lekérdezéseket, hanem egy olyan mező lenne, amelyben tényleges megértés az emberek által beírt kifejezések, nevek, igék és hivatkozások közül sok közül – és ezt a tudást a felhasználók keresései során alkalmazhatják. Elméletileg a szemantikus keresésnek képesnek kell lennie arra, hogy olyan eredményeket adjon vissza, amelyek tükrözik a kereső szándékát egyes esetekben javítja a Google azon képességét, hogy azonnal válaszoljon anélkül, hogy a felhasználókat másikhoz irányítaná webhely.

De várjunk csak – ez valami újdonság? Nem Google már írj néhány választ rögtön előre? És hogyan segítheti a szemantikus keresés a Google-t, hogy megőrizze vezető helyét az internetes keresési üzletágban?

Ajánlott videók

Mi az a szemantikus keresés?

Dióhéjban a szemantikának sokkal több közös vonása van a Watsonnal, az IBM szuperszámítógép-alkalmazásával, könnyedén legyőzte az embereket nál nél Veszély! mint a Microsoft Word Keresés párbeszédpaneljével.

Lazán szólva a számítógépes keresés világa két típusra oszlik:

Szó szerinti keresés (néha hívják navigációs keresés) pontos egyezéseket keres a beírt kifejezések egy részére vagy mindegyikére, és visszaadja a megfelelő elemeket – legyen szó fájlokról, weboldalakról, termékekről vagy más különálló információegységekről. A szó szerinti keresés kiegészíthető olyan dolgokkal, mint a tőegyezés, konjugátumok és asszociációk, amelyek hasznos módon bővítik vagy korlátozzák a keresést – így a „fly” kifejezésre keresve a „repülés” kifejezést is elérheti. A szó szerinti keresés az, amit ma a legjobban ismerünk, részben azért, mert ezzel a legkönnyebb a számítógépek számára előadni.

Szemantikus keresés két dologban különbözik a szó szerinti kereséstől. Először a szemantikai keresés próbálkozik megért mit kérdez a felhasználó a lekérdezésben azáltal, hogy a lekérdezés kifejezéseinek és nyelvének elemzése révén kontextusba helyezi azt. Ezt az elemzést szorosan előre összeállított tudáskészletek alapján végezzük, amelyek potenciálisan tartalmazzák a felhasználóról szóló ismereteket is. Másodszor, ahelyett, hogy fájlokat, weboldalakat, termékeket vagy egyéb elemeket adna vissza, a szemantikus keresés megpróbál egy közvetlen kérdésre válaszolni. Ha megkérdezi egy szemantikus keresőmotortól: „Mikor fedezték fel a Plútót?” talán a válasz: „A Plútót 1930. február 18-án fedezte fel Clyde Tombaugh*”, ahol egy szó szerinti keresőmotor nagy valószínűséggel olyan weboldalakra mutató hivatkozásokat ad vissza, amelyek a „felfedezett” és a „Plútó” szavakat tartalmazzák.

Kiderült, hogy a szó szerinti keresés és a szemantikai keresés alkalmas különböző feladatokra. A szó szerinti keresés nagyszerű, ha a felhasználó konkrétat keres dolog, legyen az fájl, weboldal, dokumentum, termék, album vagy más különálló elem. A szemantikus keresés viszont hasznosabbnak bizonyul, ha a felhasználó konkrétat keres információ – például dátum, szám, idő, hely vagy név.

Részben a szó szerinti keresési technológia elterjedésének köszönhetően a szövegszerkesztőktől a webes keresőmotorokig mindenben a szó szerinti kereséshez vagyunk hozzászokva. A legtöbben már tudják, hogyan kell manipulálni a szó szerinti keresést, hogy az első próbálkozásra közelebb kerüljünk ahhoz, amit akarunk. Efrati WSJ cikke szerint azonban a Google úgy véli, hogy a szemantikus keresési technológia a webes keresések 10-20 százalékára adhatna közvetlen választ. A Comscore szerint a Google 11,7 milliárd keresést bonyolított le egyedül az Egyesült Államokban 2012 februárjában. A szemantikus keresési lehetőségekkel a keresések közül több mint 2,3 milliárdra lehetett volna közvetlenül válaszolni, ahelyett, hogy az embereket más weboldalakra vagy webhelyekre irányították volna.

A Google még nem csinálja ezt?

Ha egyáltalán használta a Google internetes keresést, akkor valószínűleg arra gondol: „De várjunk csak, a Google már csinálja ezt!” Típus "pontos idő Tokióban” vagy „milyen magas a Mount Everest” és a Google a legjobb tippjeit adja a pontos válaszra a keresési eredmények tetején. A Google még forrásokat is idéz a válaszához, és ezek közül néhány a klasszikus „tíz kék hivatkozásban” található a válasz alatt. (A Google jelentése szerint a Mount Everest egyébként 8848 méter magas.)

Az igazság kedvéért, ez egy a sok hasznos képesség közül, amelyeket a Google beépített a keresősávjába: (kifinomult) matematikai feladatokat végez, teljesít. mértékegység- és pénznemátváltásokat, valamint olyan dolgokat kereshet, mint a repülési információk és a helyi filmek vetítési ideje – nem kell bonyolult gépelni lekérdezés. Néhány nyilvános adatforráshoz is hozzáférhet. Például írja be, hogy „lakosság Mexikó” a keresőmezőbe a Világbank adatai jelennek meg. A mai válasz 113 423 047 fő.

A Google azon törekvése azonban, hogy bizonyos típusú kérdésekre közvetlen válaszokat adjon, meglehetősen gyorsan meghiúsul, mivel ezek a funkciók nagyrészt speciális esetekként valósítják meg a Google szó szerinti keresőmotorjában, nem pedig szemantikus keresésként, amely megpróbálja megérteni, hogy a felhasználó mit akar. Típus "milyen magas a mt everest” (figyelje meg a helyesírást) a keresőmezőbe, és a Google meg sem próbál választ adni: a Google kereső nem tudja, hogy az „mt” „mount”-ot jelent. Hasonlóképpen, ha a Google megállapította, hogy az Ön jelenlegi tartózkodási helye nem Mexikóban van (és ha a Google nem ismeri a tartózkodási helyét, akkor az Ön IP-címe alapján találja ki és, nem, nem iratkozhat ki) keresés "lakosságú mexikóváros” váratlan eredményt adhat. Biztosan Mexikóváros több mint 10 852 embernek ad otthont, igaz?

Mennyiben más a szemantikai keresés

A szemantikus keresés kétféleképpen próbálja kiküszöbölni az ilyen jellegű tévedéseket. Először is megpróbálja pontosabban megérteni a elszánt egy adott lekérdezés mögött. Másodszor, megpróbálja összevetni a lekérdezés elemeit a mélyreható tudás előre összeállított készleteivel, hogy kiderüljön, tud-e értelmes választ adni.

Amikor elküld egy lekérdezést egy szó szerinti keresőmotornak, például a Google-nak, az nem tömörül ki azonnal az internet minden webhelyét, nézze át őket, és jelentse a szerinte leginkább megfelelő webhelyek listáját feltételeket. Ehelyett a Google olyan szoftverekkel rendelkezik, amelyek folyamatosan keresik az internetet új webhelyek és új weboldalak után, amelyek index az összes talált oldalról. Bár ez túlzott leegyszerűsítés, amikor a felhasználók olyan keresési lekérdezést írnak be, mint a "Jaltai konferencia”, a Google megvizsgálja ezt az indexet a „Jalta” és a „konferencia” szóval is egyező oldalak esetében, valamint azon oldalak esetében, amelyeken mindkét kifejezés közel van egymáshoz (mondjuk 8 vagy 10 szón belül). A Google ezután összegyűjti az oldalak URL-címeit, belső PageRank-értéke (a Google által az oldal relatív érdemeinek mérőszáma, amely alapvetően az oldalra mutató linkeket pozitív szavazatként számolja) szerint rendezi, és visszaad egy listát.

Az ilyen folyamatok mögött meghúzódó adatkezelés és tervezés egyszerre ijesztő és mamut, és a Google is dicséretet érdemel a sikeréért – különösen azért, mert a Google ezt gyakran a töredéke alatt képes megtenni második. Hasonló dolgok történnek a Microsoft Bing színfalai mögött.

A szemantikus keresés másképpen közelítené meg ugyanazt a lekérdezést. A szemantikus keresőmotor ahelyett, hogy összehasonlítaná a lekérdezést egy előre összeállított (és folyamatosan frissített) weblap-indexszel, amelyről tud, a szemantikus keresőmotor összehasonlítja a lekérdezést a diszkrét, előre teljesített lekérdezéssel. tudáskészletek elérhető. Gondoljon az olyan tudáskészletekre, mint az adatbázisok: szívük szerint tele vannak adatokkal, tényekkel és számadatokkal egy adott témáról. Különféle tudáskészletek léteznek. Néhány érdekesség ontológiák (amelyek formalizált információkat képviselnek, amelyek szabályokkal, függvényekkel és korlátozásokkal manipulálhatók) és népszonómiák, amelyek általában közösen definiált tudáskészleteket képviselnek: Ilyenek például a hashtagging és a közösségi könyvjelzők.

Google kereső

A tudáskészletek nem csupán tárolórekeszek. A tudásbázis elemei közötti kapcsolatokat is képviselik, és lehetővé teszik az információk értelmes felhasználását többszörös tudáskészletek. Ezenkívül az összefüggéseket gyakran úgy fejezik ki, hogy pontos logikai következtetéseket lehessen levonni nélkül minden lehetséges származékos adatot tárolnia kell. Ez egy kicsit antropomorfizálás, de a szemantikus keresőmotorok alapvető érvelést és következtetést tudnak végezni az általuk ismert adatokon. Ennek a folyamatnak a részeként a szemantikus keresőmotorokat gyakran úgy alakítják ki, hogy felmérjék a levezetéseikbe vetett bizalom szintjét. Ha azt hiszik, hogy nem tudják, miről beszélnek, némák maradhatnak. Ha egészen biztosak benne, kiköpnek választ.

Tehát ha beírja a „jaltai konferencia” kifejezést egy szemantikus keresőmotorba, az belenéz a tudáskészletébe, és valószínűleg kiköp néhány alapvető tényt és adatot. „1945. február 4-től 11-ig.” Ez arra utalhat, hogy Sztálin, Churchill és Franklin Roosevelt is részt vett, és még a világháború záró hónapjaiban is fontos volt. II. Elég alap cucc.

Ha egy szó szerinti keresőt kérdezel "A jaltai konferencia a koreai háború alatt történt?” valószínűleg csak egy tíz kék linket tartalmazó listát fog kapni. Lehet, hogy valakinek van válasza.

Ha azonban egy szemantikus keresőmotort kérdez, egyszavas választ kell kapnia: „Nem”.

Hogy itt válik hihetetlenül érdekessé a szemantikai keresés.

Ez nem a Wolfram Alpha?

Ha ezek a lekérdezések úgy hangzanak, mint amilyeneket az emberek a Wolfram Alpha kereső, teljesen igazad van. A Wolfram Alpha ahelyett, hogy weblapok indexe lenne, tudásmotorként próbál lenni. A Wolfram Alpha nem egy dolog (például egy weboldal) kereséséről szól, hanem arról, hogy választ kérünk. A Wolfram Alpha előre meghatározott tudásbázisokra támaszkodik az eredmények eléréséhez, és a vállalat rendszeresen bővíti és frissíti az új tudásbázisokat. Egyesek rendkívül speciális technikai adatok – például a kémiai elemekre vagy a gyümölcslégy genomjára vonatkozó információk –, míg mások szeszélyesebbek. Például Wolfram Alpha elég sokat tud a macskafajtákról.

Mindaddig, amíg a Wolfram Alpha tudásának határain belül marad, hasznos elemzést végezhet az adatokon. Például a Wolfram Alpha képes hasonlítsa össze az oroszlánok és a tigrisek ugrási távolságait. (Kiderült, hogy hasonlóak, de úgy tűnik, hogy a tigrisek általában túlszárnyalják az oroszlánokat.) De ha tudni akarod milyen messzire tudnak ugrani a kenguruk? Hoppá, elnézést: nem állnak rendelkezésre adatok.

De a sikertelen lekérdezés a kenguru ugrálással egy kicsit megmutatja, hogy Wolfram Alpha hogyan próbálja megérteni a dolgokat. Mielőtt választ adna, a motor jelzi, hogy feltételezi, hogy a „kenguru” jelentése „kenguruk, Wallabies”, de a felhasználók válthatnak az antilopin kenguru, a vörös kenguru vagy a keleti szürke kenguru. Hasonlóképpen, Wolfram Alpha úgy értelmezte, hogy „meddig ugorhat egy kenguru” az „ugrótávolság” lekérdezéseként, egy konkrét adatpontként, amely az állatokkal kapcsolatban lehet. Kiderült, hogy a Wolfram Alpha jelenleg nem rendelkezik ilyen adatokkal, de a lekérdezés értelmezése nagyon fontos.

Ez nem Siri?

Ha ezek a lekérdezések olyan dolgoknak tűnnek, amelyeket az emberek Sirinek dobnak az iPhone 4S-ben (de ne feledje, nem a héten debütáló új iPad), pontosan igazad van. Fontos azonban megjegyezni, hogy a Siri az egyenletnek csak az egyik felét kezeli: a felhasználói lekérdezések megértését. Ennek során a Siri vállalja azt a nagyon nehéz számítástechnikai problémát, hogy valós időben pontosan felismeri a felhasználó beszédét mikrofonon keresztül. Ez nem kis teljesítmény, de ez nem egy szemantikai keresőmotor. A színfalak mögött a Siri lekérdezéseket küld a Wolfram Alpha, a Yelp és (ha minden más nem sikerül) a felhasználó által preferált webes keresőmotornak. Ha megkérdezi Siritől: „Megtörtént-e a jaltai konferencia a koreai háború alatt”, akkor pontosan felismerheti, hogy mit Ön azt kérdezi – nekem megtette –, de csak felajánlja, hogy egy régimódi, szó szerinti internetes keresést végez te.

siri

Mi várható

A Google szemantikus keresés iránti érdeklődése valószínűleg kettős. Először is, valószínűleg szeretné használni a technológiát, mint egy újabb kérkedést, amely megelőzi a versenytársakat – főleg a Microsoft Binget. Bing már régóta a partnerség a Wolfram Alpha-val célja, hogy segítse a keresőmotort, hogy közvetlen válaszokat adjon, amikor lehetséges. Mindeddig azonban sem a Bing, sem a Google nem lépett jelentősebb előre a fogyasztók körében a közvetlen keresési eredményekkel. Végül is a legtöbb hétköznapi keresőfelhasználó valószínűleg nem tudja, hogy a (korlátozott) lehetőségek már léteznek. Még azok a felhasználók is, akik tisztában vannak velük, még a Google is úgy gondolja, hogy a technológia csak a keresések 10-20 százalékára alkalmazható. Ez sok keresés, de azt jelenti, hogy a keresések többsége (80-90 százaléka) nem használja.

Mivel azonban a fogyasztók gyorsan elhagyják a notebookokat, asztali számítógépeket és a hagyományos számítástechnikai platformokat, a bonyolult keresési lekérdezésekre rövid, könnyen érthető válaszok adásának képessége válhat. nagyon fontos a mobil világban. Azon felhasználók számára, akik vezetnek, vagy más okból nem hajlandóak a billentyűzettel vagy a képernyő-billentyűzetekkel babrálni, lehetőség nyílik olyan hangos lekérdezésekre válaszolni, mint például „A Golden Gate Park” nagyobb, mint a Central Park? vagy „Mely út Malcolm lakásába?” Az olyan egyszerű válaszok, mint az „Igen” és a „Térjen balra”, felbecsülhetetlen értékűek lehetnek a mobileszközökön platformok.

Szinte biztos, hogy az olyan cégek, mint az Apple és a Google, szeretnék átvenni a technológiát.

* Tombaugh először 1930. február 18-án azonosította a Plútót mozgó objektumként, de a Plútót több korábbi alkalommal is észrevétlenül észlelték. A jelenleg ismert legkorábbi 1909-es. Lát? A tudás csúszós.

Fotó: Annette Shaff / Shutterstock.com

Szerkesztői ajánlások

  • Az egész internet mostantól a Google mesterséges intelligenciájához tartozik
  • Nem kell használnia a Binget – a Google Keresésben is van mesterséges intelligencia
  • Hoppá! A Google Bard AI demóját az első keresési eredmény cáfolja
  • Így tervezi a Google Keresés a kattintáscsali elleni küzdelmet
  • Személyes adatok eltávolítása a Google keresésből