Intelligentere Suche: Warum die „semantische Suche“ Google Sie endlich verstehen lässt

Warum die semantische Suche Google Sie endlich verstehen lässt

Amir Efrati vom Wall Street Journal hat mit einem Artikel für Aufsehen gesorgt (Abonnement erforderlich) sagte, Google arbeite daran, seinen Konkurrenten bei der Internetsuche einen Schritt voraus zu sein, indem es mehr sogenannte „semantische Such“-Technologie einführt. Die Idee dahinter ist, dass das Suchfeld von Google nicht nur ein Ort ist, an dem Benutzer Schlüsselwörter oder spezifisch formulierte Suchanfragen eingeben können, sondern ein Feld mit einem tatsächlichen Suchfeld Verständnis von vielen der Begriffe, Namen, Verben und Referenzen, die Menschen eingeben – und könnten dieses Wissen auf die Suchanfragen der Benutzer anwenden. Theoretisch sollte die semantische Suche in der Lage sein, Ergebnisse zurückzugeben, die die Absicht eines Suchenden widerspiegeln In einigen Fällen verbessert sich die Fähigkeit von Google, sofort eine Antwort zu geben, ohne die Nutzer auf eine andere zu verweisen Website.

Aber Moment – ​​ist das etwas Neues? Funktioniert nicht bei Google bereits ein paar Antworten ganz vorne platzieren? Und wie könnte die semantische Suche möglicherweise dazu beitragen, dass Google seinen Vorsprung im Internet-Suchgeschäft behauptet?

Empfohlene Videos

Was ist semantische Suche?

Kurz gesagt, Semantik hat viel mehr mit Watson gemeinsam, der Supercomputing-Anwendung von IBM leicht besiegte Menschen bei Gefahr! als mit dem Suchdialog in Microsoft Word.

Grob gesagt lässt sich die Welt der computergestützten Suche in zwei Arten unterteilen:

Wörtliche Suche (manchmal auch genannt Navigationssuche) sucht nach genauen Übereinstimmungen für einige oder alle der eingegebenen Begriffe und gibt übereinstimmende Elemente zurück – seien es Dateien, Webseiten, Produkte oder eine andere diskrete Informationseinheit. Die wörtliche Suche kann durch Dinge wie Stammvergleich, Konjugate und Assoziationen erweitert werden, die die Suche auf nützliche Weise erweitern oder einschränken – so Wenn Sie nach „Fliegen“ suchen, wird möglicherweise auch „Flug“ gefunden. Mit der wörtlichen Suche sind wir heute am vertrautesten, auch weil sie für Computer am einfachsten ist ausführen.

Semantische Suche unterscheidet sich in zweierlei Hinsicht von der wörtlichen Suche. Zunächst versucht die semantische Suche verstehen was ein Benutzer in einer Anfrage fragt, indem es durch Analyse der Begriffe und der Sprache der Anfrage in einen Kontext gestellt wird. Diese Analyse wird anhand sorgfältig vorab zusammengestellter Wissenspools durchgeführt, die möglicherweise auch Wissen über den Benutzer umfassen. Zweitens versucht die semantische Suche, anstatt eine Reihe von Dateien, Webseiten, Produkten oder anderen Elementen zurückzugeben, eine bereitzustellen Direkte Antwort auf eine Frage. Wenn Sie eine semantische Suchmaschine fragen: „Wann wurde Pluto entdeckt?“ Es könnte antworten: „Pluto wurde am 18. Februar 1930 von Clyde Tombaugh entdeckt*“, wobei eine wörtliche Suchmaschine höchstwahrscheinlich Links zu Webseiten zurückgeben würde, die die Wörter „entdeckt“ und „Pluto“ enthalten.

Es stellt sich heraus, dass die wörtliche Suche und die semantische Suche für verschiedene Aufgaben gut geeignet sind. Die wörtliche Suche eignet sich hervorragend, wenn ein Benutzer nach etwas Bestimmtem sucht Ding, sei es eine Datei, eine Webseite, ein Dokument, ein Produkt, ein Album oder ein anderes diskretes Element. Die semantische Suche hingegen erweist sich als nützlicher, wenn ein Benutzer nach etwas Bestimmtem sucht Information – wie ein Datum, eine Zahl, eine Uhrzeit, ein Ort oder ein Name.

Zum Teil dank der Verbreitung der wörtlichen Suchtechnologie in allen Bereichen, von Textverarbeitungsprogrammen bis hin zu Websuchmaschinen, sind wir am meisten an die wörtliche Suche gewöhnt. Die meisten von uns wissen bereits, wie man die wörtliche Suche manipuliert, um beim ersten Versuch näher an das heranzukommen, was wir wollen. Laut Efratis WSJ-Artikel geht Google jedoch davon aus, dass semantische Suchtechnologie direkte Antworten auf 10 bis 20 Prozent der Websuchen liefern könnte. Laut Comscore, Google 11,7 Milliarden Suchanfragen abgewickelt allein in den Vereinigten Staaten im Februar 2012. Mit semantischen Suchfunktionen hätten mehr als 2,3 Milliarden dieser Suchanfragen direkt beantwortet werden können, anstatt die Leute auf andere Webseiten und Websites zu verweisen.

Macht Google das nicht schon?

Wenn Sie jemals die Google-Websuche verwendet haben, denken Sie wahrscheinlich: „Aber Moment, Google macht das schon!“ Typ "aktuelle Zeit in Tokio" oder "Wie hoch ist der Mount Everest?” und Google wird seine beste Schätzung einer präzisen Antwort oben in seinen Suchergebnissen platzieren. Google nennt sogar Quellen für seine Antwort, und einige dieser Quellen werden in den klassischen „zehn blauen Links“ unter der Antwort aufgeführt. (Google berichtet übrigens, dass der Mount Everest 8.848 Meter hoch ist.)

Fairerweise muss man sagen, dass dies eine von vielen nützlichen Funktionen ist, die Google in seine Suchleiste integriert hat: Sie führt (anspruchsvolle) Berechnungen durch und führt Leistungen aus Einheiten- und Währungsumrechnungen, und rufen Sie Dinge wie Fluginformationen und lokale Kinovorführungszeiten ab – Sie müssen nichts kompliziertes eingeben Abfrage. Es kann auch auf einige öffentliche Datenquellen zugreifen. Geben Sie beispielsweise „Bevölkerung MexikoWenn Sie „in das Suchfeld“ eingeben, werden Daten der Weltbank angezeigt. Die Antwort beträgt heute 113.423.047 Personen.

Die Bemühungen von Google, auf einige Arten von Fragen direkte Antworten zu geben, scheitern jedoch ziemlich schnell, da diese Funktionen größtenteils vorhanden sind werden als Sonderfälle für die wörtliche Suchmaschine von Google implementiert und nicht als semantische Suche, die versucht, zu verstehen, was der Benutzer hat will. Typ "Wie hoch ist der Mount Everest?” (beachten Sie die Schreibweise) in das Suchfeld, und Google versucht nicht einmal, eine Antwort zu geben: Die Google-Suche weiß nicht, dass „mt“ „mount“ bedeutet. Das Gleiche gilt, wenn Google festgestellt hat, dass Ihr aktueller Standort nicht in Mexiko liegt (und wenn Google Ihren Standort nicht hat, wird dies anhand Ihrer IP-Adresse erraten). Und, Nein, Sie können sich nicht abmelden) auf der Suche nach "Bevölkerung Mexiko-Stadt” könnte zu unerwarteten Ergebnissen führen. Sicherlich leben in Mexiko-Stadt mehr als 10.852 Menschen, oder?

Wie unterschiedlich die semantische Suche ist

Die semantische Suche versucht, diese Art von Fauxpas auf zwei Arten zu beseitigen. Zunächst wird versucht, das genauer zu verstehen Absicht hinter einer bestimmten Anfrage. Zweitens wird versucht, die Elemente dieser Abfrage mit vorkompilierten Pools an umfassendem Wissen abzugleichen, um zu sehen, ob eine sinnvolle Antwort gefunden werden kann.

Wenn Sie eine Suchanfrage an eine echte Suchmaschine wie Google senden, wird diese nicht sofort weitergeleitet Sehen Sie sich jede Website im Internet an, sehen Sie sich diese an und melden Sie eine Liste der Websites, von denen Sie glauben, dass sie am besten zu Ihrer Website passen Bedingungen. Stattdessen durchsucht Google mit Softwareprogrammen ständig das Internet nach neuen Websites und neuen Webseiten, die eine erstellen Index von allen Seiten, die sie finden. Obwohl dies eine starke Vereinfachung darstellt, geben Benutzer eine Suchanfrage wie „Konferenz in Jalta„Google durchsucht diesen Index nach Seiten, die sowohl mit „Jalta“ als auch „Konferenz“ übereinstimmen, sowie nach Seiten, auf denen beide Begriffe in unmittelbarer Nähe zueinander vorkommen (z. B. innerhalb von 8 oder 10 Wörtern). Google sammelt dann die URLs für diese Seiten, sortiert sie nach ihrem internen PageRank (Googles Maß für die relativen Vorzüge einer Seite, das im Grunde genommen Links zu dieser Seite als positive Stimmen zählt) und gibt eine Liste zurück.

Die Datenverwaltung und -technik hinter einem solchen Prozess ist sowohl entmutigend als auch gigantisch, und Google verdient großes Lob dafür, dass es gelungen ist – vor allem, da Google dies oft in einem Bruchteil einer Minute erledigen kann zweite. Ähnliches passiert hinter den Kulissen bei Microsofts Bing.

Eine semantische Suche würde dieselbe Abfrage unterschiedlich angehen. Anstatt eine Abfrage mit einem vorkompilierten (und ständig aktualisierten) Index der ihr bekannten Webseiten zu vergleichen, vergleicht eine semantische Suchmaschine die Abfrage mit diskreten, vorkompilierten Wissenssätze es ist verfügbar. Stellen Sie sich Wissensbestände wie Datenbanken vor: Im Grunde sind sie voller Daten, Fakten und Zahlen zu einem bestimmten Thema. Es gibt verschiedene Arten von Wissenssätzen. Ein paar interessante davon sind Ontologien (die formalisierte Informationen darstellen, die mit Regeln, Funktionen und Einschränkungen manipuliert werden können) und Folksonomien, die in der Regel gemeinsam definierte Wissensmengen repräsentieren: Beispiele wären Hashtagging und Social Bookmarks.

Google-Suche

Wissenssätze sind mehr als nur Lagerplätze. Sie stellen auch Beziehungen zwischen Elementen in der Wissensdatenbank dar und ermöglichen die sinnvolle Verwendung von Informationen in allen Bereichen mehrere Wissenssätze. Darüber hinaus werden Beziehungen oft so ausgedrückt, dass genaue logische Schlussfolgerungen gezogen werden können ohne alle möglichen abgeleiteten Daten speichern zu müssen. Das ist ein wenig anthropomorphisierend, aber semantische Suchmaschinen können grundlegende Schlussfolgerungen und Schlussfolgerungen aus den ihnen bekannten Daten ziehen. Als Teil dieses Prozesses werden semantische Suchmaschinen oft so konzipiert, dass sie das Maß an Vertrauen bewerten, das sie in ihre Ableitungen haben. Wenn sie glauben, nicht zu wissen, wovon sie sprechen, bleiben sie möglicherweise stumm. Wenn sie sich ziemlich sicher sind, werden sie eine Antwort ausspucken.

Wenn Sie also „Konferenz von Jalta“ in eine semantische Suchmaschine eingeben, würde diese in ihren Wissenssätzen suchen und möglicherweise einige grundlegende Fakten und Zahlen ausspucken „4. bis 11. Februar 1945.“ Es könnte darauf hindeuten, dass Stalin, Churchill und Franklin Roosevelt anwesend waren, und es war sogar in den letzten Monaten des Weltkriegs wichtig II. Ziemlich einfaches Zeug.

Wenn Sie eine wörtliche Suchmaschine fragen: „Fand die Jalta-Konferenz während des Koreakrieges statt?„Sie erhalten wahrscheinlich nur eine Liste mit zehn blauen Links. Man könnte eine Antwort haben.

Wenn Sie jedoch eine semantische Suchmaschine fragen, sollten Sie eine Ein-Wort-Antwort erhalten: „Nein.“

Das Hier wird die semantische Suche unglaublich interessant.

Ist das nicht Wolfram Alpha?

Wenn diese Fragen nach den Dingen klingen, die die Leute auf sie werfen Wolfram Alpha Suchmaschine, da sind Sie genau richtig. Anstatt ein Index von Webseiten zu sein, versucht Wolfram Alpha, eine Wissensmaschine zu sein. Bei Wolfram Alpha geht es nicht darum, nach etwas zu suchen (z. B. einer Webseite), sondern nach einer Antwort zu fragen. Wolfram Alpha verlässt sich bei der Erstellung seiner Ergebnisse auf vorgefertigte Wissensdatenbanken und das Unternehmen fügt regelmäßig neue Wissensdatenbanken hinzu und aktualisiert diese. Bei einigen handelt es sich um hochspezialisierte technische Daten – etwa Informationen über chemische Elemente oder das Genom der Fruchtfliege –, während andere eher skurriler Natur sind. Wolfram Alpha weiß zum Beispiel ziemlich viel über Katzenrassen.

Solange Sie im Wissensbereich von Wolfram Alpha bleiben, kann es eine nützliche Analyse der Daten durchführen. Wolfram Alpha kann das zum Beispiel Vergleichen Sie die Sprungweiten von Löwen und Tigern. (Es stellt sich heraus, dass sie vergleichbar sind, aber Tiger scheinen im Allgemeinen Löwen zu verdrängen.) Aber wenn Sie es wissen wollen Wie weit können Kängurus springen?? Hoppla, sorry: Keine Daten verfügbar.

Aber die fehlgeschlagene Abfrage zu Känguru-Hopfen zeigt ein wenig darüber, wie Wolfram Alpha versucht, die Dinge zu verstehen. Bevor sie eine Antwort liefert, gibt die Engine an, dass sie davon ausgeht, dass „Känguru“ „Kängurus“ bedeutet. Wallabys“, aber Benutzer können zum Antilopenkänguru, zum Roten Riesenkänguru oder zum Östlichen Grauen wechseln Känguru. In ähnlicher Weise hat Wolfram Alpha „Wie weit kann ein Känguru springen“ als eine Abfrage nach der „Sprungweite“ interpretiert, einem spezifischen Datenpunkt, den es möglicherweise über Tiere hat. Es stellt sich heraus, dass Wolfram Alpha derzeit nicht über diese Daten verfügt, ihre Interpretation der Abfrage ist jedoch sehr wichtig.

Ist das nicht Siri?

Wenn sich diese Fragen wie die Art von Dingen anhören, die man Siri im iPhone 4S zuwirft (aber denken Sie daran, nicht das neue iPad kommt diese Woche auf den Markt), da haben Sie genau Recht. Es ist jedoch wichtig zu bedenken, dass Siri nur die eine Hälfte der Gleichung in Angriff nimmt: das Verstehen der Benutzeranfragen. Auf diese Weise übernimmt Siri das sehr schwierige Rechenproblem, die Sprache eines Benutzers über ein Mikrofon in Echtzeit genau zu erkennen. Das ist keine Kleinigkeit, aber es handelt sich nicht um eine semantische Suchmaschine. Hinter den Kulissen leitet Siri Anfragen an Wolfram Alpha, Yelp und (wenn alles andere fehlschlägt) an die bevorzugte Websuchmaschine des Benutzers weiter. Wenn Sie Siri fragen: „Hat die Jalta-Konferenz während des Koreakrieges stattgefunden“, erkennt sie möglicherweise genau, was Sie fragen – das war bei mir der Fall –, aber es bietet lediglich die Möglichkeit, eine wörtliche Websuche der alten Schule durchzuführen Du.

Siri

Was zu erwarten ist

Das Interesse von Google an der semantischen Suche ist wahrscheinlich zweifach. Erstens möchte es die Technologie wahrscheinlich als weiteren Angeber nutzen, um sich von der Konkurrenz – vor allem Microsoft Bing – abzuheben. Bing hat schon lange eine Partnerschaft mit Wolfram Alpha Entwickelt, um der Suchmaschine zu helfen, wenn möglich direkte Antworten zu liefern. Bisher haben jedoch weder Bing noch Google mit direkten Suchergebnissen große Erfolge bei Verbrauchern erzielt. Schließlich wissen die meisten alltäglichen Suchbenutzer wahrscheinlich nicht, dass die (begrenzten) Funktionen bereits vorhanden sind. Selbst für Nutzer, die sich dessen bewusst sind, scheint selbst Google zu glauben, dass die Technologie nur auf 10 bis 20 Prozent der Suchanfragen anwendbar ist. Das sind viele Suchanfragen, aber es bedeutet, dass die Mehrheit (80 bis 90 Prozent) der Suchanfragen es nicht nutzen.

Da Verbraucher jedoch zunehmend auf Notebooks, Desktops und herkömmliche Computerplattformen verzichten, könnte die Fähigkeit, kurze, leicht verständliche Antworten auf komplizierte Suchanfragen zu geben, zunehmen sehr wichtig in der mobilen Welt. Für Benutzer, die Auto fahren oder aus anderen Gründen nicht bereit sind, mit Tastenfeldern oder Bildschirmtastaturen herumzuspielen, besteht die Möglichkeit, auf gesprochene Fragen wie „Ist Golden Gate Park?“ zu antworten größer als der Central Park?“ oder „Wo geht es zu Malcolms Wohnung?“ mit einfachen Antworten wie „Ja“ und „Biegen Sie die nächste Straße links“ könnten unschätzbare Unterscheidungsmerkmale für Mobilgeräte darstellen Plattformen.

Unternehmen wie Apple und Google wollen die Technologie mit ziemlicher Sicherheit dorthin bringen.

* Tombaugh identifizierte Pluto erstmals am 18. Februar 1930 als sich bewegendes Objekt, Pluto war jedoch bereits mehrfach unabsichtlich entdeckt worden. Das früheste derzeit bekannte Datum stammt aus dem Jahr 1909. Sehen? Wissen ist schlüpfrig.

Foto über: Annette Shaff / Shutterstock.com

Empfehlungen der Redaktion

  • Das gesamte Internet gehört mittlerweile der KI von Google
  • Sie müssen nicht unbedingt Bing verwenden – die Google-Suche verfügt jetzt auch über KI
  • Ups – die Google Bard AI-Demo wird durch das erste Suchergebnis widerlegt
  • So will die Google-Suche gegen Clickbait vorgehen
  • So entfernen Sie persönliche Daten aus der Google-Suche