Wewnątrz Grafu Wiedzy: dogłębne wyszukiwanie semantyczne Google

Google rozpoczyna udostępnianie swojej nowej technologii Grafu wiedzy swoim anglojęzycznym użytkownikom w Stanach Zjednoczonych. Chociaż nowa usługa będzie pojawiać się raczej jako dodatek do normalnych wyników wyszukiwania Google niż odrębna usługa sama w sobie – reprezentuje zasadniczo inny sposób podejścia szukaj. Zamiast zwracać wyniki wyszukiwania sklasyfikowane w oparciu o dosłowne wyszukiwane hasła (lub niektóre wyszukiwane hasła, lub prawdopodobnie poprawione wersje niektórych wyszukiwanych haseł), Graf wiedzy zasadniczo próbuje powiązać wyszukiwanie zapytania z rzeczy wie o: miejscach, ludziach, książkach, filmach, wydarzeniach – co tylko chcesz. Wykres wiedzy to wysiłek, który należy osiągnąć wyszukiwanie semantyczne, próbując zwrócić wyniki na podstawie znaczenia wyszukiwań użytkowników, a nie tylko dosłownych dopasowań.

Czy Graf wiedzy może zmienić sposób, w jaki wyszukujemy? I co może to oznaczać dla podstawowej działalności Google i witryn, które korzystają z usług Google w zakresie generowania ruchu w swoich witrynach?

Polecane filmy

Wykres wiedzy pod maską

Chociaż Graf wiedzy to całkowicie nowy rodzaj wyszukiwarki Google, podąża on utartymi ścieżkami, którymi Google podąża od lat w swojej głównej usłudze wyszukiwania. Google stara się wprowadzać je w sposób, który nie zakłóca znacząco dominującej na rynku wyszukiwarki.

Powiązany

Rywal Google ChatGPT właśnie pojawił się w wyszukiwarce. Oto jak tego spróbować
Ups — wersja demonstracyjna AI Google Bard została obalona przez pierwszy wynik wyszukiwania
Google właśnie ujawniło, co najbardziej fascynowało Cię w roku 2022

Od lat Google jest w stanie odpowiadać na wybrane proste zapytania oparte na faktach bezpośrednio w wyszukiwarce bar, a nawet wykonaj obliczenia — przydatne dla osób, które częściej korzystają z przeglądarki internetowej niż z przeglądarki internetowej kalkulator. Wypróbuj: Google powinien udzielać bezpośrednich odpowiedzi na pytania takie jak „stolica Surinamu" Lub "pierwiastek kwadratowy 3952.”

Dzięki Grafowi wiedzy Google będzie także umieszczać zapytania w złożonych bazach danych zawierających wzajemnie powiązane informacje na temat… cóż, rzeczy, z braku lepszych warunków. Pod pewnymi względami te bazy danych działają podobnie do tradycyjnego wyszukiwania: zwracają rekordy z ważnymi fragmentami informacji na temat konkretnej rzeczy. W przypadku danej osoby może to być na przykład data urodzenia (a być może także data śmierci), narodowość, tytuły lub urzędy, które mogła sprawować, pełne imię i nazwisko oraz inne informacje.

W przypadku budynku te zbiory danych mogą obejmować takie elementy jak jego lokalizacja, czas budowy, jego całkowity rozmiar, typ (powiedzmy pomnik, powierzchnia handlowa, powierzchnia handlowa, miejsce zamieszkania, hm… stacja kosmiczna?). Jednak oprócz kilku suchych faktów i kilku słów kluczowych, te wpisy bazy danych gromadzą również bezpośrednie linki do nich powiązany obiekty w bazie danych (które z kolei łączą się z innymi powiązanymi obiektami itd.). Najprawdopodobniej określono również charakter tych powiązań. Na przykład wpis dotyczący danej osoby może zawierać łącza do rodziców, małżonka(-ów) i dzieci tej osoby innych znaczących związków oraz potrafić odróżnić członków rodziny od innych typów związków. Baza danych nie spełniałaby swojego zadania, gdyby zbiór danych na temat George’a H. W. Busha (41. prezydenta Stanów Zjednoczonych) nie powiązał się ze zbiorem danych na temat George’a W. Busha (43. prezydenta) – i obaj mieliby powiązania z Condoleezzą Rice, ale na różne sposoby. Zbiór danych na temat Wielkiej Piramidy powinien zawierać linki do Cheopsa, Chufu i Sfinksa, ale także do Mauzoleum w Halikarnasie. (Czy możesz zgadnąć Dlaczego?)

Te zbiory danych stanowią sedno wyszukiwania semantycznego — i nie są tanie. Po pierwsze, są ogromne: suma ludzkiej wiedzy może być jedynie małą plamką na obliczu wszystkiego informacji we wszechświecie, ale samo zeskrobanie usługi może z łatwością wygenerować setki milionów (lub miliardy) zbiorów danych. (Dla porównania, angielska wersja Wikipedii zawiera zaledwie 4 miliony artykułów). Te zbiory danych nie są łatwe do zdobycia: muszą być starannie zebrane z wiarygodnych źródeł. Co więcej, muszą być zorganizowane i zaprojektowane w taki sposób, aby można było uzyskać do nich dostęp i manipulować nimi w użyteczny sposób (w czasie rzeczywistym, dla celów Google). I zbiory danych muszą być w stanie poradzić sobie ze zmienną naturą „wiedzy”. W końcu zaledwie kilka lat temu Pluton był planetą, a Vioxx był zatwierdzonym przez FDA lekiem na chorobę zwyrodnieniową stawów.

Google najwyraźniej buduje swoje bazy danych, korzystając z technologii i metod nabytych w Metaweb w 2010 r. — chociaż Metaweb Darmowa baza semantyczna baza danych pozostaje dostępna dla każdego. Google używa Freebase do przechowywania danych wraz z informacjami pobranymi z Wikipedii i Światowy podręcznik faktów CIA. Google roszczenia w bazie danych Grafu wiedzy znajdują się już wpisy dotyczące około 500 milionów obiektów (należy pamiętać, że obiektów nie można bezpośrednio porównywać z artykuły w Wikipedii) i około 3,5 miliarda „faktów”. Umieściliśmy „fakt” w cudzysłowie, ponieważ kiedyś było „faktem”, że Ziemia jest płaska i ludzie nie mógł latać. Wiedza jest śliska.

Wykres wiedzy na ekranie

Początkowa implementacja Grafu wiedzy przez Google ma na celu uzupełnienie istniejących list wyników wyszukiwania firmy, a nie ich zastępowanie. Tak jak Google czasami wyświetla podgląd stron w panelu po prawej stronie wyników wyszukiwania w standardowym oknie przeglądarki internetowej, wyniki Grafu wiedzy będą wyświetlane w panelach obok wyników wyszukiwania. Nie wszystkie wyszukiwane hasła spowodują utworzenie paneli Grafu wiedzy: zapytania będą musiały pasować do dobrze zdefiniowanych obiektów na Grafie wiedzy. (Nie martw się, jeśli nie widzisz jeszcze wyników Grafu wiedzy; Google wciąż udostępnia tę funkcję i obecnie jest ona dostępna tylko dla anglojęzycznych użytkowników w Stanach Zjednoczonych).

Panele Grafu wiedzy mają na celu wyświetlenie podsumowania kluczowych i najczęściej wyszukiwanych informacji na temat zapytania bez konieczności czytania przez użytkowników dwuliniowych podsumowań strony internetowej lub klikania do innej strona. W przypadku danej osoby te kluczowe fakty mogą obejmować daty urodzenia i śmierci, ważne osoby z nimi związane oraz szybkie zestawienie tytułów, osiągnięć lub innych czynników, które czynią tę osobę znaczącą. W przypadku innych podmiotów Google spróbuje uzyskać kluczowe informacje, statystyki i powiązania. Panel Grafu Wiedzy zajmie się także ujednoznacznianiem. Jeśli do wyszukiwanego hasła pasuje więcej niż jeden element Grafu wiedzy, Google zapewnia dostęp do nich wszystkich.

Co być może ważniejsze, gdy użytkownicy wchodzą w interakcję z encją Grafu wiedzy, mogą, w pewnych granicach, surfować po linkach relacji do tych encji. Na przykład wyświetlenie wpisu w Grafie wiedzy na temat Dashiella Hammetta powinno umożliwić użytkownikom natychmiastowe przejście do podsumowania Grafu wiedzy dotyczącego Chudy mężczyzna I Sokół Maltański — i być może do podsumowań na temat Lillian Helman i antykomunistycznych polowań na czarownice po II wojnie światowej.

Graf wiedzy nie będzie ograniczony do wyszukiwań w przeglądarce: Google udostępnia obecnie wyniki wyszukiwania Grafu wiedzy do większości urządzeń z systemem Android 2.2 lub nowszym (ponownie, tylko w USA w języku angielskim) w polu szybkiego wyszukiwania i w przeglądarce poszukiwacze. Wyniki wyszukiwania Grafu wiedzy zostaną także wprowadzone do przyszłych wersji aplikacji wyszukiwania Google na urządzenia z systemem iOS. Użytkownicy mogą poruszać się po informacjach w Grafie wiedzy, dotykając lub przesuwając palcem w przód i w tył po treści.

Należy pamiętać, że to dopiero pierwsze miejsca, w których Graf wiedzy pojawia się w usługach Google. Za kulisami możesz się spodziewać, że wyniki wyszukiwania Grafu wiedzy zaczną dostarczać informacji do szerokiej gamy usług Google, zwłaszcza w miarę powiększania się zbioru zbiorów danych i „fakty”. Wyszukiwania za pomocą Grafu wiedzy prawdopodobnie nigdy nie będą możliwe zastępować Tradycyjne wyszukiwanie Google oparte na słowach kluczowych — wyszukiwanie semantyczne i wyszukiwanie dosłowne to dwa różne narzędzia, które sprawdzają się w dwóch różnych zadaniach — ale teoretycznie nie byłoby zaskakujące, gdyby Graf wiedzy pewnego dnia przyczynił się aż do jednej czwartej interakcji Google z wyszukiwarką użytkownicy.

Crowdsourcing… czy zajęcia w kolorze Google?

Jak zatem Graf wiedzy wybiera informacje do swoich podsumowań? Jak dotąd Google nie określił zbyt jednoznacznie metodologii prezentacji Grafu wiedzy. Z moich (ograniczonych) próbek wynika, że znaczna część danych, które Google traktuje priorytetowo w swoich podsumowaniach, wydaje się dość spójna: daty, relacje, oraz jedno pole „znaczących osiągnięć” dla osób (które można nazwać np. „Odkryciami”, „Zawódem” lub "Tytuł"). Miejsca otrzymują lokalizacje i daty oraz wybór innych pól, które mogą być dokładnie tym, czego ktoś chce lub całkowicie nieodpowiednie. Na przykład, jeśli patrzysz na Empire State Building, podanie adresu wydaje się właściwe… ale nie jest tak odpowiednie w przypadku, powiedzmy, Stonehenge. Podobne dziwactwa mogą się zdarzyć z numerami telefonów: ile osób potrzebuje natychmiastowego dostępu do numeru telefonu do Taj Mahal?

Google twierdzi, że nadaje priorytet informacjom prezentowanym w podsumowaniach Grafu wiedzy, korzystając z „ludzkiej mądrości”. A przez to Google tego nie robi w rzeczywistości oznaczają rzeczy, które mówią im ludzie lub które zbierają eksperci z danej dziedziny lub kuratorzy baz danych — oznacza to przyjmowanie pośrednich założeń o zamiarach użytkowników poprzez rejestrowanie zachowań związanych z wyszukiwaniem i śledzenie tego, co klikają, czego nie klikają i czego szukają po wykonaniu szukaj. Krótko mówiąc, Google korzysta z crowdsourcingu, aby określić, które „fakty” najlepiej przedstawić w podsumowaniu Grafu wiedzy.

Na przykład Google twierdzi, że podsumowanie Grafu wiedzy, które przedstawia Tomowi Cruise’owi, odpowiada na 37 procent kolejnych zapytań użytkowników wyszukiwarki Google na temat aktora, gdy go szukają. Ta liczba 37 procent brzmi z pewnością naukowo i precyzyjnie, ale nie ma sposobu, aby to ocenić czy ocena Google dotycząca zbiorczego zachowania użytkowników wyszukiwarki ma cokolwiek wspólnego z tym, co robi konkretny użytkownik — tak jak Ty - chce wiedzieć. Ponieważ Google wydaje się być tak dumny z tej liczby 37 procent, odwróćmy to do góry nogami: Google twierdzi, że 63 w większości przypadków nie może przedstawić żadnych informacji na temat znaleziony przez użytkowników wyszukiwania odpowiedni.

Stanowisko Google jest łatwe do zrozumienia: gdy tylko jest to możliwe, chce on natychmiast prezentować informacje, których szukają użytkownicy. Jedynym sposobem, w jaki Google może to naprawdę ocenić, jest sprawdzenie, jak ludzie korzystają z jego wyszukiwarki i zgadywanie.

Crowdsourcing ma swoje niebezpieczeństwa. Tak jak Google stąpa po mętnych wodach, jeśli tak zdecyduje nadaj priorytet wynikom wyszukiwania z Google+ w Search Plus Your World istnieją zagrożenia związane z poleganiem na crowdsourcingu w celu priorytetowego traktowania prezentacji informacji i „faktów”. Tylko To, że odbiorcy wyszukiwarki Google mogą nie wiedzieć (lub szczególnie im nie zależy) na pewnych informacjach, nie oznacza, że nie są one ważne lub odpowiedni. Istnieje wiele przypadków, w których postrzeganie faktów przez „tłum” jest błędne. Większość ludzi uważa, że schizofrenia oznacza posiadanie wielu osobowości, picie mleka lub jedzenie lodów zwiększa produkcję śluzu, a Maria Antonina powiedziała: „Niech jedzą ciasto”. Żadna z tych rzeczy jednak nie jest PRAWDA.

Poleganie na crowdsourcingu w celu oceny ważności informacji stwarza również ryzyko nadużyć. Załóżmy, że rząd chciał zasiać dezinformację na temat dysydentów, kampania polityczna chciała oczernić przeciwnika, a hakerzy chcieli pobawić się wynikami wyszukiwania tylko dla śmiechu? W podobny sposób wyniki wyszukiwania Google „Zbombardowany przez Google”, crowdsourcing może zostać wykorzystany do manipulowania Grafem Wiedzy. Rozsądni ludzie nie uwierzą we wszystko, co przeczytają; podobnie „fakty” prezentowane przez wyszukiwarki semantyczne nie będą wiarygodne, a w niektórych przypadkach crowdsourcing sprawi, że będą one jeszcze mniej wiarygodne.

Zwiększanie lepkości Google

Z praktycznego punktu widzenia Graf wiedzy Google będzie miał jeden natychmiastowy skutek: sprawi, że wyniki wyszukiwania Google będą bardziej przejrzyste. Ilekroć Graf wiedzy może zapewnić bezpośrednią odpowiedź na pytanie użytkownika wyszukiwania lub pozwolić mu szybko do niego przejść za pomocą powiązanych tematów, użytkownicy pozostaną w usługach Google. Oznacza to, że Google gromadzi więcej danych o wyszukiwaniach i zachowaniach użytkowników (niezależnie od tego, czy są oni zalogowani na konto Google, czy nie). To z kolei pozwala Google na dalsze udoskonalanie platformy reklam docelowych.

Oznacza to również, że serwisy takie jak Wikipedia często odpowiadają na te same pytania dotyczące konkretnej wiedzy zapytania kierowane przez Graf wiedzy spowodują spadek natężenia ruchu internetowego, z którego pochodzą Google. W przypadku Wikipedii oznacza to bezpośrednio mniejsze możliwości uzyskania wsparcia społeczności; w przypadku pozostałych usług, co przełoży się bezpośrednio na mniejszą liczbę wyświetleń reklam i (a co za tym idzie) niższe przychody. Dla osób oferujących witryny i usługi oparte na dostarczaniu dyskretnych faktów i informacji — a dotyczy to wszystkiego, od Wikipedii, przez IMDb, po sklepy internetowe do książek telefonicznych i katalogów firm, do (prawdopodobnie) usług crowdsourcingowych, takich jak Yelp, a nawet rejestry publiczne… Graf wiedzy może powoli zniszczyć ich biznes.

Zalecenia redaktorów

Jak korzystać z Google SGE — wypróbuj samodzielnie funkcję wyszukiwania generatywnego
Nie musisz używać Binga – wyszukiwarka Google też ma teraz sztuczną inteligencję
Jak ChatGPT może pomóc firmie Microsoft zdetronizować wyszukiwarkę Google
Google Chrome otrzymuje jedną z najlepszych funkcji Microsoft Edge
Nowe narzędzie Google do ochrony prywatności informuje Cię, czy Twoje dane osobowe wyciekły

Wewnątrz Grafu Wiedzy: dogłębne wyszukiwanie semantyczne Google

Wykres wiedzy pod maską

Wykres wiedzy na ekranie

Crowdsourcing… czy zajęcia w kolorze Google?

Zwiększanie lepkości Google

Zalecenia redaktorów

Kategorie

Niedawny

Reżyser Zero Point, Danfung Dennis, opowiada o kręceniu filmów dla Oculus Rift

Wywiad z producentem Infamous: Second Son, Brianem Flemingiem

Poznaj internetowych szpiegów sprzedających Twoje brudy i dowiedz się, jak możesz ich powstrzymać