Inside Knowledge Graph: Η βαθιά σημασιολογική αναζήτηση της Google

Γράφημα γνώσεων Google

Η Google αρχίζει να διαθέτει τη νέα τεχνολογία Γράφημα Γνώσης στους αγγλόφωνους χρήστες της στις Ηνωμένες Πολιτείες. Παρόλο που η νέα υπηρεσία θα εμφανιστεί ως συμπλήρωμα στα κανονικά αποτελέσματα αναζήτησης στο Web της Google — μάλλον παρά μια ξεχωριστή υπηρεσία από μόνη της — αντιπροσωπεύει έναν θεμελιωδώς διαφορετικό τρόπο προσέγγισης Αναζήτηση. Αντί να επιστρέφετε ταξινομημένα αποτελέσματα αναζήτησης με βάση κυριολεκτικούς όρους αναζήτησης (ή ορισμένους όρους αναζήτησης ή πιθανώς-διορθωμένες εκδόσεις ορισμένων όρων αναζήτησης), το Γράφημα Γνώσης ουσιαστικά επιχειρεί να συσχετίσει την αναζήτηση ερωτήματα με υλικό Γνωρίζει για: μέρη, ανθρώπους, βιβλία, ταινίες, συμβάντα — το πείτε. Το Γράφημα Γνώσης είναι μια προσπάθεια να επιτευχθεί σημασιολογική αναζήτηση, προσπαθώντας να επιστρέψει αποτελέσματα με βάση το νόημα αυτού που αναζητούν οι χρήστες, αντί για απλώς κυριολεκτικές αντιστοιχίσεις.

Μπορεί το Γράφημα Γνώσης να αλλάξει τον τρόπο αναζήτησης; Και τι μπορεί να σημαίνει για τη θεμελιώδη επιχείρηση της Google — και τους ιστότοπους που βασίζονται στην Google για να φέρουν επισκεψιμότητα στους ιστότοπούς τους;

Προτεινόμενα βίντεο

Γράφημα γνώσης κάτω από την κουκούλα

Γράφημα γνώσεων Google (Curie)

Αν και το Γράφημα Γνώσης είναι ένα θεμελιωδώς νέο είδος προσφοράς αναζήτησης από την Google, ακολουθεί καλοπερπατημένα μονοπάτια που η Google ακολουθεί εδώ και χρόνια με την κύρια υπηρεσία αναζήτησης. Και η Google φροντίζει να το εισαγάγει με τρόπο που να μην ενοχλεί τρομερά την αναζήτησή της που κυριαρχεί στην αγορά.

Σχετίζεται με

  • Ο αντίπαλος ChatGPT της Google μόλις ξεκίνησε στην αναζήτηση. Δείτε πώς να το δοκιμάσετε
  • Ωχ — Η επίδειξη του Google Bard AI διαψεύδεται από το πρώτο αποτέλεσμα αναζήτησης
  • Η Google μόλις αποκάλυψε τι βρήκατε πιο συναρπαστικό το 2022

Για χρόνια, η Google ήταν σε θέση να απαντήσει σε μια επιλογή απλών πραγματικών ερωτημάτων απευθείας από την αναζήτηση bar, και ακόμη και να κάνετε κάποια μαθηματικά — εύχρηστο για άτομα που είναι πιο πιθανό να έχουν ένα πρόγραμμα περιήγησης στο Web σε λειτουργία από ένα αριθμομηχανή. Δοκιμάστε το: Η Google θα πρέπει να παρέχει άμεσες απαντήσεις σε πράγματα όπως "πρωτεύουσα του Σουρινάμ" ή "τετραγωνική ρίζα 3952.”

Με το Γράφημα Γνώσης, η Google θα ρίχνει επίσης ερωτήματα αναζήτησης σε σύνθετες βάσεις δεδομένων αλληλένδετων πληροφοριών σχετικά με… πράγματα, λόγω έλλειψης καλύτερων όρων. Κατά κάποιο τρόπο, αυτές οι βάσεις δεδομένων λειτουργούν σαν μια παραδοσιακή αναζήτηση: επιστρέφουν εγγραφές με σημαντικά κομμάτια πληροφοριών για ένα συγκεκριμένο πράγμα. Για ένα άτομο, αυτό μπορεί να είναι κάτι σαν την ημερομηνία γέννησής του (και ίσως την ημερομηνία θανάτου), τις εθνικότητες, τους τίτλους ή τα αξιώματα που μπορεί να κατείχαν, το πλήρες νόμιμο όνομα και πολλά άλλα.

Για ένα κτίριο, αυτά τα σύνολα δεδομένων μπορεί να περιλαμβάνουν πράγματα όπως η τοποθεσία του, πότε χτίστηκε, το συνολικό του μέγεθος, ο τύπος του (ας πούμε, μνημείο, χώρος λιανικής, εμπορικός χώρος, κατοικία, χ...διαστημικός σταθμός;). Ωστόσο, εκτός από μερικά απλά γεγονότα και μερικές λέξεις-κλειδιά, αυτές οι εγγραφές βάσης δεδομένων συλλέγουν επίσης απευθείας συνδέσμους προς σχετίζεται με αντικείμενα στη βάση δεδομένων (τα οποία με τη σειρά τους συνδέονται με άλλα σχετικά αντικείμενα και ούτω καθεξής). Κατά πάσα πιθανότητα, ορίζεται και η φύση αυτών των συνδέσμων. Για παράδειγμα, μια καταχώριση γύρω από ένα άτομο μπορεί να περιέχει συνδέσμους με τους γονείς, τους συζύγους και τα παιδιά αυτού του ατόμου και άλλες σημαντικές σχέσεις και να είναι σε θέση να διακρίνει μεταξύ των μελών της οικογένειας και άλλων τύπων σχέσεων. Η βάση δεδομένων δεν θα έκανε τη δουλειά της εάν ένα σύνολο δεδομένων για τον George H. W. Ο Μπους (ο 41ος Πρόεδρος των Ηνωμένων Πολιτειών) δεν συνδέθηκε με τα δεδομένα του George W. Μπους (ο 43ος Πρόεδρος) — και οι δύο θα συνδέονταν με την Κοντολίζα Ράις, αλλά με διαφορετικούς τρόπους. Ένα σύνολο δεδομένων για τη Μεγάλη Πυραμίδα θα πρέπει να περιλαμβάνει συνδέσμους με τον Χέοπα και τον Χούφου και τη Σφίγγα — αλλά και με το Μαυσωλείο στην Αλικαρνασσό. (Μπορείτε να μαντέψετε Γιατί?)

Αυτά τα σύνολα δεδομένων αποτελούν την καρδιά της σημασιολογικής αναζήτησης — και δεν είναι φθηνά. Πρώτα απ 'όλα, είναι τεράστιες: Το άθροισμα της ανθρώπινης γνώσης μπορεί να είναι μόνο ένα μικρό κομμάτι μπροστά σε όλα τα πληροφορίες στο σύμπαν, αλλά και μόνο η απόξεση της υπηρεσίας μπορεί εύκολα να παράγει εκατοντάδες εκατομμύρια (ή δισεκατομμύρια) των συνόλων δεδομένων. (Σε σύγκριση, η αγγλική έκδοση της Wikipedia έχει λίγα περίπου 4 εκατομμύρια άρθρα.) Αυτά τα σύνολα δεδομένων δεν είναι εύκολο να τα αποκτήσετε: πρέπει να συγκεντρωθούν με κόπο από αξιόπιστες πηγές. Επιπλέον, πρέπει να οργανωθούν και να σχεδιαστούν με τέτοιο τρόπο ώστε να είναι δυνατή η πρόσβαση και ο χειρισμός των πληροφοριών με χρήσιμους τρόπους (και σε πραγματικό χρόνο, για τους σκοπούς της Google). Και τα σύνολα δεδομένων πρέπει να είναι σε θέση να αντιμετωπίσουν την αρσενική φύση της «γνώσης». Εξάλλου, μόλις πριν από λίγα χρόνια, ο Πλούτωνας ήταν πλανήτης και το Vioxx ήταν μια εγκεκριμένη από τον FDA θεραπεία οστεοαρθρίτιδας.

Η Google προφανώς χτίζει τις βάσεις δεδομένων της χρησιμοποιώντας τεχνολογίες και μεθόδους που αποκτήθηκαν με το Metaweb το 2010 — αν και η Metaweb Freebase Η σημασιολογική βάση δεδομένων παραμένει διαθέσιμη σε οποιονδήποτε. Η Google χρησιμοποιεί το Freebase για δεδομένα, μαζί με πληροφορίες που έχουν συλλεχθεί από τη Wikipedia και το CIA World Factbook. Google αξιώσεις Η βάση δεδομένων του Γράφημα Γνώσης έχει ήδη καταχωρήσεις για περίπου 500 εκατομμύρια αντικείμενα (παρακαλώ σημειώστε ότι τα αντικείμενα δεν μπορούν να συγκριθούν άμεσα με άρθρα της Wikipedia) και περίπου 3,5 δισεκατομμύρια «γεγονότα». Βάζουμε το "γεγονός" σε εισαγωγικά γιατί κάποτε ήταν "γεγονός" ότι η Γη ήταν επίπεδη και οι άνθρωποι δεν μπορούσε να πετάξει. Η γνώση είναι ολισθηρή.

Γράφημα γνώσης στην οθόνη

Η αρχική εφαρμογή του Γραφήματος Γνώσης από την Google έχει σχεδιαστεί για να αυξήσει τις υπάρχουσες καταχωρίσεις αποτελεσμάτων αναζήτησης της εταιρείας, αντί να τις αντικαταστήσει. Όπως το Google εμφανίζει μερικές φορές προεπισκοπήσεις σελίδων σε ένα πλαίσιο στη δεξιά πλευρά των αποτελεσμάτων αναζήτησης σε ένα τυπικό παράθυρο του προγράμματος περιήγησης Ιστού, τα αποτελέσματα του Γραφήματος Γνώσης θα εμφανίζονται σε πίνακες δίπλα στα αποτελέσματα αναζήτησης. Δεν θα παράγουν όλοι οι όροι αναζήτησης πλαίσια Γράφημα γνώσης: Τα ερωτήματα θα πρέπει να αντιστοιχούν σε καλά καθορισμένα αντικείμενα στο Γράφημα γνώσης. (Μην ανησυχείτε αν δεν βλέπετε ακόμα τα αποτελέσματα του Γράφημα Γνώσης. Η Google εξακολουθεί να διαθέτει τη δυνατότητα και αυτή τη στιγμή περιορίζεται σε αγγλόφωνους χρήστες στις Ηνωμένες Πολιτείες.)

Τα πάνελ Γράφημα γνώσης επιδιώκουν να εμφανίσουν μια σύνοψη των βασικών και πιο περιζήτητων πληροφοριών σχετικά με ένα ερώτημα χωρίς να απαιτείται από τους χρήστες να διαβάζουν περιλήψεις δύο γραμμών μιας ιστοσελίδας ή να κάνουν κλικ σε μια άλλη ιστοσελίδα. Για ένα άτομο, αυτά τα βασικά γεγονότα μπορεί να περιλαμβάνουν ημερομηνίες γέννησης και θανάτου, σημαντικά άτομα που σχετίζονται με αυτά και γρήγορες επισημάνσεις τίτλων, επιτευγμάτων ή τι άλλο κάνει αυτό το άτομο σημαντικό. Για άλλες οντότητες, η Google θα προσπαθήσει να εμφανίσει βασικές πληροφορίες, στατιστικά στοιχεία και συσχετίσεις. Ο πίνακας Γράφημα γνώσης θα χειριστεί επίσης την αποσαφήνιση. Εάν περισσότερες από μία οντότητες Γράφημα γνώσης αντιστοιχούν σε ένα ερώτημα αναζήτησης, η Google παρέχει πρόσβαση σε όλες.

Ίσως το πιο σημαντικό είναι ότι από τη στιγμή που οι χρήστες αλληλεπιδρούν με μια οντότητα Γραφήματος Γνώσης μπορούν, εντός ορισμένων ορίων, να περιηγηθούν στους συνδέσμους των σχέσεων με αυτές τις οντότητες. Για παράδειγμα, η δημιουργία μιας καταχώρησης Γράφημα γνώσης στο Dashiell Hammett θα πρέπει να επιτρέπει στους χρήστες να μεταβούν αμέσως σε μια σύνοψη του Γράφημα γνώσης του Ο Λεπτός Άνθρωπος και Το Γεράκι της Μάλτας — και, ίσως σε περιλήψεις για τη Λίλιαν Χέλμαν και τα αντικομμουνιστικά κυνήγια μαγισσών μετά τον Β' Παγκόσμιο Πόλεμο.

Το Γράφημα Γνώσης δεν θα περιορίζεται σε αναζητήσεις που βασίζονται σε προγράμματα περιήγησης: Η Google παρουσιάζει επί του παρόντος αποτελέσματα αναζήτησης Γράφημα γνώσης στις περισσότερες συσκευές με Android 2.2 ή νεότερη έκδοση (και πάλι, μόνο για ΗΠΑ στα Αγγλικά) στο πλαίσιο Γρήγορης αναζήτησης και βάσει προγράμματος περιήγησης ερευνητές. Τα αποτελέσματα αναζήτησης του Γραφήματος Γνώσης θα παρουσιαστούν επίσης στις προσεχείς εκδόσεις της εφαρμογής αναζήτησης της Google για συσκευές iOS. Οι χρήστες μπορούν να πλοηγηθούν σε πληροφορίες στο Γράφημα γνώσης πατώντας ή σύροντας εμπρός και πίσω στο περιεχόμενο.

Γράφημα γνώσεων Google (κινητό)

Είναι σημαντικό να σημειωθεί ότι αυτά είναι μόνο τα πρώτα σημεία που εμφανίζεται το Γράφημα Γνώσης στις υπηρεσίες της Google. Στα παρασκήνια, μπορείτε να περιμένετε τα αποτελέσματα αναζήτησης του Γράφημα Γνώσης να αρχίσουν να ενημερώνουν μια ευρεία ποικιλία υπηρεσιών Google, ιδιαίτερα καθώς το σύνολο των συνόλων δεδομένων και των «γεγονότων» μεγαλώνει. Οι αναζητήσεις στο Γράφημα Γνώσης πιθανότατα δεν θα πραγματοποιηθούν ποτέ αντικαθιστώ Η παραδοσιακή αναζήτηση της Google που βασίζεται σε λέξεις-κλειδιά — η σημασιολογική αναζήτηση και η κυριολεκτική αναζήτηση είναι δύο διαφορετικά εργαλεία που είναι καλά σε δύο ξεχωριστές εργασίες — αλλά, θεωρητικά, δεν θα ήταν περίεργο αν το Γράφημα Γνώσης μια μέρα συνέβαλε στο ένα τέταρτο των αλληλεπιδράσεων της Google με την αναζήτηση χρήστες.

Crowdsourcing…ή μαθήματα στο χρώμα της Google;

Λοιπόν, πώς το Γράφημα Γνώσης επιλέγει πληροφορίες για τις περιλήψεις του; Μέχρι στιγμής, η Google δεν ήταν πολύ σαφής σχετικά με τη μεθοδολογία πίσω από την παρουσίαση του Γραφήματος Γνώσης. Στην (περιορισμένη) δειγματοληψία μου, ένα μεγάλο μέρος των δεδομένων που δίνει προτεραιότητα η Google για τις περιλήψεις της φαίνεται να είναι αρκετά συνεπές: ημερομηνίες, σχέσεις, και ένα ενιαίο πεδίο «σημαντικής επιτυχίας» για ανθρώπους (το οποίο θα μπορούσε να χαρακτηριστεί κάτι σαν «Ανακαλύψεις» ή «Επάγγελμα» ή "Τίτλος"). Τα μέρη λαμβάνουν τοποθεσίες και ημερομηνίες και μια επιλογή άλλων πεδίων που θα μπορούσαν να είναι ακριβώς αυτό που θέλει κάποιος ή εντελώς ακατάλληλα. Για παράδειγμα, αν κοιτάτε το Empire State Building, η παροχή της διεύθυνσης φαίνεται κατάλληλη…αλλά δεν είναι τόσο κατάλληλη, ας πούμε, για το Stonehenge. Παρόμοιες παραξενιές μπορεί να συμβούν με τους αριθμούς τηλεφώνου: πόσοι άνθρωποι χρειάζονται άμεση πρόσβαση σε έναν αριθμό τηλεφώνου για το Ταζ Μαχάλ;

Γράφημα γνώσεων Google (Τατζ Μαχάλ)

Η Google λέει ότι δίνει προτεραιότητα στις πληροφορίες που παρουσιάζει στις περιλήψεις του Γραφήματος Γνώσης χρησιμοποιώντας την «ανθρώπινη σοφία». Και με αυτό, η Google δεν το κάνει στην πραγματικότητα σημαίνει πράγματα που τους λένε οι άνθρωποι ή που συλλέγουν οι ειδικοί του θέματος ή οι επιμελητές βάσεων δεδομένων — σημαίνει ότι κάνουν έμμεσες υποθέσεις σχετικά με τις προθέσεις των χρηστών καταγράφοντας συμπεριφορές αναζήτησης και διατηρώντας καρτέλες σε αυτά που κάνουν κλικ, δεν κάνουν κλικ και αναζητούν αφού κάνουν μια Αναζήτηση. Με λίγα λόγια, η Google χρησιμοποιεί crowdsourcing για να προσπαθήσει να προσδιορίσει ποια «γεγονότα» είναι τα καλύτερα για να παρουσιαστούν σε μια σύνοψη του Γραφήματος Γνώσης.

Για παράδειγμα, η Google λέει ότι οι πληροφορίες περίληψης του Γράφημα Γνώσης που παρουσιάζει για τον Τομ Κρουζ απαντά στο 37 τοις εκατό των ερωτημάτων παρακολούθησης των χρηστών αναζήτησης Google σχετικά με τον ηθοποιό όταν τον αναζητούν. Αυτός ο αριθμός 37 τοις εκατό ακούγεται καθησυχαστικά επιστημονικός και ακριβής, αλλά δεν υπάρχει απολύτως κανένας τρόπος αξιολόγησης εάν η αξιολόγηση της Google για τη συνολική συμπεριφορά των χρηστών αναζήτησης έχει να κάνει με αυτό που ένας συγκεκριμένος χρήστης — αρέσει εσείς - θέλει να μάθει. Εφόσον η Google φαίνεται τόσο περήφανη για αυτό το ποσοστό του 37%, ας το ανατρέψουμε: Η Google λέει 63 τοις εκατό των περιπτώσεων, δεν μπορεί να παρουσιάσει πληροφορίες σχετικά με ένα θέμα που βρίσκουν οι χρήστες αναζήτησης σχετικό.

Η θέση της Google είναι εύκολα κατανοητή: Όποτε είναι δυνατόν, θέλει να παρουσιάζει αμέσως τις πληροφορίες που αναζητούν οι χρήστες της. Ο μόνος τρόπος με τον οποίο η Google μπορεί πραγματικά να το αξιολογήσει είναι κοιτάζοντας πώς χρησιμοποιούν οι άνθρωποι τη μηχανή αναζήτησής της και προσπαθώντας να κάνουν κάποιες εικασίες.

Το crowdsourcing έχει τους κινδύνους του. Ακριβώς όπως η Google βαδίζει σε θολά νερά όταν το επιλέξει δώστε προτεραιότητα στα αποτελέσματα αναζήτησης από το Google+ στο Search Plus Your World, υπάρχουν κίνδυνοι να βασιστείς στο crowdsourcing για να δώσεις προτεραιότητα στην παρουσίαση πληροφοριών και «γεγονότων». Μόλις επειδή το κοινό αναζήτησης της Google μπορεί να μην γνωρίζει (ή να ενδιαφέρεται ιδιαίτερα) για ορισμένες πληροφορίες δεν σημαίνει ότι δεν είναι σημαντικές ή σχετικό. Υπάρχουν πολλές περιπτώσεις όπου η αντίληψη «του πλήθους» των γεγονότων είναι λανθασμένη. Οι περισσότεροι άνθρωποι πιστεύουν ότι σχιζοφρένεια σημαίνει να έχεις πολλαπλές προσωπικότητες, να πίνεις γάλα ή να τρως παγωτό αυξάνει την παραγωγή βλέννας και η Μαρία Αντουανέτα είπε «Αφήστε τους να φάνε κέικ». Ωστόσο, κανένα από αυτά τα πράγματα δεν είναι αληθής.

Η βασιζόμενη στο crowdsourcing για την αξιολόγηση της σημασίας των πληροφοριών δημιουργεί επίσης δυνατότητες κατάχρησης. Ας πούμε ότι μια κυβέρνηση ήθελε να σπείρει παραπληροφόρηση για τους αντιφρονούντες, μια πολιτική εκστρατεία ήθελε να δυσφημήσει έναν αντίπαλο ή οι χάκερ ήθελαν να παίξουν με τα αποτελέσματα αναζήτησης μόνο για γέλια; Με τον ίδιο περίπου τρόπο ήταν τα αποτελέσματα αναζήτησης Google "Βομβαρδίστηκε το Google», το crowdsourcing θα μπορούσε να χρησιμοποιηθεί για τον χειρισμό του Γράφημα Γνώσης. Οι λογικοί άνθρωποι δεν θα πιστεύουν όλα όσα διαβάζουν. Ομοίως, τα «γεγονότα» που παρουσιάζονται από τις σημασιολογικές μηχανές αναζήτησης δεν θα είναι αξιόπιστα — και σε ορισμένες περιπτώσεις το crowdsourcing θα τα κάνει ακόμη λιγότερο.

Κάνοντας το Google πιο αυτοκόλλητο

Από την πρακτική πλευρά, το Γράφημα Γνώσης της Google θα έχει ένα άμεσο αντίκτυπο: Θα κάνει τα αποτελέσματα αναζήτησης της Google πιο κολλώδη. Όποτε το Γράφημα Γνώσης μπορεί να δώσει μια άμεση απάντηση στην ερώτηση ενός χρήστη αναζήτησης — ή να τον αφήσει να πλοηγηθεί γρήγορα σε αυτό μέσω σχετικών θεμάτων — οι χρήστες θα παραμένουν στις υπηρεσίες Google. Αυτό σημαίνει ότι η Google συλλέγει περισσότερα δεδομένα σχετικά με τις αναζητήσεις και τις συμπεριφορές των χρηστών (ανεξάρτητα από το αν είναι συνδεδεμένοι σε λογαριασμό Google ή όχι). Αυτό, με τη σειρά του, επιτρέπει στην Google να βελτιώσει περαιτέρω τη στοχευμένη διαφημιστική της πλατφόρμα.

Σημαίνει επίσης ότι υπηρεσίες όπως η Wikipedia που συχνά απαντούν στα ίδια είδη γνώσεων Τα ερωτήματα που στοχεύουν το Γράφημα Γνώσης θα δουν μείωση του όγκου της επισκεψιμότητας Ιστού από την οποία λαμβάνουν Google. Στην περίπτωση της Wikipedia, αυτό αντιστοιχεί άμεσα σε λιγότερες ευκαιρίες για να ζητήσετε υποστήριξη από την κοινότητα. για άλλες υπηρεσίες, που θα μεταφραστεί άμεσα σε μικρότερο αριθμό εμφανίσεων διαφημίσεων και (επομένως) χαμηλότερα έσοδα. Για άτομα που προσφέρουν ιστότοπους και υπηρεσίες που βασίζονται στην παροχή διακριτών γεγονότων και πληροφοριών — και αυτό περιλαμβάνει τα πάντα, από τη Wikipedia έως το IMDb έως τους διαδικτυακούς λιανοπωλητές σε τηλεφωνικούς καταλόγους και επιχειρηματικούς καταλόγους σε (ενδεχομένως) υπηρεσίες που προέρχονται από πλήθος όπως το Yelp και ακόμη και δημόσια αρχεία… Το Γράφημα Γνώσης θα μπορούσε σιγά-σιγά να διαβρώσει τους επιχειρήσεις.

Συστάσεις των συντακτών

  • Πώς να χρησιμοποιήσετε το Google SGE — δοκιμάστε μόνοι σας την εμπειρία δημιουργίας αναζήτησης
  • Δεν χρειάζεται να χρησιμοποιήσετε το Bing – η Αναζήτηση Google έχει επίσης AI τώρα
  • Πώς το ChatGPT θα μπορούσε να βοηθήσει τη Microsoft να εκθρονίσει την Αναζήτηση Google
  • Το Google Chrome λαμβάνει μία από τις καλύτερες δυνατότητες του Microsoft Edge
  • Το νέο εργαλείο απορρήτου της Google σάς ενημερώνει εάν διέρρευσαν τα προσωπικά σας στοιχεία