Inside Knowledge Graph: החיפוש הסמנטי העמוק של גוגל

גרף הידע של גוגל

גוגל מתחילה להפיץ את הטכנולוגיה החדשה של Knowledge Graph למשתמשים דוברי אנגלית בארצות הברית. למרות שהשירות החדש יופיע כתוספת לתוצאות החיפוש הרגילות של גוגל באינטרנט - יותר נכון מאשר שירות נפרד בפני עצמו - הוא מייצג דרך שונה מהותית לגישה לחפש. במקום להחזיר תוצאות חיפוש מדורגות על סמך מונחי חיפוש מילוליים (או מונחי חיפוש מסוימים, או גרסאות שתוקנו אולי של חלק ממונחי החיפוש), Knowledge Graph מנסה למעשה לשייך חיפוש שאילתות עם דברים הוא יודע על: מקומות, אנשים, ספרים, סרטים, אירועים - אתה שם את זה. גרף ידע הוא מאמץ להשיג חיפוש סמנטי, מנסה להחזיר תוצאות על סמך המשמעות של מה שמשתמשים מחפשים, במקום התאמות מילוליות בלבד.

האם גרף הידע יכול לשנות את הדרך בה אנו מחפשים? ומה זה עשוי להיות משמעות עבור העסק הבסיסי של גוגל - ואתרים המסתמכים על גוגל כדי להביא תנועה לאתרים שלהם?

סרטונים מומלצים

גרף ידע מתחת למכסה המנוע

גרף הידע של גוגל (Curie)

למרות ש- Knowledge Graph הוא סוג חדש ביסודו של הצעות חיפוש מגוגל, הוא עוקב אחר מסלולים עמוסים היטב שגוגל רודפת במשך שנים עם שירות החיפוש המרכזי שלה. וגוגל מקפידה להציג אותו בצורה שאינה מפריעה במיוחד לחיפוש השולט שלה בשוק.

קָשׁוּר

  • מתחרה ChatGPT של גוגל הושקה זה עתה בחיפוש. הנה איך לנסות את זה
  • אופס - ההדגמה של Google Bard AI מופרכת על ידי תוצאת החיפוש הראשונה
  • גוגל חשפה את מה שהכי מרתק בעיניכם בשנת 2022

במשך שנים, גוגל הצליחה לענות על מבחר שאילתות עובדתיות פשוטות ישירות מהחיפוש bar, ואפילו לעשות קצת מתמטיקה - שימושי לאנשים שיש להם סיכוי גבוה יותר שדפדפן אינטרנט יפעל מאשר א מַחשְׁבוֹן. נסה את זה: גוגל צריכה לספק תשובות ישירות לדברים כמו "בירת סורינאם" או "שורש ריבועי 3952.”

עם Knowledge Graph, גוגל גם תשליך שאילתות חיפוש לתוך מסדי נתונים מורכבים של מידע הקשור זה לזה על... ובכן, דברים, מחוסר תנאים טובים יותר. במובנים מסוימים מסדי הנתונים הללו פועלים בדומה לחיפוש מסורתי: הם מחזירים רשומות עם פיסות מידע חשובות על דבר מסוים. עבור אדם, זה עשוי להיות משהו כמו תאריך הלידה שלו (ואולי תאריך הפטירה), הלאום שלו, התארים או התפקידים שאולי מילא, השם החוקי המלא ועוד.

עבור בניין, מערכי נתונים אלה עשויים לכלול דברים כמו מיקומו, מתי הוא נבנה, הגודל הכולל שלו, הסוג שלו (נגיד, אנדרטה, שטח מסחר, שטח מסחרי, מגורים, אמ... תחנת חלל?). עם זאת, בנוסף לכמה עובדות חשופות וכמה מילות מפתח, ערכי מסד הנתונים הללו גם אוספים קישורים ישירים אל קָשׁוּר אובייקטים במסד הנתונים (אשר בתורם מקשרים לאובייקטים קשורים אחרים, וכן הלאה). ככל הנראה, גם אופי הקישורים הללו מוגדר. לדוגמה, ערך סביב אדם עשוי להכיל קישורים להוריו, בן/בת הזוג והילדים של אותו אדם, וכן מערכות יחסים משמעותיות אחרות ולהיות מסוגלים להבחין בין בני משפחה לסוגים אחרים של מערכות יחסים. מסד הנתונים לא היה עושה את העבודה שלו אם מערך נתונים על ג'ורג' ה. W. בוש (הנשיא ה-41 של ארצות הברית) לא קישר למאגר נתונים על ג'ורג' וו. בוש (הנשיא ה-43) - ושניהם יקשרו לקונדוליזה רייס, אבל בדרכים שונות. מערך נתונים על הפירמידה הגדולה צריך לכלול קישורים לצ'אופס ולחופו ולספינקס - אבל גם למאוזוליאום בהליקרנסוס. (אתה יכול לנחש למה?)

מערכי הנתונים האלה מהווים את לב החיפוש הסמנטי - והם לא זולים. קודם כל, הם ענקיים: סכום הידע האנושי עשוי להיות רק כתם זעיר מול כל מידע ביקום, אבל רק גירוד של השירות יכול לייצר בקלות מאות מיליונים (או מיליארדים) של מערכי נתונים. (לשם השוואה, בגרסה האנגלית של ויקיפדיה יש מעט 4 מיליון מאמרים בערך.) מערכי נתונים אלה אינם קלים להשגה: יש להרכיב אותם בקפידה ממקורות אמינים. יתר על כן, עליהם להיות מאורגנים ומעוצבים בצורה כזו שניתן לגשת למידע ולתפעל אותם בדרכים שימושיות (ובזמן אמת, למטרות גוגל). ו מערכי הנתונים צריכים להיות מסוגלים להתמודד עם הטבע הגמיש של "ידע". אחרי הכל, רק לפני כמה שנים, פלוטו היה כוכב לכת ו-Vioxx היה טיפול אוסטאוארטריטוס שאושר על ידי ה-FDA.

ככל הנראה גוגל בונה את מסדי הנתונים שלה באמצעות טכנולוגיות ושיטות שנרכשו עם Metaweb עוד בשנת 2010 - למרות ש- Metaweb של Freebase מסד נתונים סמנטי נשאר זמין לכל אחד. גוגל משתמשת ב-Freebase לנתונים, יחד עם מידע שנאסף מוויקיפדיה ומה- ספר העובדות העולמי של ה-CIA. גוגל טוען מסד הנתונים של גרף הידע שלו כבר מכיל ערכים עבור כ-500 מיליון אובייקטים (שים לב שלא ניתן להשוות ישירות בין אובייקטים מאמרי ויקיפדיה) וכ-3.5 מיליארד "עובדות". שמנו "עובדה" במרכאות כי פעם זו הייתה "עובדה" שכדור הארץ שטוח ובני אדם לא יכול לעוף. ידע הוא חלקלק.

גרף ידע על המסך

היישום הראשוני של Google של Knowledge Graph נועד להגדיל את תוצאות החיפוש הקיימות של החברה, במקום להחליף אותן. מכיוון שגוגל מציגה לפעמים תצוגות מקדימות של דפים בחלונית בצד ימין של תוצאות החיפוש בחלון דפדפן אינטרנט רגיל, תוצאות גרף הידע יופיעו בחלוניות לצד תוצאות החיפוש. לא כל מונחי החיפוש יפיקו חלוניות של Knowledge Graph: שאילתות יצטרכו להתאים לאובייקטים מוגדרים היטב בתרשים הידע. (אל תדאג אם אתה עדיין לא רואה תוצאות של תרשים הידע; גוגל עדיין מוציאה את התכונה, וכרגע היא מוגבלת למשתמשים דוברי אנגלית בארצות הברית.)

החלוניות Knowledge Graph מבקשות להציג סיכום של המידע המפתח והמבוקש ביותר לגבי שאילתה מבלי לדרוש מהמשתמשים לקרוא סיכומים בני שתי שורות של דף אינטרנט או ללחוץ לדף אחר אֲתַר. עבור אדם, עובדות מפתח אלו עשויות לכלול תאריכי לידה ופטירה, אנשים משמעותיים הקשורים אליהם, והדגשות מהירות של כותרות, הישגים, או מה שהופך אותו אדם למשמעותי. עבור ישויות אחרות, Google תנסה להציג מידע מרכזי, סטטיסטיקות ואסוציאציות. החלונית Knowledge Graph תטפל גם בהתערבות. אם יותר מיישות אחת של גרף ידע תואמת שאילתת חיפוש, Google מספקת גישה לכולן.

אולי באופן משמעותי יותר, ברגע שמשתמשים מקיימים אינטראקציה עם ישות גרף ידע, הם יכולים, בתוך גבולות מסוימים, לגלוש בקישורים של מערכות יחסים לאותן ישויות. לדוגמה, העלאת ערך גרף ידע על Dashiell Hammett אמורה לאפשר למשתמשים לקפוץ מיד לסיכום גרף הידע של האיש הרזה ו הבז המלטזי - ואולי לסיכומים על ליליאן הלמן ועל ציד מכשפות אנטי-קומוניסטי לאחר מלחמת העולם השנייה.

גרף הידע לא יוגבל לחיפושים מבוססי דפדפן: גוגל משיקה כעת תוצאות חיפוש של גרף ידע לרוב המכשירים שבהם פועל אנדרואיד 2.2 ומעלה (שוב, ארה"ב בלבד באנגלית) בתיבת החיפוש המהיר ומבוסס דפדפן מחפשים. תוצאות החיפוש של גרף ידע יוצגו גם בגרסאות הקרובות של אפליקציית החיפוש של גוגל למכשירי iOS. משתמשים יכולים לנווט דרך המידע ב- Knowledge Graph על ידי הקשה או החלקה קדימה ואחורה בתוכן.

גרף הידע של גוגל (נייד)

חשוב לציין שאלו רק המקומות הראשונים ש- Knowledge Graph מופיע בשירותי גוגל. מאחורי הקלעים, אתה יכול לצפות שתוצאות חיפוש של גרף הידע יתחילו להודיע ​​למגוון רחב של שירותי Google, במיוחד כאשר קורפוס מערכי הנתונים וה"עובדות" שלו גדל. חיפושי גרף ידע כנראה לעולם לא החלף החיפוש המסורתי המבוסס על מילות מפתח של גוגל - חיפוש סמנטי וחיפוש מילולי הם סוג של שני כלים שונים הטובים בשתי משימות נפרדות - אבל, בתיאוריה, זה לא יהיה מפתיע אם גרף הידע יתרום יום אחד לרבע מהאינטראקציות של גוגל עם החיפוש משתמשים.

מיקור המונים... או שיעורים בצבע גוגל?

אז איך בוחרת גרף הידע מידע לסיכומים שלו? עד כה, גוגל לא הייתה מאוד מפורשת לגבי המתודולוגיה מאחורי המצגת של Knowledge Graph. בדגימה (המוגבלת) שלי, נראה שחלק ניכר מהנתונים שגוגל נותנת עדיפות לסיכומים שלה הם די עקביים: תאריכים, יחסים, ושדה "הישג משמעותי" יחיד עבור אנשים (שיכול להיות מתויג כמו "תגליות" או "עיסוק" או "כותרת"). מקומות מקבלים מיקומים ותאריכים, ומבחר של שדות אחרים שיכולים להיות בדיוק מה שמישהו רוצה או לא מתאימים לחלוטין. לדוגמה, אם אתה מסתכל על האמפייר סטייט בילדינג, מתן כתובת הרחוב נראה מתאים... אבל זה לא ממש מתאים, למשל, לסטונהנג'. מוזרויות דומות יכולות לקרות עם מספרי טלפון: כמה אנשים צריכים גישה מיידית למספר טלפון עבור הטאג' מאהל?

גרף הידע של גוגל (טאג' מאהל)

גוגל אומרת שהיא נותנת עדיפות למידע שהיא מציגה בסיכומי גרף ידע תוך שימוש ב"חוכמה אנושית". ולפי זה, גוגל לא למעשה מתכוון לדברים שבני אדם מספרים להם או שמומחי נושאים או אוצרי מסדי נתונים אוספים - זה אומר להניח הנחות עקיפות על כוונות המשתמשים על ידי רישום התנהגויות חיפוש ומעקב אחר מה שהם לוחצים, לא לוחצים ומחפשים לאחר ביצוע לחפש. בקיצור, גוגל משתמשת במיקור המונים כדי לנסות לקבוע אילו "עובדות" הן הטובות ביותר להציג בסיכום גרף הידע.

לדוגמה, גוגל טוענת שמידע הסיכום של גרף הידע שהיא מציגה עבור טום קרוז עונה על 37 אחוז משאילתות המעקב של משתמשי החיפוש בגוגל לגבי השחקן כשהם מחפשים אותו. המספר הזה של 37 אחוז נשמע מדעי ומדויק בהחלט, אבל אין שום דרך להעריך האם להערכת גוגל את ההתנהגות המצטברת של משתמשי חיפוש יש קשר כלשהו למה שמשתמש מסוים - כמו אתה - רוצה לדעת. מכיוון שגוגל נראית כל כך גאה בנתון של 37 אחוזים, בואו נהפוך את זה על ראשו: גוגל אומרת 63 אחוז מהמקרים, הוא לא יכול להציג מידע על נושא שמשתמשי החיפוש שלו מוצאים רלוונטי.

קל להבין את העמדה של גוגל: במידת האפשר, היא רוצה להציג מיד את המידע שהמשתמשים שלה מחפשים. הדרך היחידה שגוגל יכולה באמת להעריך את זה היא על ידי בחינת איך אנשים משתמשים במנוע החיפוש שלה ומנסים לעשות קצת ניחושים.

למיקור המונים יש סכנות. בדיוק כפי שגוגל צועדת במים עכורים כשהיא בוחרת בכך תעדוף תוצאות חיפוש מ-Google+ ב-Search Plus Your World, יש סכנות להסתמך על מיקור המונים כדי לתעדף את הצגת המידע וה"עובדות". רַק מכיוון שקהל החיפוש של גוגל אולי לא יודע (או אכפת לו במיוחד) ממידע מסוים לא אומר שהוא לא חשוב או רלוונטי. יש הרבה מקרים שבהם תפיסת העובדות של "ההמון" שגויה. רוב האנשים חושבים שסכיזופרניה פירושה ריבוי אישיות, שתיית חלב או אכילת גלידה מגביר את ייצור הריר, ומארי אנטואנט אמרה "תנו להם לאכול עוגה." אבל אף אחד מהדברים האלה לא נָכוֹן.

הסתמכות על מיקור המונים כדי להעריך את חשוב המידע יוצרת גם פוטנציאל להתעללות. נניח שממשלה רצתה לחלץ מידע מוטעה על מתנגדי משטר, קמפיין פוליטי רצה למרוח יריב, או שהאקרים רצו לשחק עם תוצאות החיפוש רק בשביל הצחוק? בערך באותו האופן שבו תוצאות החיפוש של גוגל היו "הופצץ בגוגל," ניתן להשתמש במיקור המונים כדי לתפעל את גרף הידע. אנשים הגיוניים לא יאמינו לכל מה שהם קוראים; באופן דומה, "עובדות" המוצגות על ידי מנועי חיפוש סמנטיים לא יהיו אמינות - ובמקרים מסוימים מיקור המונים יגרום להן אפילו פחות.

הופך את גוגל לדביק יותר

בפן המעשי, לתרשים הידע של גוגל תהיה השפעה מיידית אחת: הוא יהפוך את תוצאות החיפוש של גוגל לדביקות יותר. בכל פעם שגרף ידע יכול לספק תשובה ישירה לשאלת משתמש חיפוש - או לאפשר לו לנווט אליו במהירות באמצעות נושאים קשורים - המשתמשים יישארו בשירותי Google. המשמעות היא שגוגל אוספת יותר נתונים על חיפושים והתנהגויות של משתמשים (ללא קשר אם הם מחוברים לחשבון Google או לא). זה, בתורו, מאפשר לגוגל לשכלל עוד יותר את פלטפורמת הפרסום הממוקד שלה.

זה גם אומר ששירותים כמו ויקיפדיה עונים לרוב על אותם סוגי ידע ספציפיים שאילתות הממוקדות על ידי Knowledge Graph יראו ירידה בכמות תעבורת האינטרנט שממנה הם מקבלים גוגל. במקרה של ויקיפדיה, זה מתאים ישירות לפחות הזדמנויות לבקש תמיכה קהילתית; עבור שירותים אחרים, זה יתורגם ישירות למספר נמוך יותר של הופעות של מודעות ו(ולכן) הכנסות נמוכות יותר. לאנשים שמציעים אתרים ושירותים המבוססים על אספקת עובדות ומידע בדידים - וזה כולל הכל החל מוויקיפדיה ועד IMDb לקמעונאים מקוונים לספרי טלפונים וספריות עסקיות לשירותים שמקורם בהמונים כמו Yelp ואפילו רשומות ציבוריות... גרף הידע עלול לאט לאט לשחוק את השירותים שלהם עסקים.

המלצות עורכים

  • כיצד להשתמש ב-Google SGE - נסה בעצמך את חוויית יצירת החיפוש
  • אינך חייב להשתמש בבינג - לחיפוש Google יש גם AI כעת
  • כיצד ChatGPT יכול לעזור למיקרוסופט להדיח את חיפוש Google
  • Google Chrome מקבל את אחת התכונות הטובות ביותר של Microsoft Edge
  • כלי הפרטיות החדש של גוגל מאפשר לך לדעת אם המידע האישי שלך דלף