חיפוש חכם יותר: מדוע 'חיפוש סמנטי' סוף סוף יאפשר לגוגל להבין אותך

למה-חיפוש-סמנטי'-ייתן-סוף סוף-גוגל-להבין- אותך

אמיר אפרתי של הוול סטריט ג'ורנל הרים גבות עם מאמר (נדרש מנוי) אומרים שגוגל פועלת כדי להישאר לפני מתחרותיה בחיפוש באינטרנט על ידי הצגת טכנולוגיית "חיפוש סמנטי" יותר. הרעיון הוא שתיבת החיפוש של גוגל לא תהיה רק ​​מקום למשתמשים להקליד מילות מפתח או שאילתות ספציפיות, אלא תיבת שיש לה הֲבָנָה של רבים מהמונחים, השמות, הפעלים וההפניות שאנשים מקלידים - ויכולים ליישם את הידע הזה בחיפושים של משתמשים. בתיאוריה, חיפוש סמנטי אמור להיות מסוגל להחזיר תוצאות המשקפות את כוונתו של המחפש מקרים מסוימים משפרים את היכולת של גוגל לתת תשובה מיידית מבלי להפנות משתמשים לאחר אֲתַר.

אבל רגע - זה משהו חדש? לא גוגל כְּבָר לשים כמה תשובות ממש לפנים? ואיך חיפוש סמנטי עשוי לעזור לגוגל לשמור על ההובלה שלה בעסקי החיפוש באינטרנט?

סרטונים מומלצים

מהו חיפוש סמנטי?

בקצרה, לסמנטי יש הרבה יותר במשותף עם ווטסון, אפליקציית מחשוב העל של יבמ בני אדם שהובסו ביד בְּ- סַכָּנָה! ממה שהוא עושה עם תיבת הדו-שיח Find ב-Microsoft Word.

באופן רופף, עולם החיפוש הממוחשב מתחלק לשני סוגים:

חיפוש מילולי (לפעמים נקרא חיפוש ניווט) מחפש התאמות מדויקות עבור חלק מהמונחים שהוכנסו או כולם, ומחזיר פריטים תואמים - בין אם קבצים, דפי אינטרנט, מוצרים או יחידת מידע נפרדת אחרת. ניתן להגדיל את החיפוש המילולי עם דברים כמו התאמת גזע, צימודים ושיוך שמרחיבים או מגבילים את החיפוש בדרכים שימושיות - כך חיפוש אחר "טוס" עשוי גם להקיש על "טיסה". חיפוש מילולי הוא הדבר שאנחנו הכי מכירים היום, בין השאר בגלל שזה הכי קל למחשבים לְבַצֵעַ.

חיפוש סמנטי שונה מחיפוש מילולי בשתי דרכים. ראשית, החיפוש הסמנטי מנסה מבין מה המשתמש שואל בשאילתה על ידי הצבתה בהקשר באמצעות ניתוח של המונחים והשפה של השאילתה. ניתוח זה נערך על סמך מאגרי ידע מורכבים מראש, שעשויים לכלול ידע על המשתמש. שנית, במקום להחזיר קבוצה של קבצים, דפי אינטרנט, מוצרים או פריטים אחרים, החיפוש הסמנטי מנסה לספק ישיר תשובה לשאלה. אם תשאל מנוע חיפוש סמנטי "מתי התגלה פלוטו?" זה עשוי לענות "פלוטו התגלה ב-18 בפברואר 1930 על ידי קלייד טומבוג*," שבו סביר להניח שמנוע חיפוש מילולי יחזיר קישורים לדפי אינטרנט המכילים את המילים "נתגלה" ו"פלוטו".

מסתבר שחיפוש מילולי וחיפוש סמנטי טובים למשימות שונות. חיפוש מילולי הוא נהדר כאשר משתמש מחפש ספציפי דָבָר, בין אם זה קובץ, דף אינטרנט, מסמך, מוצר, אלבום או פריט דיסקרטי אחר. חיפוש סמנטי, לעומת זאת, מתברר כמועיל יותר כאשר משתמש מחפש ספציפי מֵידָע - כמו תאריך, מספר, שעה, מקום או שם.

בין השאר הודות להתרבות של טכנולוגיית חיפוש מילולי בכל דבר, החל ממעבדי תמלילים ועד למנועי חיפוש באינטרנט, אנחנו רגילים ביותר לחיפוש מילולי. רובנו כבר יודעים איך לתמרן חיפוש מילולי כדי לקרב אותנו למה שאנחנו רוצים בניסיון הראשון. עם זאת, לפי מאמר WSJ של אפרתי, גוגל מאמינה שטכנולוגיית חיפוש סמנטי יכולה לספק תשובות ישירות בין 10 ל-20 אחוזים מחיפושי האינטרנט. לפי Comscore, גוגל טיפל ב-11.7 מיליארד חיפושים בארצות הברית לבדה בפברואר 2012. עם יכולות חיפוש סמנטיות, יותר מ-2.3 מיליארד מאותם חיפושים היו יכולים לקבל מענה ישיר, במקום לשלוח אנשים לדפי אינטרנט ואתרים אחרים.

האם גוגל כבר לא עושה את זה?

אם השתמשת בכלל בחיפוש האינטרנט של Google, אתה כנראה חושב "אבל רגע, גוגל כבר עושה את זה!" הקלד "השעה הנוכחית בטוקיו" או "כמה גבוה הר האוורסט" וגוגל תשים את הניחוש הטוב ביותר שלה לתשובה מדויקת בראש תוצאות החיפוש שלה. גוגל אפילו מצטטת מקורות לתגובתה, וחלק מהמקורות הללו יהיו ב"עשרה קישורים כחולים" הקלאסיים מתחת לתשובה. (גוגל מדווחת שגובה הר האוורסט, אגב, 8,848 מטרים).

למען ההגינות, זו אחת מיכולות שימושיות רבות שגוגל בנתה בסרגל החיפוש שלה: היא תעשה מתמטיקה (מתוחכמת), תבצע המרות יחידות ומטבעות, ולהעלות דברים כמו מידע על טיסה וזמני הצגת סרטים מקומיים - אין צורך להקליד טקסט מסובך שאילתא. זה יכול גם להתחבר לכמה מקורות נתונים ציבוריים. לדוגמה, הקלדת "אוכלוסיית מקסיקו" לתיבת החיפוש יציג נתונים מהבנק העולמי. ההיענות היום היא 113,423,047 אנשים.

עם זאת, המאמצים של גוגל לספק תשובות ישירות לסוגים מסוימים של שאלות נופלים די מהר, מכיוון שתכונות אלה הן במידה רבה מיושם כמקרים מיוחדים למנוע החיפוש המילולי של גוגל, במקום כחיפוש סמנטי שמנסה להבין מה המשתמש רוצה. הקלד "כמה גבוה הר אוורסט" (שימו לב לאות) בתיבת החיפוש, וגוגל אפילו לא מנסה לספק תשובה: חיפוש גוגל לא יודע ש"mt" פירושו "הר". באופן דומה, אם גוגל קבעה שהמיקום הנוכחי שלך אינו במקסיקו (ואם ל-Google אין את המיקום שלך, היא תנחש לפי כתובת ה-IP שלך ו, לא, אתה לא יכול לבטל את הסכמתך) מחפש אחר "אוכלוסייה מקסיקו עיר" עשוי להחזיר כמה תוצאות בלתי צפויות. בוודאי שמקסיקו סיטי היא ביתם של יותר מ-10,852 אנשים, נכון?

כמה חיפוש סמנטי שונה

חיפוש סמנטי מנסה להעלים סוגים אלה של פגמים בשתי דרכים. ראשית, הוא מנסה להבין בצורה מדויקת יותר את כוונה מאחורי שאילתה מסוימת. שנית, הוא מנסה להתאים את המרכיבים של שאילתה זו מול מאגרי ידע עמוקים שהורכבו מראש כדי לראות אם היא יכולה למצוא תשובה משמעותית.

כאשר אתה שולח שאילתה למנוע חיפוש מילולי כמו גוגל, הוא לא נדחס מיידית אל כל אתר באינטרנט, עיין בהם ודווח על רשימה של אתרים שלדעתו תואמים ביותר שלך תנאים. במקום זאת, לגוגל יש תוכנות שסורקות כל הזמן את האינטרנט אחר אתרים חדשים ודפי אינטרנט חדשים, היוצרות אינדקס מכל הדפים שהם מוצאים. למרות שזהו פישוט יתר עצום, כאשר משתמשים מקלידים שאילתת חיפוש כמו "ועידת יאלטה," Google מסתכלת על האינדקס הזה עבור דפים התואמים גם "יאלטה" וגם "ועידה", כמו גם דפים שיש להם את שני המונחים בסמיכות זה לזה (נניח, בתוך 8 או 10 מילים). לאחר מכן גוגל אוספת את כתובות ה-URL עבור אותם דפים, ממיינת לפי דירוג הדף הפנימי שלה (המדד של גוגל לגבי היתרונות היחסיים של דף שבעצם סופר קישורים אליו כהצבעות חיוביות), ומחזיר רשימה.

ניהול הנתונים וההנדסה שמאחורי תהליך כזה הם מרתיע ומדהים כאחד, וגוגל ראוי לשבח על שהצליחה בכך - במיוחד מכיוון שגוגל מסוגלת לעשות זאת לעתים קרובות בשבריר של א שְׁנִיָה. דברים דומים קורים מאחורי הקלעים בבינג של מיקרוסופט.

חיפוש סמנטי יגש לאותה שאילתה אחרת. במקום להשוות שאילתה מול אינדקס שנערך מראש (ומתעדכן כל הזמן) של דפי אינטרנט שהוא מכיר, מנוע חיפוש סמנטי משווה את השאילתה לשאילתה נפרדת, מותאמת מראש. מערכי ידע יש לו זמין. חשבו על מערכי ידע כמו מסדי נתונים: בלב, הם מלאים בנתונים, עובדות ונתונים על נושא מסוים. ישנם סוגים שונים של מערכי ידע. כמה מעניינים הם אונטולוגיות (אשר מייצגים מידע רשמי שניתן לתמרן עם כללים, פונקציות והגבלות) ו פולקסונומיות, שבדרך כלל מייצגים מערכי ידע המוגדרים בשיתוף פעולה: דוגמאות לכך יהיו hashtagging וסימניות חברתיות.

חיפוש בגוגל

מערכי ידע הם יותר מסתם פחי אחסון. הם גם מייצגים קשרים בין פריטים בבסיס הידע, ומאפשרים שימוש משמעותי במידע מרובות מערכי ידע. יתר על כן, מערכות יחסים מתבטאות לעתים קרובות בצורה כזו שניתן להסיק מסקנות לוגיות מדויקות לְלֹא צורך לאחסן את כל הנתונים הנגזרים האפשריים. זה קצת אנתרופומורפי, אבל מנועי חיפוש סמנטיים יכולים לבצע נימוקים והסקת יסוד על הנתונים שהם יודעים עליהם. כחלק מתהליך זה, מנועי חיפוש סמנטיים מתוכננים לרוב להעריך את רמת הביטחון שיש להם בגזרותיהם. אם הם לא חושבים שהם יודעים על מה הם מדברים, הם עלולים להישאר אילמים. אם הם די בטוחים, הם יזרקו תשובה.

אז אם תזין "כנס יאלטה" למנוע חיפוש סמנטי, הוא יסתכל במערכות הידע שלו וכנראה יורק כמה עובדות ונתונים בסיסיים, אולי "4 עד 11 בפברואר 1945." זה עשוי להצביע על השתתפו סטלין, צ'רצ'יל ופרנקלין רוזוולט, וזה היה חשוב אפילו בחודשים האחרונים של מלחמת העולם II. דברים די בסיסיים.

אם אתה שואל מנוע חיפוש מילולי "האם ועידת יאלטה התרחשה במהלך מלחמת קוריאה?" סביר להניח שרק תקבל רשימה של עשרה קישורים כחולים. אולי יש תשובה.

עם זאת, אם אתה שואל מנוע חיפוש סמנטי, אתה אמור לקבל תשובה של מילה אחת: "לא".

זֶה זה המקום שבו החיפוש הסמנטי נעשה מעניין להפליא.

האם זה לא וולפרם אלפא?

אם השאילתות האלה נשמעות כמו מיני דברים שאנשים זורקים על וולפרם אלפא מנוע חיפוש, אתה בדיוק צודק. במקום להיות אינדקס של דפי אינטרנט, וולפרם אלפא מנסה להיות מנוע ידע. וולפרם אלפא לא עוסק בחיפוש אחר דבר (כמו דף אינטרנט), אלא בבקשת תשובה. וולפראם אלפא מסתמכת על בסיסי ידע שהותאמו מראש כדי להפיק את התוצאות שלה, והחברה מוסיפה ומעדכנת בסיסי ידע חדשים באופן קבוע. חלקם נתונים טכניים מיוחדים ביותר - כמו מידע על יסודות כימיים או הגנום של זבוב הפירות - בעוד שאחרים יותר גחמניים. לדוגמה, וולפרם אלפא יודע לא מעט על גזעי חתולים.

כל עוד אתה נשאר בתחומי הידע של וולפרם אלפא, הוא יכול לבצע ניתוח שימושי של הנתונים. למשל, וולפרם אלפא יכול השוו את מרחקי הקפיצה של אריות ונמרים. (מסתבר שהם דומים, אבל נראה שהטיגריסים בדרך כלל שולטים באריות.) אבל אם אתה רוצה לדעת כמה רחוק קנגורו יכול לקפוץ? אופס, סליחה: אין נתונים זמינים.

אבל השאילתה הכושלת על קנגורו הופ מראה קצת על איך וולפרם אלפא מנסה להבין דברים. לפני שהוא מספק תשובה, המנוע מציין שהוא מניח ש"קנגורו" פירושו "קנגורו, wallabies", אך המשתמשים יכולים לעבור לקנגורו אנטילופין, לקנגורו האדום או לאפור המזרחי. קנגרו. באופן דומה, וולפרם אלפא פירש את "כמה רחוק יכול קנגורו לקפוץ" להיות שאילתה ל"מרחק קפיצה", נקודת מידע ספציפית שיכולה להיות לו לגבי בעלי חיים. מסתבר שלוולפרם אלפא אין כרגע את הנתונים האלה, אבל הפרשנות שלו לשאילתה חשובה מאוד.

זו לא סירי?

אם השאילתות האלה נשמעות כמו מיני דברים שאנשים זורקים על סירי באייפון 4S (אבל, זכרו, לֹא האייפד החדש שיצא השבוע), אתה בדיוק צודק. עם זאת, חשוב לזכור ש-Siri מתמודדת רק עם חצי אחד מהמשוואה: הבנת שאילתות המשתמש. בכך, סירי לוקחת על עצמה את בעיית המחשוב הקשה מאוד של זיהוי מדויק של דיבור משתמש דרך מיקרופון בזמן אמת. זה לא עניין של מה בכך, אבל זה לא מנוע חיפוש סמנטי. מאחורי הקלעים, סירי מעבירה שאילתות ל-Wolfram Alpha, ל-Yelp, ו(אם כל השאר נכשל) למנוע החיפוש האינטרנט המועדף על המשתמש. אם תשאלו את סירי "האם ועידת יאלטה התרחשה במהלך מלחמת קוריאה", היא עשויה לזהות במדויק מה אתה שואל - זה עשה בשבילי - אבל זה רק יציע לעשות חיפוש מילולי של בית הספר הישן עבור אתה.

סירי

למה לצפות

העניין של גוגל בחיפוש סמנטי הוא כנראה כפול. ראשית, סביר להניח שהיא רוצה להשתמש בטכנולוגיה כנקודת התרברבות נוספת ששמה אותה לפני המתחרים שלה - בעיקר מיקרוסופט בינג. לבינג יש מזמן א שותפות עם וולפרם אלפא נועד לעזור למנוע החיפוש לספק תשובות ישירות במידת האפשר. עם זאת, עד כה לא בינג ולא גוגל עשו פריצות גדולות עם צרכנים עם תוצאות חיפוש ישירות. אחרי הכל, רוב משתמשי החיפוש היומיומיים כנראה לא יודעים שהיכולות (המוגבלות) כבר קיימות. אפילו עבור משתמשים שמודעים להם, נראה שאפילו גוגל חושב שהטכנולוגיה ישימה רק ל-10 עד 20 אחוז מהחיפושים. זה הרבה חיפושים, אבל זה אומר שהרוב (80 עד 90 אחוז) מהחיפושים לא ישתמשו בזה.

עם זאת, כאשר צרכנים נוטשים במהירות מחברים, מחשבים שולחניים ופלטפורמות מחשוב מסורתיות, היכולת לספק תשובות קצרות וקל להבנה לשאילתות חיפוש מסובכות עלולה להפוך מאוד חשוב בעולם המובייל. למשתמשים שנוהגים או לא מוכנים להתעסק עם לוחות מקשים או מקלדות על המסך, היכולת להגיב לשאילתות מדוברות כמו "האם גולדן גייט פארק גדול יותר מסנטרל פארק?" או "איזה דרך לדירה של מלקולם?" עם תשובות פשוטות כמו "כן" ו"קח את הבא שמאלה" עשויות להוות הבדלים לא יסולא בפז לנייד פלטפורמות.

זה כמעט בוודאות המקום שבו חברות כמו אפל וגוגל מחפשות לקחת את הטכנולוגיה.

* טמבו זיהה לראשונה את פלוטו כאובייקט נע ב-18 בפברואר 1930, אך פלוטו זוהה בלי משים בכמה הזדמנויות קודמות. המוקדם ביותר הידוע כיום היה בשנת 1909. לִרְאוֹת? ידע הוא חלקלק.

צילום באמצעות: אנט שאף / Shutterstock.com

המלצות עורכים

  • כל האינטרנט שייך כעת ל-AI של גוגל
  • אינך חייב להשתמש בבינג - לחיפוש Google יש גם AI כעת
  • אופס - ההדגמה של Google Bard AI מופרכת על ידי תוצאת החיפוש הראשונה
  • הנה איך חיפוש Google מתכנן להתמודד עם קליקבייט
  • כיצד להסיר מידע אישי מחיפוש Google