داخل الرسم البياني المعرفي: البحث الدلالي العميق من Google

الرسم البياني المعرفي لجوجل

بدأت Google في طرح تقنية الرسم البياني المعرفي الجديدة لمستخدميها الناطقين باللغة الإنجليزية في الولايات المتحدة. على الرغم من أن الخدمة الجديدة ستظهر كمساعد لنتائج بحث الويب العادية من Google - بدلاً من ذلك من خدمة منفصلة في حد ذاتها - فهي تمثل طريقة مختلفة جذريًا للتعامل يبحث. بدلاً من عرض نتائج البحث المرتبة بناءً على مصطلحات البحث الحرفية (أو بعض مصطلحات البحث، أو الإصدارات التي قد تكون مصححة لبعض مصطلحات البحث)، يحاول الرسم البياني المعرفي بشكل أساسي ربط البحث الاستفسارات مع أشياء إنه يعرف عن: الأماكن، والأشخاص، والكتب، والأفلام، والأحداث - سمها ما شئت. الرسم البياني المعرفي هو جهد لتحقيقه البحث الدلالي، لمحاولة عرض النتائج بناءً على معنى ما يبحث عنه المستخدمون، بدلاً من المطابقات الحرفية فقط.

هل يمكن للرسم البياني المعرفي أن يغير طريقة بحثنا؟ وماذا قد يعني ذلك بالنسبة لأعمال Google الأساسية - والمواقع التي تعتمد على Google لجلب الزيارات إلى مواقعها؟

مقاطع الفيديو الموصى بها

الرسم البياني للمعرفة تحت الغطاء

الرسم البياني المعرفي لجوجل (كوري)

على الرغم من أن Knowledge Graph هو نوع جديد تمامًا من عروض البحث المقدمة من Google، إلا أنه يتبع مسارات جيدة تتبعها Google منذ سنوات من خلال خدمة البحث الرئيسية الخاصة بها. وتحرص Google على تقديمه بطريقة لا تؤدي إلى تعطيل محرك البحث الذي يهيمن على السوق بشكل كبير.

متعلق ب

  • تم إطلاق منافس Google ChatGPT للتو في البحث. وإليك كيفية تجربتها
  • عفوًا - تم رفض العرض التجريبي لـ Google Bard AI من خلال نتيجة البحث الأولى
  • كشفت Google للتو عما وجدته أكثر روعة في عام 2022

لسنوات عديدة، تمكنت Google من الإجابة على مجموعة مختارة من الاستفسارات الواقعية البسيطة مباشرة من البحث شريط، وحتى إجراء بعض العمليات الحسابية - مفيد للأشخاص الذين من المرجح أن يكون لديهم متصفح ويب قيد التشغيل بدلاً من متصفح آلة حاسبة. جربه: يجب على Google تقديم إجابات مباشرة لأشياء مثل "عاصمة سورينام" أو "الجذر التربيعي 3952.”

باستخدام الرسم البياني المعرفي، ستقوم Google أيضًا بإسقاط استعلامات البحث في قواعد بيانات معقدة تحتوي على معلومات مترابطة حول... حسنًا، أشياء، لعدم وجود شروط أفضل. في بعض النواحي، تعمل قواعد البيانات هذه مثل البحث التقليدي: فهي تقوم بإرجاع سجلات تحتوي على أجزاء مهمة من المعلومات حول شيء معين. بالنسبة لشخص ما، قد يكون ذلك شيئًا مثل تاريخ ميلاده (وربما تاريخ الوفاة)، وجنسياته، وألقابه أو مناصبه التي ربما شغلها، والاسم القانوني الكامل، والمزيد.

بالنسبة للمبنى، قد تتضمن مجموعات البيانات هذه أشياء مثل موقعه، ومتى تم بناؤه، وحجمه الإجمالي، ونوعه (على سبيل المثال، نصب تذكاري، مساحة للبيع بالتجزئة، مساحة تجارية، مسكن، أم... محطة فضائية؟). ومع ذلك، بالإضافة إلى ما يصل إلى بعض الحقائق المجردة وبعض الكلمات الرئيسية، تقوم إدخالات قاعدة البيانات هذه أيضًا بجمع روابط مباشرة إلى متعلق ب الكائنات الموجودة في قاعدة البيانات (والتي بدورها ترتبط بكائنات أخرى ذات صلة، وما إلى ذلك). وفي جميع الاحتمالات، تم تحديد طبيعة تلك الروابط أيضًا. على سبيل المثال، قد يحتوي الإدخال حول شخص ما على روابط لوالدي ذلك الشخص، وزوجه (أزواجه)، وأطفاله، و العلاقات المهمة الأخرى ويكون قادرًا على التمييز بين أفراد الأسرة وأنواع العلاقات الأخرى. لن تقوم قاعدة البيانات بعملها إذا تم تحديد مجموعة بيانات عن George H. دبليو. لم يرتبط بوش (الرئيس الحادي والأربعون للولايات المتحدة) بمجموعة البيانات الخاصة بجورج دبليو بوش. بوش (الرئيس الثالث والأربعين) – وكلاهما يرتبطان بكوندوليزا رايس، ولكن بطرق مختلفة. يجب أن تتضمن مجموعة البيانات الخاصة بالهرم الأكبر روابط إلى خوفو، وخوفو، وأبو الهول، وكذلك إلى ضريح هاليكارناسوس. (هل يمكنك التخمين لماذا?)

تشكل مجموعات البيانات هذه قلب البحث الدلالي، وهي ليست رخيصة الثمن. أولاً وقبل كل شيء، إنها ضخمة: قد يكون مجموع المعرفة الإنسانية مجرد نقطة صغيرة في وجه الجميع المعلومات في الكون، ولكن مجرد إلغاء الخدمة يمكن أن ينتج بسهولة مئات الملايين (أو المليارات) من مجموعات البيانات. (بالمقارنة، تحتوي النسخة الإنجليزية من ويكيبيديا على 4 ملايين مقالة أو نحو ذلك.) ليس من السهل الحصول على مجموعات البيانات هذه: يجب تجميعها بعناية من مصادر موثوقة. علاوة على ذلك، يجب تنظيمها وتصميمها بحيث يمكن الوصول إلى المعلومات ومعالجتها بطرق مفيدة (وفي الوقت الفعلي، لأغراض Google). و يجب أن تكون مجموعات البيانات قادرة على التعامل مع طبيعة "المعرفة" القابلة للتغيير. فقبل ​​بضع سنوات فقط، كان بلوتو كوكبًا وكان فيوكس علاجًا لالتهاب المفاصل تمت الموافقة عليه من قبل إدارة الغذاء والدواء.

يبدو أن جوجل تقوم ببناء قواعد بياناتها باستخدام التقنيات والأساليب المكتسبة مع Metaweb في عام 2010 - على الرغم من أن Metaweb قاعدة حرة تظل قاعدة البيانات الدلالية متاحة لأي شخص. تستخدم Google Freebase للبيانات، إلى جانب المعلومات المستمدة من ويكيبيديا و كتاب حقائق العالم لوكالة المخابرات المركزية. جوجل المطالبات تحتوي قاعدة بيانات الرسم البياني المعرفي الخاصة بها بالفعل على إدخالات لحوالي 500 مليون كائن (يُرجى ملاحظة أنه لا يمكن مقارنة الكائنات مباشرةً بـ مقالات ويكيبيديا) وحوالي 3.5 مليار "حقائق". لقد وضعنا كلمة "حقيقة" بين علامتي اقتباس لأنه كان ذات يوم "حقيقة" مفادها أن الأرض كانت مسطحة وكان البشر موجودين فيها لا يمكن أن تطير. المعرفة زلقة.

الرسم البياني المعرفي على الشاشة

تم تصميم التطبيق الأولي لـ Knowledge Graph من Google لزيادة قوائم نتائج البحث الحالية للشركة، بدلاً من استبدالها. مثلما يعرض Google في بعض الأحيان معاينات للصفحات في لوحة على الجانب الأيمن من نتائج البحث في نافذة متصفح ويب قياسية، ستظهر نتائج الرسم البياني المعرفي في اللوحات بجوار نتائج البحث. لن تنتج جميع مصطلحات البحث لوحات الرسم البياني المعرفي: يجب أن تتطابق الاستعلامات مع كائنات محددة جيدًا في الرسم البياني المعرفي. (لا تقلق إذا لم تشاهد نتائج الرسم البياني المعرفي حتى الآن؛ لا تزال Google تطرح هذه الميزة، وهي تقتصر حاليًا على المستخدمين الناطقين باللغة الإنجليزية في الولايات المتحدة.)

تسعى لوحات الرسم البياني المعرفي إلى عرض ملخص للمعلومات الأساسية والأكثر طلبًا حول الاستعلام دون مطالبة المستخدمين بقراءة ملخصات مكونة من سطرين لصفحة ويب أو النقر للانتقال إلى صفحة أخرى موقع. بالنسبة لشخص ما، قد تتضمن هذه الحقائق الأساسية تواريخ الميلاد والوفاة، والأشخاص المهمين المرتبطين بهم، وإلقاء الضوء على الألقاب والإنجازات السريعة، أو أي شيء آخر يجعل هذا الشخص مهمًا. بالنسبة للكيانات الأخرى، ستحاول Google عرض المعلومات والإحصائيات والارتباطات الأساسية. ستتولى لوحة الرسم البياني المعرفي أيضًا عملية توضيح الغموض. إذا كان هناك أكثر من كيان واحد للرسم البياني المعرفي يتطابق مع استعلام بحث، فإن Google توفر إمكانية الوصول إليها جميعًا.

وربما الأهم من ذلك، أنه بمجرد تفاعل المستخدمين مع كيان الرسم البياني المعرفي، يمكنهم، ضمن بعض الحدود، تصفح روابط العلاقات مع تلك الكيانات. على سبيل المثال، يؤدي سحب إدخال الرسم البياني المعرفي على Dashiell Hammett إلى السماح للمستخدمين بالانتقال فورًا إلى ملخص الرسم البياني المعرفي لـ الرجل النحيف و الصقر المالطي - وربما لملخصات عن ليليان هيلمان ومطاردة الساحرات المناهضة للشيوعية بعد الحرب العالمية الثانية.

لن يقتصر الرسم البياني المعرفي على عمليات البحث المستندة إلى المتصفح: تعمل Google حاليًا على طرح نتائج بحث الرسم البياني المعرفي لمعظم الأجهزة التي تعمل بنظام التشغيل Android 2.2 أو أعلى (مرة أخرى، الولايات المتحدة فقط باللغة الإنجليزية) في مربع البحث السريع والمستند إلى المتصفح الباحثين. سيتم أيضًا تقديم نتائج بحث الرسم البياني المعرفي إلى الإصدارات القادمة من تطبيق بحث Google لأجهزة iOS. يمكن للمستخدمين التنقل عبر المعلومات في الرسم البياني المعرفي عن طريق النقر أو التمرير ذهابًا وإيابًا عبر المحتوى.

الرسم البياني للمعرفة في Google (الجوال)

من المهم ملاحظة أن هذه ليست سوى الأماكن الأولى التي يظهر فيها الرسم البياني المعرفي في خدمات Google. خلف الكواليس، يمكنك أن تتوقع أن تبدأ نتائج بحث الرسم البياني المعرفي في تقديم المعلومات لمجموعة واسعة من خدمات Google، لا سيما مع نمو مجموعة البيانات و"الحقائق" الخاصة بها. من المحتمل ألا يتم إجراء عمليات البحث في الرسم البياني المعرفي أبدًا يستبدل البحث التقليدي المعتمد على الكلمات الرئيسية من Google - البحث الدلالي والبحث الحرفي هما نوعان من الأدوات المختلفة الجيدة في مهمتين منفصلتين - ولكن، من الناحية النظرية، لن يكون الأمر مفاجئًا إذا ساهم الرسم البياني المعرفي يومًا ما في ما يصل إلى ربع تفاعلات Google مع البحث المستخدمين.

التعهيد الجماعي … أم الفصول الدراسية الملونة من Google؟

إذًا، كيف يختار الرسم البياني المعرفي المعلومات لملخصاته؟ حتى الآن، لم تكن Google واضحة جدًا بشأن المنهجية وراء العرض التقديمي لـ Knowledge Graph. في العينة (المحدودة)، يبدو أن جزءًا كبيرًا من البيانات التي يعطيها Google الأولوية في ملخصاته متسق إلى حد كبير: التواريخ، والعلاقات، وحقل "إنجاز مهم" واحد للأشخاص (والذي يمكن تسميته بشيء مثل "الاكتشافات" أو "المهنة" أو "عنوان"). تحصل الأماكن على المواقع والتواريخ، ومجموعة مختارة من الحقول الأخرى التي قد تكون بالضبط ما يريده شخص ما أو غير مناسبة تمامًا. على سبيل المثال، إذا كنت تنظر إلى مبنى إمباير ستيت، فإن توفير عنوان الشارع يبدو مناسبًا... ولكنه ليس مناسبًا تمامًا لستونهنج، على سبيل المثال. يمكن أن تحدث أشياء غريبة مماثلة مع أرقام الهواتف: كم عدد الأشخاص الذين يحتاجون إلى الوصول الفوري إلى رقم هاتف تاج محل؟

الرسم البياني المعرفي لجوجل (تاج محل)

تقول Google إنها تعطي الأولوية للمعلومات التي تقدمها في ملخصات الرسم البياني المعرفي باستخدام "الحكمة البشرية". وبهذا فإن جوجل لا تفعل ذلك تعني في الواقع الأشياء التي يخبرهم بها البشر أو التي يجمعها الخبراء في الموضوع أو أمناء قواعد البيانات - فهي تعني وضع افتراضات غير مباشرة حول نوايا المستخدمين من خلال تسجيل سلوكيات البحث ومراقبة ما ينقرون عليه، ولا ينقرون عليه، ويبحثون عنه بعد إجراء يبحث. باختصار، تستخدم Google التعهيد الجماعي لمحاولة تحديد "الحقائق" الأفضل لتقديمها في ملخص الرسم البياني المعرفي.

على سبيل المثال، تقول جوجل إن معلومات ملخص الرسم البياني المعرفي التي تقدمها لتوم كروز تجيب على 37 بالمائة من استفسارات متابعة مستخدمي بحث جوجل حول الممثل عندما يبحثون عنه. يبدو الرقم 37% علميًا ودقيقًا بشكل مطمئن، ولكن لا توجد طريقة لتقييمه على الإطلاق ما إذا كان تقييم Google للسلوك الإجمالي لمستخدمي البحث له أي علاقة بما يفعله مستخدم معين — يحب أنت - يريد ان يعرف. وبما أن جوجل تبدو فخورة جدًا بنسبة 37%، فلنقلب الأمر رأسًا على عقب: جوجل تقول 63% في المائة من الوقت، لا يمكنه تقديم أي معلومات حول موضوع يجده مستخدمو البحث مناسب.

من السهل أن نفهم موقف جوجل: كلما كان ذلك ممكنا، فإنها تريد أن تقدم على الفور المعلومات التي يبحث عنها مستخدموها. والطريقة الوحيدة التي تستطيع جوجل من خلالها تقييم ذلك هي من خلال النظر في كيفية استخدام الأشخاص لمحرك البحث الخاص بها ومحاولة القيام ببعض التخمين.

التعهيد الجماعي له مخاطره. تمامًا كما تسير شركة جوجل في المياه العكرة عندما تختار ذلك تحديد أولويات نتائج البحث من Google+ في Search Plus Your World، هناك مخاطر تتعلق بالاعتماد على التعهيد الجماعي لتحديد أولويات عرض المعلومات و"الحقائق". فقط لأن جمهور بحث Google قد لا يعرف (أو يهتم بشكل خاص) بمعلومات معينة لا يعني أنها ليست مهمة أو مناسب. هناك الكثير من الحالات التي يكون فيها تصور "الجمهور" للحقائق خاطئًا. يعتقد معظم الناس أن الفصام يعني تعدد الشخصيات أو شرب الحليب أو تناول الآيس كريم يزيد من إنتاج المخاط، وقالت ماري أنطوانيت “دعوهم يأكلون الكعك”. ومع ذلك، لا شيء من هذه الأشياء موجود حقيقي.

كما أن الاعتماد على التعهيد الجماعي لتقييم أهمية المعلومات يخلق أيضًا إمكانية إساءة الاستخدام. لنفترض أن إحدى الحكومات أرادت نشر معلومات مضللة حول المنشقين، أو أرادت حملة سياسية تشويه سمعة أحد المعارضين، أو أراد المتسللون التلاعب بنتائج البحث من أجل الضحك فقط؟ بنفس الطريقة التي كانت بها نتائج بحث Google "جوجلبومبيد"، يمكن استخدام التعهيد الجماعي لمعالجة الرسم البياني المعرفي. العقلاء لن يصدقوا كل ما يقرأونه؛ وعلى نحو مماثل، فإن "الحقائق" التي تقدمها محركات البحث الدلالية لن تكون جديرة بالثقة ــ وفي بعض الحالات سوف يجعلها التعهيد الجماعي أقل موثوقية.

جعل جوجل أكثر التصاقًا

على الجانب العملي، سيكون للرسم البياني المعرفي لجوجل تأثير فوري واحد: فهو سيجعل نتائج بحث جوجل أكثر ثباتًا. عندما يتمكن برنامج Knowledge Graph من توفير إجابة مباشرة لسؤال مستخدم البحث - أو السماح له بالانتقال إليه بسرعة عبر المواضيع ذات الصلة - سيظل المستخدمون في خدمات Google. وهذا يعني أن Google تجمع المزيد من البيانات حول عمليات بحث المستخدمين وسلوكياتهم (بغض النظر عما إذا كانوا قد سجلوا الدخول إلى حساب Google أم لا). وهذا بدوره يتيح لشركة Google تحسين نظامها الإعلاني المستهدف بشكل أكبر.

ويعني ذلك أيضًا أن الخدمات مثل ويكيبيديا غالبًا ما تجيب على نفس أنواع المعرفة المحددة ستشهد الاستعلامات التي يستهدفها الرسم البياني المعرفي انخفاضًا في مقدار حركة مرور الويب التي تتلقاها منها جوجل. وفي حالة ويكيبيديا، فإن هذا يتوافق بشكل مباشر مع فرص أقل للحصول على دعم المجتمع؛ بالنسبة للخدمات الأخرى، فإن ذلك سيترجم مباشرةً إلى عدد أقل من مرات ظهور الإعلان و(وبالتالي) انخفاض الإيرادات. للأشخاص الذين يقدمون مواقع وخدمات تعتمد على توفير حقائق ومعلومات منفصلة - وهذا يشمل كل شيء بدءًا من ويكيبيديا إلى IMDb إلى تجار التجزئة عبر الإنترنت إلى دفاتر الهاتف وأدلة الأعمال (من الممكن) إلى الخدمات ذات المصادر الجماعية مثل Yelp وحتى السجلات العامة... يمكن أن يؤدي الرسم البياني المعرفي إلى تآكل ببطء الأعمال.

توصيات المحررين

  • كيفية استخدام Google SGE — جرّب تجربة البحث المولدة بنفسك
  • ليس عليك استخدام Bing - فبحث Google يتمتع بالذكاء الاصطناعي الآن أيضًا
  • كيف يمكن لـ ChatGPT أن يساعد Microsoft في التغلب على بحث Google
  • يحصل Google Chrome على إحدى أفضل ميزات Microsoft Edge
  • تتيح لك أداة الخصوصية الجديدة من Google معرفة ما إذا تم تسريب معلوماتك الشخصية