بناء محرك بحث صعب.
الآلاف من المبرمجين في جميع أنحاء العالم ينقرون بهدوء على لوحات المفاتيح الخاصة بهم في محاولة لبناء أفضل محرك بحث تالي. يعترف سيرجي برين ولورنس بيج ، منشئو Google المشهوران ، بأن "هندسة محرك بحث مهمة صعبة". يستخدم محرك البحث للعثور على المعلومات على الويب. محرك يزحف إلى الإنترنت ويفهرس ملايين الصفحات من المعلومات ، ويطلق النتائج عندما يقوم شخص ما بالبحث.
احصل على متتبع ارتباطات الويب
الخطوة 1
احصل على متتبع ارتباطات الويب ، وهو العنكبوت أو الروبوت الذي يزحف حول الإنترنت ويجمع الصفحات من الويب. يزور العنكبوت صفحات الويب ويقرأها ويتبع روابط الصفحات الأخرى. يمكنك العثور على زاحف مفتوح المصدر أو إنشاء برنامج خاص بك. إذا كنت ترغب في إنشاء الزاحف الخاص بك ، فاحصل على قائمة بعناوين URL لبذر الزاحف بها. من السهل إنشاء زاحف بطيء ، لكن إنشاء زاحف عالي الأداء لفهرسة ملايين وملايين الصفحات يمثل تحديًا أكبر.
فيديو اليوم
الخطوة 2
احصل على أكبر قدر ممكن من عرض النطاق الترددي. أنت بحاجة إلى هذا النطاق الترددي لبرنامج الزاحف الخاص بك أثناء انتقاله عبر الويب للحصول على الصفحات.
الخطوه 3
أنشئ فهرسًا. كل ما يعثر عليه الزاحف الخاص بك يذهب إلى فهرس محرك البحث. يشبه الفهرس كتابًا عملاقًا أو كتالوجًا يحتوي على نسخة من كل صفحة ويب يعثر عليها الزاحف. توصي آنا باترسون من جامعة ستانفورد بفهرسة البيانات التي تحتاجها فقط لخدمة نوع نتائج البحث الخاصة بك. كما تنصح بعدم محاولة فهرسة "حوض المطبخ" بل "الحصول على شيء رائع المظهر".
الخطوة 4
يحتوي الفهرس الخاص بك على جميع المعلومات التي تم العثور عليها بواسطة متتبع ارتباطات الويب لديك.
رتب نتائجك في الفهرس باستخدام قاعدة بيانات عالية الأداء وجميع المعلومات الموجودة على خوادمك من زحف الويب الخاص بك. تحتاج إلى معالجة ملايين من صفحات الويب لإنشاء الفهرس الخاص بك. يجب أن يتم ترتيب الصفحات المسجلة في الفهرس الخاص بك بالترتيب الأكثر صلة بالباحثين.
الخطوة الخامسة
بناء موقع جذاب لإرجاع نتائج البحث.
الخطوة 6
إطلاق وتسويق محرك البحث الخاص بك. يجب أن يأخذ محرك البحث المجاني المستخدمين إلى حيث يريدون الذهاب بسرعة وبأناقة ، وفقًا لـ Laszlo Xalieri من Search Engine Watch.com. يقول إنه لتشغيل محرك بحث ناجح ، "هدفك هو جذب المستهلكين وبيع إمكانية الوصول إليهم للمسوقين".
الأشياء ستحتاج
موقع
زاحف الويب
قاعدة بيانات عالية الأداء لفهرسة كل المحتوى الخاص بك
قدر كبير من النطاق الترددي للزحف على الويب
خوادم لتخزين المعلومات
شهادة دكتوراه. في علوم الكمبيوتر أو الرياضيات (أو مستشار مع نفس)
تحذير
يمكن لأي مبرمج بدء تشغيل محرك بحث ، ولكن تقديم نتائج ذات صلة هو التحدي الحقيقي.