छवि क्रेडिट: जुपिटरिमेज/पिक्सलैंड/गेटी इमेजेज
इंटरनेट की स्थापना के बाद से, लोग बड़ी मात्रा में आसानी से सुलभ डेटा को ऑनलाइन स्टोर और पोस्ट कर रहे हैं। इंटरनेट के पास अब बहुमूल्य जानकारी की अथाह मात्रा है। वेब पर उस जानकारी के मूल्य का पता लगाने, क्रमबद्ध करने, संग्रहीत करने और रैंकिंग करने के लिए खोज इंजन आवश्यक हैं। गूगल, याहू और बिंग जैसे लोकप्रिय सर्च इंजन प्रासंगिक जानकारी ढूंढते हैं और इसे उपयोगकर्ताओं के सामने पेश करते हैं। डेटा का एक विशिष्ट बिट कुशलतापूर्वक खोजने के लिए, आपके लिए खोज इंजन के चार मुख्य कार्यों को जानना महत्वपूर्ण है।
क्रॉलिंग
क्रॉलर, या वेब स्पाइडर, सर्च इंजन का एक महत्वपूर्ण सॉफ्टवेयर घटक है। यह वेबसाइट के पते और खोज इंजन डेटाबेस में भंडारण के लिए वेबसाइट की सामग्री को खोजने के लिए इंटरनेट के माध्यम से अनिवार्य रूप से सॉर्ट करता है। क्रॉलिंग इंटरनेट पर बिल्कुल नई जानकारी को स्कैन कर सकता है या यह पुराने डेटा का पता लगा सकता है। क्रॉलर के पास एक ही समय में वेबसाइटों की एक विस्तृत श्रृंखला को खोजने और एक साथ बड़ी मात्रा में जानकारी एकत्र करने की क्षमता होती है। यह खोज इंजन को एक घंटे के आधार पर वर्तमान सामग्री को खोजने की अनुमति देता है। वेब स्पाइडर तब तक क्रॉल करता है जब तक कि उसे किसी साइट के भीतर कोई और जानकारी नहीं मिल जाती, जैसे कि आंतरिक या बाहरी पृष्ठों के लिए और हाइपरलिंक।
दिन का वीडियो
इंडेक्सिंग
एक बार जब सर्च इंजन इंटरनेट की सामग्री को क्रॉल कर लेता है, तो यह उस सामग्री को प्रत्येक व्यक्तिगत वेबसाइट में कीवर्ड वाक्यांशों की घटना के आधार पर अनुक्रमित करता है। यह एक विशेष खोज क्वेरी और विषय को आसानी से खोजने की अनुमति देता है। कीवर्ड वाक्यांश किसी विशेष विषय को खोजने के लिए किसी व्यक्ति द्वारा उपयोग किए जाने वाले शब्दों का विशेष समूह है।
एक खोज इंजन का अनुक्रमण कार्य पहले किसी भी अनावश्यक और सामान्य लेख जैसे "द," को बाहर करता है। "ए" और "ए।" सामान्य पाठ को समाप्त करने के बाद, यह सामग्री को त्वरित और आसान के लिए व्यवस्थित तरीके से संग्रहीत करता है अभिगम। खोज इंजन डिजाइनर विशिष्ट कीवर्ड और कीवर्ड वाक्यांशों के अनुसार वेब पर खोज करने के लिए एल्गोरिदम विकसित करते हैं। वे एल्गोरिदम उपयोगकर्ता द्वारा जेनरेट किए गए कीवर्ड और कीवर्ड वाक्यांशों को इंडेक्स का उपयोग करके किसी विशेष वेबसाइट के भीतर मिली सामग्री से मेल खाते हैं।
भंडारण
खोज इंजन के डेटाबेस के भीतर वेब सामग्री को संग्रहीत करना तेज़ और आसान खोज के लिए आवश्यक है। उपयोगकर्ता के लिए उपलब्ध सामग्री की मात्रा उपलब्ध संग्रहण स्थान की मात्रा पर निर्भर करती है। Google और Yahoo जैसे बड़े खोज इंजन टेराबाइट्स में डेटा की मात्रा को संग्रहीत करने में सक्षम हैं, जो उपयोगकर्ता के लिए उपलब्ध जानकारी का एक बड़ा स्रोत प्रदान करते हैं।
परिणाम
परिणाम वेबसाइटों के हाइपरलिंक होते हैं जो किसी निश्चित कीवर्ड या वाक्यांश के पूछे जाने पर खोज इंजन पृष्ठ में दिखाई देते हैं। जब आप कोई खोज शब्द टाइप करते हैं, तो क्रॉलर इंडेक्स के माध्यम से चलता है और आपके द्वारा टाइप किए गए अन्य कीवर्ड से मेल खाता है। खोज इंजन डिजाइनरों द्वारा बनाए गए एल्गोरिदम का उपयोग सबसे पहले सबसे अधिक प्रासंगिक डेटा प्रदान करने के लिए किया जाता है। प्रत्येक खोज इंजन के पास एल्गोरिदम का अपना सेट होता है और इसलिए अलग-अलग परिणाम देता है।