सर्च इंजन बनाना मुश्किल है।
दुनिया भर में हजारों प्रोग्रामर चुपचाप अपने कीबोर्ड से अगला सर्वश्रेष्ठ खोज इंजन बनाने की कोशिश कर रहे हैं। Google के प्रसिद्ध रचनाकार सर्गेई ब्रिन और लॉरेंस पेज स्वीकार करते हैं कि "एक खोज इंजन की इंजीनियरिंग एक चुनौतीपूर्ण कार्य है।" वेब पर जानकारी खोजने के लिए एक सर्च इंजन का उपयोग किया जाता है। एक इंजन इंटरनेट को क्रॉल करता है और लाखों पृष्ठों की जानकारी को अनुक्रमित करता है, जब कोई खोज करता है तो परिणाम बाहर निकल जाते हैं।
एक वेब क्रॉलर प्राप्त करें
स्टेप 1
एक वेब क्रॉलर प्राप्त करें, जो कि मकड़ी या बॉट है जो वेब से पृष्ठों को इकट्ठा करने वाले इंटरनेट के चारों ओर क्रॉल करता है। एक मकड़ी वेब पेजों पर जाती है, उन्हें पढ़ती है और अन्य पेजों के लिंक का अनुसरण करती है। आप एक ओपन-सोर्स क्रॉलर ढूंढ सकते हैं या अपना खुद का निर्माण कर सकते हैं। यदि आप अपना स्वयं का क्रॉलर बनाना चाहते हैं, तो अपने क्रॉलर को सीड करने के लिए URL की एक सूची प्राप्त करें। एक धीमा क्रॉलर बनाना आसान है, लेकिन लाखों और लाखों पृष्ठों को अनुक्रमित करने के लिए एक उच्च-प्रदर्शन क्रॉलर बनाना अधिक चुनौतीपूर्ण है।
दिन का वीडियो
चरण दो
जितना हो सके उतना बैंडविड्थ प्राप्त करें। आपको अपने क्रॉलर के लिए इस बैंडविड्थ की आवश्यकता है क्योंकि यह वेब प्राप्त करने वाले पृष्ठों पर यात्रा करता है।
चरण 3
एक सूचकांक बनाएँ। आपके क्रॉलर को जो कुछ भी मिलता है वह सर्च इंजन इंडेक्स में जाता है। अनुक्रमणिका एक विशाल पुस्तक या कैटलॉग की तरह है जिसमें क्रॉलर को मिलने वाले प्रत्येक वेब पेज की एक प्रति होती है। स्टैनफोर्ड यूनिवर्सिटी के एना पैटरसन ने केवल उस डेटा को अनुक्रमित करने की सिफारिश की है जिसकी आपको अपने प्रकार के खोज परिणामों की सेवा के लिए आवश्यकता है। वह यह भी सलाह देती है कि आपको "रसोई के सिंक" को अनुक्रमित करने का प्रयास नहीं करना चाहिए, बल्कि "कुछ प्रस्तुत करने योग्य प्राप्त करना चाहिए।"
चरण 4
आपकी अनुक्रमणिका में आपके वेब क्रॉलर द्वारा प्राप्त सभी जानकारी शामिल है।
एक उच्च-प्रदर्शन डेटाबेस और आपके वेब क्रॉलिंग से आपके सर्वर पर सभी जानकारी का उपयोग करके अपने परिणामों को इंडेक्स पर रैंक करें। अपनी अनुक्रमणिका बनाने के लिए आपको संभवतः लाखों वेब पृष्ठों को संसाधित करने की आवश्यकता है। आपकी अनुक्रमणिका में दर्ज किए गए पृष्ठों को आपके खोजकर्ताओं के लिए सबसे अधिक प्रासंगिक के क्रम में क्रमित करने की आवश्यकता है।
चरण 5
खोज परिणाम लौटाने के लिए एक आकर्षक वेबसाइट बनाएं।
चरण 6
अपना खोज इंजन लॉन्च करें और उसका विपणन करें। Search Engine Watch.com के Laszlo Xalieri के अनुसार, एक मुफ़्त खोज इंजन को उपयोगकर्ताओं को वहाँ ले जाना चाहिए जहाँ वे जल्दी और शान से जाना चाहते हैं। उनका कहना है कि एक सफल खोज इंजन चलाने के लिए, "आपका लक्ष्य उपभोक्ताओं को आकर्षित करना और उन्हें विपणक तक पहुंच बेचना है।"
चीजें आप की आवश्यकता होगी
एक वेबसाइट
एक वेब क्रॉलर
आपकी सभी सामग्री को अनुक्रमित करने के लिए एक उच्च-प्रदर्शन डेटाबेस
वेब क्रॉल करने के लिए बहुत अधिक बैंडविड्थ
जानकारी संग्रहीत करने के लिए सर्वर
एक पीएच.डी. कंप्यूटर विज्ञान या गणित में (या उसी के साथ एक सलाहकार)
चेतावनी
कोई भी प्रोग्रामर एक खोज इंजन शुरू कर सकता है, लेकिन प्रासंगिक परिणाम प्रदान करना वास्तविक चुनौती है।