Πώς να ξεκινήσετε μια μηχανή αναζήτησης

...

Η κατασκευή μιας μηχανής αναζήτησης είναι δύσκολη.

Χιλιάδες προγραμματιστές σε όλο τον κόσμο πατούν αθόρυβα τα πληκτρολόγιά τους προσπαθώντας να δημιουργήσουν την επόμενη καλύτερη μηχανή αναζήτησης. Ο Sergey Brin και ο Lawrence Page, οι διάσημοι δημιουργοί της Google, παραδέχονται ότι «η μηχανική μιας μηχανής αναζήτησης είναι μια πρόκληση». Μια μηχανή αναζήτησης χρησιμοποιείται για την εύρεση πληροφοριών στον Ιστό. Μια μηχανή ανιχνεύει το Διαδίκτυο και ευρετηριάζει εκατομμύρια σελίδες πληροφοριών, βγάζοντας αποτελέσματα όταν κάποιος κάνει μια αναζήτηση.

Αποκτήστε έναν ανιχνευτή Ιστού

Βήμα 1

Αποκτήστε ένα πρόγραμμα ανίχνευσης Ιστού, το οποίο είναι η αράχνη ή το bot που ανιχνεύει στο Διαδίκτυο συλλέγοντας σελίδες από τον Ιστό. Μια αράχνη επισκέπτεται ιστοσελίδες, τις διαβάζει και ακολουθεί συνδέσμους προς άλλες σελίδες. Μπορείτε να βρείτε ένα πρόγραμμα ανίχνευσης ανοιχτού κώδικα ή να δημιουργήσετε το δικό σας. Εάν θέλετε να δημιουργήσετε το δικό σας πρόγραμμα ανίχνευσης, λάβετε μια λίστα με διευθύνσεις URL για να δημιουργήσετε το πρόγραμμα ανίχνευσης. Ένα αργό πρόγραμμα ανίχνευσης είναι εύκολο να κατασκευαστεί, αλλά η κατασκευή ενός ανιχνευτή υψηλής απόδοσης για την ευρετηρίαση εκατομμυρίων και εκατομμυρίων σελίδων είναι πιο δύσκολη.

Το βίντεο της ημέρας

Βήμα 2

Αποκτήστε όσο περισσότερο εύρος ζώνης μπορείτε να αντέξετε οικονομικά. Χρειάζεστε αυτό το εύρος ζώνης για τον ανιχνευτή σας καθώς ταξιδεύει στον Ιστό, λαμβάνοντας σελίδες.

Βήμα 3

Δημιουργήστε ένα ευρετήριο. Ό, τι βρίσκει ο ανιχνευτής σας πηγαίνει στο ευρετήριο της μηχανής αναζήτησης. Το ευρετήριο μοιάζει με ένα τεράστιο βιβλίο ή κατάλογο που περιέχει ένα αντίγραφο κάθε ιστοσελίδας που βρίσκει ο ανιχνευτής. Η Anna Patterson από το Πανεπιστήμιο του Στάνφορντ συνιστά την ευρετηρίαση μόνο των δεδομένων που χρειάζεστε για να εξυπηρετήσετε το είδος των αποτελεσμάτων αναζήτησης. Συμβουλεύει επίσης ότι δεν πρέπει να προσπαθήσετε να δημιουργήσετε ευρετήριο "τον νεροχύτη της κουζίνας" αλλά μάλλον "να αποκτήσετε κάτι εμφανίσιμο".

Βήμα 4

...

Το ευρετήριό σας περιέχει όλες τις πληροφορίες που βρέθηκαν από το πρόγραμμα ανίχνευσης Ιστού.

Κατατάξτε τα αποτελέσματά σας στο ευρετήριο χρησιμοποιώντας μια βάση δεδομένων υψηλής απόδοσης και όλες τις πληροφορίες στους διακομιστές σας από την ανίχνευση Ιστού. Πρέπει να επεξεργαστείτε πιθανώς εκατομμύρια ιστοσελίδες για να δημιουργήσετε το ευρετήριό σας. Οι σελίδες που καταγράφονται στο ευρετήριό σας πρέπει να ταξινομηθούν με τη σειρά που είναι πιο σχετικό με τους ερευνητές σας.

Βήμα 5

Δημιουργήστε έναν ελκυστικό ιστότοπο για να επιστρέψετε αποτελέσματα αναζήτησης.

Βήμα 6

Εκκινήστε και προωθήστε τη μηχανή αναζήτησής σας. Μια δωρεάν μηχανή αναζήτησης θα πρέπει να οδηγεί τους χρήστες εκεί που θέλουν να πάνε γρήγορα και κομψά, σύμφωνα με τον Laszlo Xalieri από το Search Engine Watch.com. Λέει ότι για να εκτελέσετε μια επιτυχημένη μηχανή αναζήτησης, «στόχος σας είναι να προσελκύσετε καταναλωτές και να πουλήσετε την πρόσβαση σε αυτούς σε επαγγελματίες του μάρκετινγκ».

Πράγματα που θα χρειαστείτε

  • Μία ιστοσελίδα

  • Ένα πρόγραμμα ανίχνευσης Ιστού

  • Μια βάση δεδομένων υψηλής απόδοσης για την ευρετηρίαση όλου του περιεχομένου σας

  • Ένα μεγάλο εύρος ζώνης για ανίχνευση στον Ιστό

  • Διακομιστές για την αποθήκευση πληροφοριών

  • Ένα Ph.D. στην επιστήμη των υπολογιστών ή στα μαθηματικά (ή σύμβουλο με το ίδιο)

Προειδοποίηση

Οποιοσδήποτε προγραμματιστής μπορεί να ξεκινήσει μια μηχανή αναζήτησης, αλλά η παροχή σχετικών αποτελεσμάτων είναι η πραγματική πρόκληση.