Jak uruchomić wyszukiwarkę

...

Budowa wyszukiwarki jest trudna.

Tysiące programistów na całym świecie cicho stuka w klawisze, próbując zbudować kolejną najlepszą wyszukiwarkę. Sergey Brin i Lawrence Page, znani twórcy Google, przyznają, że „projektowanie wyszukiwarki to trudne zadanie”. Wyszukiwarka służy do wyszukiwania informacji w sieci. Silnik przemierza Internet i indeksuje miliony stron informacji, wypluwając wyniki, gdy ktoś przeprowadza wyszukiwanie.

Zdobądź robota internetowego

Krok 1

Uzyskaj przeszukiwacz sieci Web, który jest pająkiem lub botem, który przeszukuje Internet i zbiera strony z sieci. Pająk odwiedza strony internetowe, czyta je i podąża za linkami do innych stron. Możesz znaleźć robota typu open source lub zbudować własny. Jeśli chcesz zbudować własny robot, zdobądź listę adresów URL, którymi chcesz go załadować. Powolny robot jest łatwy do zbudowania, ale zbudowanie robota o wysokiej wydajności do indeksowania milionów i milionów stron jest trudniejsze.

Wideo dnia

Krok 2

Uzyskaj maksymalną przepustowość, na jaką możesz sobie pozwolić. Ta przepustowość jest potrzebna przeszukiwaczowi, który przemieszcza się w sieci WWW i pobiera strony.

Krok 3

Zbuduj indeks. Wszystko, co znajdzie robot, trafia do indeksu wyszukiwarki. Indeks jest jak gigantyczna książka lub katalog zawierający kopię każdej strony internetowej znalezionej przez robota indeksującego. Anna Patterson z Uniwersytetu Stanforda zaleca indeksowanie tylko tych danych, które są potrzebne do obsługi wyników wyszukiwania. Radzi również, że nie należy próbować indeksować „zlewu kuchennego”, ale raczej „ustawić coś, co będzie się dobrze prezentować”.

Krok 4

...

Indeks zawiera wszystkie informacje znalezione przez przeszukiwacz sieci WWW.

Uporządkuj swoje wyniki w indeksie, korzystając z wydajnej bazy danych i wszystkich informacji na serwerach z przeszukiwania sieci. Aby utworzyć indeks, musisz przetworzyć prawdopodobnie miliony stron internetowych. Strony zarejestrowane w indeksie muszą być uszeregowane według tego, co jest najbardziej odpowiednie dla wyszukiwarek.

Krok 5

Zbuduj atrakcyjną stronę internetową, aby zwracać wyniki wyszukiwania.

Krok 6

Uruchom i promuj swoją wyszukiwarkę. Według Laszlo Xalieri z Search Engine Watch.com bezpłatna wyszukiwarka powinna zabierać użytkowników tam, gdzie chcą, szybko i elegancko. Mówi, że aby prowadzić odnoszącą sukcesy wyszukiwarkę, „Twoim celem jest przyciągnięcie konsumentów i sprzedaż dostępu do nich marketerom”.

Rzeczy, których będziesz potrzebować

  • Strona internetowa

  • Robot sieciowy

  • Wysokowydajna baza danych do indeksowania wszystkich treści

  • Duża przepustowość do indeksowania sieci

  • Serwery do przechowywania informacji

  • Doktorat w informatyce lub matematyce (lub konsultant z tym samym)

Ostrzeżenie

Każdy programista może uruchomić wyszukiwarkę, ale prawdziwym wyzwaniem jest dostarczenie odpowiednich wyników.