Jak spustit vyhledávač

...

Sestavení vyhledávače je obtížné.

Tisíce programátorů po celém světě tiše ťukají do svých klávesnic a snaží se vytvořit další nejlepší vyhledávač. Sergey Brin a Lawrence Page, slavní tvůrci Googlu, přiznávají, že „vytvoření vyhledávače je náročný úkol“. K vyhledání informací na webu se používá vyhledávač. Motor prochází internet a indexuje miliony stránek s informacemi a chrlí výsledky, když někdo hledá.

Získejte prohledávač webu

Krok 1

Získejte webový prohledávač, což je pavouk nebo robot, který prochází internet a shromažďuje stránky z webu. Pavouk navštěvuje webové stránky, čte je a sleduje odkazy na jiné stránky. Můžete najít prohledávač s otevřeným zdrojovým kódem nebo si vytvořit svůj vlastní. Pokud si chcete sestavit svůj vlastní prohledávač, získejte seznam adres URL, pomocí kterých můžete prohledávač osadit. Pomalý prohledávač se snadno sestavuje, ale sestavení vysoce výkonného prohledávače pro indexování milionů a milionů stránek je náročnější.

Video dne

Krok 2

Získejte tolik šířky pásma, kolik si můžete dovolit. Tuto šířku pásma potřebujete pro svůj prohledávač, když cestuje po webu a získává stránky.

Krok 3

Vytvořte index. Vše, co váš prohledávač najde, jde do indexu vyhledávače. Index je jako obrovská kniha nebo katalog obsahující kopii každé webové stránky, kterou prolézací modul najde. Anna Patterson ze Stanfordské univerzity doporučuje indexovat pouze data, která potřebujete k poskytování výsledků vyhledávání podle vašeho druhu. Také radí, že byste se neměli snažit indexovat „kuchyňský dřez“, ale spíše „pořídit něco reprezentativního“.

Krok 4

...

Váš index obsahuje všechny informace nalezené vaším webovým prolézacím modulem.

Seřaďte své výsledky v indexu pomocí vysoce výkonné databáze a všech informací na vašich serverech z vašeho procházení webu. K vytvoření indexu potřebujete zpracovat možná miliony webových stránek. Stránky zaznamenané ve vašem indexu je třeba seřadit podle toho, co je pro vaše hledače nejrelevantnější.

Krok 5

Vytvořte atraktivní webovou stránku pro návrat k výsledkům vyhledávání.

Krok 6

Spusťte a propagujte svůj vyhledávač. Bezplatný vyhledávač by měl uživatele rychle a elegantně dovést tam, kam chtějí, jak tvrdí Laszlo Xalieri z Search Engine Watch.com. Říká, že pro provozování úspěšného vyhledávače je "vaším cílem přilákat spotřebitele a prodat přístup k nim obchodníkům."

Věci, které budete potřebovat

  • Webová stránka

  • Webový prohledávač

  • Vysoce výkonná databáze pro indexování veškerého vašeho obsahu

  • Velká šířka pásma pro procházení webu

  • Servery pro ukládání informací

  • Ph. D. v informatice nebo matematice (nebo konzultant s tím samým)

Varování

Každý programátor může spustit vyhledávač, ale poskytnout relevantní výsledky je skutečný problém.