Kako pokrenuti tražilicu

...

Izgradnja tražilice je teška.

Tisuće programera diljem svijeta tiho tapkaju po svojim tipkovnicama pokušavajući izgraditi sljedeću najbolju tražilicu. Sergey Brin i Lawrence Page, poznati tvorci Googlea, priznaju da je "inženjering tražilice izazovan zadatak". Tražilica se koristi za pronalaženje informacija na webu. Motor pretražuje internet i indeksira milijune stranica informacija, ispljuvajući rezultate kada netko izvrši pretragu.

Nabavite alat za indeksiranje weba

Korak 1

Nabavite web alat za indeksiranje, pauk ili bot koji puzi po Internetu i prikuplja stranice s weba. Pauk posjećuje web stranice, čita ih i prati poveznice na druge stranice. Možete pronaći alat za indeksiranje otvorenog koda ili izraditi vlastiti. Ako želite izraditi vlastiti alat za indeksiranje, nabavite popis URL-ova s ​​kojima ćete zasjeti svoj alat za indeksiranje. Lako je izraditi spori alat za indeksiranje, ali izgradnja alata za indeksiranje visokih performansi za indeksiranje milijuna i milijuna stranica je izazovnija.

Video dana

Korak 2

Dobijte onoliko propusnosti koliko možete priuštiti. Ova vam je propusnost potrebna za vaš alat za indeksiranje dok putuje webom i prima stranice.

Korak 3

Napravite indeks. Sve što vaš pretraživač pronađe ide u indeks tražilice. Indeks je poput ogromne knjige ili kataloga koji sadrži kopiju svake web-stranice koju pretraživač pronađe. Anna Patterson sa Sveučilišta Stanford preporučuje indeksiranje samo onih podataka koji su vam potrebni za posluživanje vaših rezultata pretraživanja. Ona također savjetuje da ne pokušavate indeksirati "kuhinjski sudoper", već radije "nabavite nešto naočljivo".

4. korak

...

Vaš indeks sadrži sve informacije koje je pronašao vaš web indeks.

Svoje rezultate rangirajte u indeks pomoću baze podataka visokih performansi i svih informacija na vašim poslužiteljima iz vašeg pretraživanja weba. Morate obraditi možda milijune web stranica da biste stvorili svoj indeks. Stranice zabilježene u vašem indeksu moraju se rangirati prema onome što je najrelevantnije za vaše tražitelje.

Korak 5

Izradite atraktivnu web stranicu za vraćanje rezultata pretraživanja.

Korak 6

Pokrenite i plasirajte svoju tražilicu. Besplatna tražilica trebala bi korisnike brzo i elegantno odvesti tamo gdje žele ići, smatra Laszlo Xalieri iz Search Engine Watch.com. Kaže da je za pokretanje uspješne tražilice "vaš cilj privući potrošače i prodati pristup njima trgovcima."

Stvari koje će vam trebati

  • Web stranica

  • Web alat za indeksiranje

  • Baza podataka visokih performansi za indeksiranje cijelog vašeg sadržaja

  • Velika propusnost za indeksiranje weba

  • Poslužitelji za pohranu informacija

  • dr. sc. iz informatike ili matematike (ili konzultant s istima)

Upozorenje

Svaki programer može pokrenuti tražilicu, ali pružanje relevantnih rezultata pravi je izazov.