Zasluga slike: Jupiterimages/Pixland/Getty Images
Od nastanka interneta ljudi pohranjuju i objavljuju velike količine lako dostupnih podataka na internetu. Internet sada ima nemjerljivu količinu vrijednih informacija. Tražilice su neophodne za lociranje, sortiranje, pohranjivanje i rangiranje vrijednosti tih informacija na webu. Popularne tražilice poput Googlea, Yahooa i Binga pronalaze relevantne informacije i prezentiraju ih korisnicima. Kako biste učinkovito pronašli određeni dio podataka, važno je da znate četiri glavne funkcije tražilica.
Puzeći
Crawler, ili web spider, vitalna je softverska komponenta tražilice. U osnovi razvrstava internet kako bi pronašao adrese web stranica i sadržaj web stranice za pohranu u bazi podataka tražilice. Puzanje može skenirati potpuno nove informacije na Internetu ili može locirati starije podatke. Alati za indeksiranje imaju mogućnost istovremenog pretraživanja širokog raspona web-mjesta i prikupljanja velikih količina informacija istovremeno. To omogućuje tražilici da pronađe trenutni sadržaj po satu. Web pauk indeksira sve dok ne može pronaći više informacija unutar web-mjesta, kao što su daljnje hiperveze na interne ili vanjske stranice.
Video dana
Indeksiranje
Nakon što tražilica indeksira sadržaj na Internetu, indeksira taj sadržaj na temelju pojavljivanja fraza ključnih riječi na svakoj pojedinačnoj web stranici. To omogućuje jednostavno pronalaženje određenog upita za pretraživanje i predmeta. Izrazi ključnih riječi su određena skupina riječi koju pojedinac koristi za pretraživanje određene teme.
Funkcija indeksiranja tražilice prvo isključuje sve nepotrebne i uobičajene članke kao što su "the," "a" i "an". Nakon uklanjanja uobičajenog teksta, pohranjuje sadržaj na organiziran način za brzo i jednostavno pristup. Dizajneri tražilica razvijaju algoritme za pretraživanje weba prema određenim ključnim riječima i ključnim frazama. Ti algoritmi povezuju ključne riječi i izraze ključnih riječi koje su izradili korisnici sa sadržajem koji se nalazi na određenoj web stranici, koristeći indeks.
Skladištenje
Pohranjivanje web sadržaja unutar baze podataka tražilice bitno je za brzo i jednostavno pretraživanje. Količina sadržaja dostupnog korisniku ovisi o količini dostupnog prostora za pohranu. Veće tražilice kao što su Google i Yahoo mogu pohraniti količine podataka u rasponu od terabajta, nudeći veći izvor informacija dostupnih korisniku.
Rezultati
Rezultati su hiperveze na web-stranice koje se pojavljuju na stranici tražilice kada se postavlja upit za određenu ključnu riječ ili frazu. Kada upišete pojam za pretraživanje, alat za indeksiranje prolazi kroz indeks i povezuje ono što ste upisali s drugim ključnim riječima. Algoritmi koje su izradili dizajneri tražilica koriste se za pružanje najrelevantnijih podataka. Svaka tražilica ima svoj skup algoritama i stoga vraća različite rezultate.