Credit imagine: Jupiterimages/Pixland/Getty Images
De la începuturile internetului, oamenii au stocat și postat cantități mari de date ușor accesibile online. Internetul are acum o cantitate incomensurabilă de informații valoroase. Motoarele de căutare sunt necesare pentru localizarea, sortarea, stocarea și clasarea valorii respectivelor informații pe web. Motoarele de căutare populare precum Google, Yahoo și Bing găsesc informații relevante și le prezintă utilizatorilor. Pentru a găsi eficient un anumit bit de date, este important să cunoașteți cele patru funcții principale ale motoarelor de căutare.
Crawling
Crawler-ul, sau web spider, este o componentă software vitală a motorului de căutare. În esență, sortează prin Internet pentru a găsi adresele site-urilor web și conținutul unui site web pentru stocare în baza de date a motorului de căutare. Crawlingul poate scana informații noi de pe Internet sau poate localiza date mai vechi. Crawlerele au capacitatea de a căuta o gamă largă de site-uri web în același timp și de a colecta simultan cantități mari de informații. Acest lucru permite motorului de căutare să găsească conținut curent pe o bază oră. Păianjenul web se accesează cu crawlere până când nu găsește mai multe informații într-un site, cum ar fi hyperlinkuri către pagini interne sau externe.
Videoclipul zilei
Indexarea
Odată ce motorul de căutare a accesat cu crawlere conținutul internetului, acesta indexează acel conținut pe baza apariției expresiilor de cuvinte cheie în fiecare site web individual. Acest lucru permite găsirea cu ușurință a unei anumite interogări de căutare și a unui subiect. Expresiile de cuvinte cheie sunt un anumit grup de cuvinte folosite de o persoană pentru a căuta un anumit subiect.
Funcția de indexare a unui motor de căutare exclude mai întâi orice articole inutile și obișnuite, cum ar fi „the”, „a” și „an”. După eliminarea textului obișnuit, stochează conținutul într-un mod organizat pentru rapid și ușor acces. Designerii motoarelor de căutare dezvoltă algoritmi pentru căutarea pe web în funcție de anumite cuvinte cheie și expresii de cuvinte cheie. Acești algoritmi potrivesc cuvintele cheie și expresiile de cuvinte cheie generate de utilizator cu conținutul găsit într-un anumit site web, folosind indexul.
Depozitare
Stocarea conținutului web în baza de date a motorului de căutare este esențială pentru o căutare rapidă și ușoară. Cantitatea de conținut disponibilă pentru utilizator depinde de spațiul de stocare disponibil. Motoarele de căutare mai mari precum Google și Yahoo sunt capabile să stocheze cantități de date care variază în teraocteți, oferind o sursă mai mare de informații disponibile pentru utilizator.
Rezultate
Rezultatele sunt hyperlinkuri către site-uri web care apar în pagina motorului de căutare atunci când este interogat un anumit cuvânt cheie sau o anumită expresie. Când introduceți un termen de căutare, crawler-ul parcurge indexul și potrivește ceea ce ați introdus cu alte cuvinte cheie. Algoritmii creați de designerii motoarelor de căutare sunt utilizați pentru a furniza mai întâi cele mai relevante date. Fiecare motor de căutare are propriul său set de algoritmi și, prin urmare, returnează rezultate diferite.