Afbeelding tegoed: Jupiterimages/Pixland/Getty Images
Sinds het begin van internet hebben mensen grote hoeveelheden gemakkelijk toegankelijke gegevens online opgeslagen en geplaatst. Het internet heeft nu een onmetelijke hoeveelheid waardevolle informatie. Zoekmachines zijn nodig voor het lokaliseren, sorteren, opslaan en rangschikken van de waarde van die informatie op internet. Populaire zoekmachines zoals Google, Yahoo en Bing vinden relevante informatie en presenteren deze aan gebruikers. Om een bepaald stukje data efficiënt te kunnen vinden, is het belangrijk dat je de vier hoofdfuncties van de zoekmachines kent.
Kruipen
De crawler, of webspider, is een essentieel softwareonderdeel van de zoekmachine. Het sorteert in wezen via internet om website-adressen en de inhoud van een website te vinden voor opslag in de database van zoekmachines. Met crawlen kan nieuwe informatie op internet worden gescand of oudere gegevens worden gevonden. Crawlers hebben de mogelijkheid om een breed scala aan websites tegelijkertijd te doorzoeken en tegelijkertijd grote hoeveelheden informatie te verzamelen. Hierdoor kan de zoekmachine op uurbasis actuele inhoud vinden. De webspider kruipt totdat hij binnen een site geen informatie meer kan vinden, zoals verdere hyperlinks naar interne of externe pagina's.
Video van de dag
Indexeren
Zodra de zoekmachine de inhoud van internet heeft doorzocht, indexeert deze die inhoud op basis van het voorkomen van trefwoordzinnen op elke afzonderlijke website. Hierdoor kan een bepaalde zoekopdracht en onderwerp gemakkelijk worden gevonden. Trefwoordzinnen zijn de specifieke groep woorden die door een persoon worden gebruikt om een bepaald onderwerp te zoeken.
De indexeringsfunctie van een zoekmachine sluit eerst onnodige en veelvoorkomende artikelen uit, zoals "de", "een" en "een." Na het verwijderen van gewone tekst, slaat het de inhoud op een georganiseerde manier op voor snel en gemakkelijk toegang. Ontwerpers van zoekmachines ontwikkelen algoritmen voor het zoeken op internet op basis van specifieke trefwoorden en trefwoordzinnen. Die algoritmen matchen door gebruikers gegenereerde trefwoorden en trefwoordzinnen met inhoud die op een bepaalde website wordt gevonden, met behulp van de index.
Opslag
Het opslaan van webcontent in de database van de zoekmachine is essentieel voor snel en gemakkelijk zoeken. De hoeveelheid inhoud die beschikbaar is voor de gebruiker is afhankelijk van de hoeveelheid beschikbare opslagruimte. Grotere zoekmachines zoals Google en Yahoo zijn in staat om hoeveelheden gegevens op te slaan in de terabytes, waardoor een grotere bron van informatie beschikbaar is voor de gebruiker.
Resultaten
Resultaten zijn de hyperlinks naar websites die op de pagina van de zoekmachine verschijnen wanneer er naar een bepaald trefwoord of een bepaalde zin wordt gevraagd. Wanneer u een zoekterm typt, doorloopt de crawler de index en vergelijkt wat u hebt getypt met andere trefwoorden. Algoritmen die door de ontwerpers van zoekmachines zijn gemaakt, worden gebruikt om eerst de meest relevante gegevens te leveren. Elke zoekmachine heeft zijn eigen set algoritmen en geeft daarom verschillende resultaten.