Kā palaist meklētājprogrammu

click fraud protection
...

Meklētājprogrammas izveide ir sarežģīta.

Tūkstošiem programmētāju visā pasaulē klusi pieskaras savām tastatūrām, cenšoties izveidot nākamo labāko meklētājprogrammu. Slavenie Google veidotāji Sergejs Brins un Lorenss Peidžs atzīst, ka "meklētājprogrammas projektēšana ir izaicinošs uzdevums". Informācijas atrašanai tīmeklī tiek izmantota meklētājprogramma. Dzinējs pārmeklē internetu un indeksē miljoniem informācijas lappušu, izspiežot rezultātus, kad kāds veic meklēšanu.

Iegūstiet tīmekļa rāpuļprogrammu

1. darbība

Iegādājieties tīmekļa rāpuļprogrammu, kas ir zirneklis vai robots, kas rāpo pa internetu, apkopojot lapas no tīmekļa. Zirneklis apmeklē Web lapas, lasa tās un seko saitēm uz citām lapām. Varat atrast atvērtā koda rāpuļprogrammu vai izveidot savu. Ja vēlaties izveidot savu rāpuļprogrammu, iegūstiet vietrāžu URL sarakstu, ko izmantot rāpuļprogrammai. Lēnu rāpuļprogrammu ir viegli izveidot, taču ir grūtāk izveidot augstas veiktspējas rāpuļprogrammu, lai indeksētu miljoniem un miljoniem lapu.

Dienas video

2. darbība

Iegūstiet tik daudz joslas platuma, cik varat atļauties. Šis joslas platums ir nepieciešams jūsu rāpuļprogrammai, kas pārvietojas pa tīmekli, iegūstot lapas.

3. darbība

Izveidojiet indeksu. Viss, ko jūsu rāpuļprogramma atrod, tiek iekļauts meklētājprogrammas rādītājā. Indekss ir kā milzīga grāmata vai katalogs, kurā ir katras rāpuļprogrammas atrastās Web lapas kopija. Anna Patersone no Stenfordas universitātes iesaka indeksēt tikai tos datus, kas nepieciešami jūsu veida meklēšanas rezultātu nodrošināšanai. Viņa arī iesaka nemēģināt indeksēt "virtuves izlietni", bet gan "izveidot kaut ko reprezentatīvu".

4. darbība

...

Jūsu rādītājā ir visa informācija, ko atrod jūsu tīmekļa rāpuļprogramma.

Sarindojiet savus rezultātus rādītājā, izmantojot augstas veiktspējas datu bāzi un visu informāciju, kas atrodas jūsu serveros no tīmekļa pārmeklēšanas. Lai izveidotu indeksu, jums jāapstrādā, iespējams, miljoniem Web lapu. Lapas, kas ierakstītas jūsu rādītājā, ir jāsakārto tādā secībā, kas ir visatbilstošākā jūsu meklētājiem.

5. darbība

Izveidojiet pievilcīgu vietni, lai atgrieztu meklēšanas rezultātus.

6. darbība

Palaidiet un reklamējiet savu meklētājprogrammu. Saskaņā ar Laszlo Xalieri no Search Engine Watch.com, bezmaksas meklētājprogrammai ir jānogādā lietotāji tur, kur viņi vēlas doties ātri un eleganti. Viņš saka, ka veiksmīgas meklētājprogrammas darbināšanai "jūsu mērķis ir piesaistīt patērētājus un pārdot tiem piekļuvi tirgotājiem."

Lietas, kas jums būs nepieciešamas

  • Vietne

  • Tīmekļa rāpuļprogramma

  • Augstas veiktspējas datu bāze visa satura indeksēšanai

  • Liels joslas platums tīmekļa pārmeklēšanai

  • Serveri informācijas glabāšanai

  • Ph.D. datorzinātnēs vai matemātikā (vai konsultants ar to pašu)

Brīdinājums

Jebkurš programmētājs var palaist meklētājprogrammu, taču atbilstošo rezultātu nodrošināšana ir īsts izaicinājums.