Как да стартирате търсачка

click fraud protection
...

Изграждането на търсачка е трудно.

Хиляди програмисти по целия свят тихо почукват по клавиатурите си, опитвайки се да създадат следващата най-добра търсачка. Сергей Брин и Лорънс Пейдж, известните създатели на Google, признават, че „инженерирането на търсачка е предизвикателна задача“. Търсачката се използва за намиране на информация в мрежата. Двигател обхожда интернет и индексира милиони страници с информация, като изплюва резултати, когато някой търси.

Вземете уеб робот

Етап 1

Придобийте уеб робот, който е паякът или ботът, който обикаля из Интернет, събирайки страници от мрежата. Паяк посещава уеб страници, чете ги и следва връзки към други страници. Можете да намерите робот с отворен код или да създадете свой собствен. Ако искате да създадете свой собствен робот, вземете списък с URL адреси, с които да заредите вашия робот. Бавен робот е лесен за изграждане, но изграждането на високопроизводителен робот за индексиране на милиони и милиони страници е по-предизвикателно.

Видео на деня

Стъпка 2

Вземете толкова честотна лента, колкото можете да си позволите. Имате нужда от тази честотна лента за вашия робот, докато пътува из мрежата, получавайки страници.

Стъпка 3

Създайте индекс. Всичко, което вашият робот намира, влиза в индекса на търсачката. Индексът е като огромна книга или каталог, съдържащ копие на всяка уеб страница, която роботът намира. Анна Патерсън от Станфордския университет препоръчва да се индексират само данните, които са ви необходими, за да обслужвате вашия вид резултати от търсенето. Тя също така съветва да не се опитвате да индексирате „кухненската мивка“, а по-скоро „да вземете нещо представително“.

Стъпка 4

...

Вашият индекс съдържа цялата информация, намерена от вашия уеб робот.

Класирайте резултатите си в индекса, като използвате високопроизводителна база данни и цялата информация на вашите сървъри от вашето обхождане в мрежата. Трябва да обработите евентуално милиони уеб страници, за да създадете своя индекс. Страниците, записани във вашия индекс, трябва да бъдат класирани по реда на това, което е най-подходящо за търсещите ви.

Стъпка 5

Създайте атрактивен уебсайт, за да върнете резултати от търсенето.

Стъпка 6

Стартирайте и пускайте на пазара вашата търсачка. Безплатната търсачка трябва да отведе потребителите там, където искат да отидат бързо и елегантно, според Ласло Ксалиери от Search Engine Watch.com. Той казва, че за да управлявате успешна търсачка, "вашата цел е да привлечете потребители и да продадете достъп до тях на търговците."

Неща, от които се нуждаете

  • Уебсайт

  • Уеб робот

  • Високопроизводителна база данни за индексиране на цялото ви съдържание

  • Голяма честотна лента за обхождане в мрежата

  • Сървъри за съхранение на информация

  • д-р по компютърни науки или математика (или консултант със същото)

Внимание

Всеки програмист може да стартира търсачка, но предоставянето на подходящи резултати е истинското предизвикателство.