Радиодетали

Принцип работы поисковых систем

Интернет в наше время набрал пиковой популярности. Практически любую информацию можно найти на специализированых сайтах, посмотреть интересующее видео, картинку, фото. Загрузить или просмотреть онлайн любимый фильм, скачать популярную песню.  Для того чтобы пользователь с легкостью мог найти необходимое, не запоминая и не вводя в строку сложные названия сайтов, интернет-разработчики изобрели, так называемые, поисковые системы, версий которых в последние годы появляется все больше и больше.

Как же функционирует любая из этих систем поиска, и какой принцип ее работы? Для того чтобы узнать принцип действия поисковых систем следует узнать каким образом их создают. Итак, составляющие систем компоненты поиска:

1.Паук (spider) – программа для загрузки вэб-страниц, которая функционирует подобно браузеру. \

2.Краулер, «путешествующий паук» (сrawler) – автоматическая программа, созданная для быстрой компьютерной проверки всех существующих ссылок на определенной странице.

3.Индексатор (indexer) – программа для проверки и анализа страниц, скаченных пауками.

4.База данных (database ) – место для сохранения загруженных и обработанных страниц.

5.Система для выдачи результатов (search engine results engine ) – извлекает из вышеупомянутой базы данных все необходимые результаты.

6.Вэб-сервер (web server) – интернет-сервер, созданный для выполнения взаимодействий между пользователем и прочими составляющими системы поиска.

Именно с помощью данных компонентов совершаются процессы и принципы работы поисковых систем.  Кстати, если более тщательно углубится в составляющие популярных ныне систем поиска, то поисковые механизмы иногда некоторым образом отличаются один от другого. К примеру, такие программы как паук, краулер и индексатор, с помощью новейших технологий могут быть выполнены в виде единой программы. Она может самостоятельно загружать необходимые вэб-страницы, извлекает их и проводит отдельный поиск по ссылкам новых ресурсов. Но все же, каждая из поисковых систем всего интернета имеет в своем составе описанные выше общие компоненты.

 

Добавить комментарий


Защитный код
Обновить