Поисковые системы

Если раньше примерно половина поиска велась с помощью поисковых систем, а половина с помощью каталогов, то сейчас это соотношение изменилось до 4:1 в пользу поисковиков. Поисковые машины служат для обнаружения необходимого ресурса в сети Интернет по ключевым словам.

Упрощенная структура поисковой машины имеет вид:

Основные элементы поисковой машины:

Пользовательский интерфейс – web-страница поисковой системы, содержащая средства взаимодействия пользователя с поисковой системой. В частности, элементами пользовательского интерфейса являются правила написания запросов и представление результатов поиска.

Алгоритм поиска – программный алгоритм обработки поискового запроса, составленного пользователем.

Робот – специальная программа, входящая в состав поисковой системы, которая выполняет периодический просмотр ресурсов Интернет с целью обновления индексной базы данных. Для поисковой системы – это основной источник информации о состоянии ресурсов сети Интернет. По этим данным формируется индексная база, в которой хранятся сведения о найденных интернет-ресурсах.

Индексная база данных – основное информационное хранилище поисковой системы. Здесь хранятся адреса и характеристики Интернет-сайтов и страниц. Структура базы выбирается так, чтобы поиск происходил максимально быстро и эффективно.

 

Чтобы правильно выбрать поисковую машину, следует учитывать следующие их характеристики:

· Релевантность – это степень отношения ответа запросу. Чем ближе к началу списка находится нужный документ, тем выше его релевантность.

· Объем базы поисковой машиныизмеряется общим объемом проиндексированной информации, числом уникальных серверов и количеством документов. Обычно эта характеристика (общее количество всех найденных документов) указывается на web-странице в начале списка адресов найденных документов.

· Актуальность ссылок.Необходимо постоянно отслеживать состояние ссылок, т. к. серверы исчезают и появляются, и их страницы обновляются. Ссылки, которые выдает поисковая машина в списке ответа, должны существовать, а их содержание – соответствовать запросу.

· Скорость поиска.

· Поисковые возможности (работа с языками документов и запросов).Полнотекстовая поисковая машина индексирует все слова текста, видимого пользователю. Учет морфологии в языке запросов позволяет находить искомые слова во всех склонениях или спряжениях.

· Дополнительные возможности: поиск похожих документов, ограничение области поиска какой-то одной областью знаний или деятельности, наличие списка найденных серверов, поиск по датам и серверам, удобный интерфейс машины.