Поисковые системы общего назначения

Работа с поисковыми программами

Цель и содержание: Приобрести навыки работы с поисковыми программами.

Теоретическое обоснование:

Для поиска информации в Интернете используются специальные поисковые сервера, которые содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail адресах и других информационных ресурсах Интернета. Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации.

Поисковые сервера Интернета можно разделить на две группы: поисковые системы общего назначения и специализированные поисковые системы.

Поисковые системы общего назначенияпозволяют находить документы во Всемирной паутине по ключевым словам, которые вводятся в поле поискаи/или с помощью иерархической системы каталогов.

Автоматическое заполнение баз данных поисковых систем производится роботизированными системами (Search Engines). Специальная программа-робот, которую называют паук (spider), постоянно обходит Интернет в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.

При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными для искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т.д.

Наиболее популярными поисковыми системами общего назначения в рускоязычном Интернете (Рунете) являются Яндекс (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru), а в англоязычном - Yahoo! (www.yahoo.com) (Рис. 6).

Рисунок 6 - Поисковые серверы Яндекс, Rambler и Апорт

Важными показателями качества поискового сервера являются:

- объем базы данных (количество документов);

- скорость обхода Интернета программным роботом (с этим связана скорость обновления информации в базе данных);

- алгоритм индексации (только по ключевым словам Web-страницы или по всему тексту);

- возможности расширенного поиска с использованием языка запросов;

- структура системы каталогов.