Поисковые системы общего назначения
Лаб. Раб. №17. Работа с поисковыми программами
Цель и содержание: Приобрести навыки работы с поисковыми программами.
Теоретическое обоснование:
Для поиска информации в Интернете используются специальные поисковые сервера, которые содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail адресах и других информационных ресурсах Интернета. Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации.
Поисковые сервера Интернета можно разделить на две группы: поисковые системы общего назначения и специализированные поисковые системы.
Поисковые системы общего назначенияпозволяют находить документы во Всемирной паутине по ключевым словам, которые вводятся в поле поискаи/или с помощью иерархической системы каталогов.
Автоматическое заполнение баз данных поисковых систем производится роботизированными системами (Search Engines). Специальная программа-робот, которую называют паук (spider), постоянно обходит Интернет в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.
При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными для искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т.д.
Наиболее популярными поисковыми системами общего назначения в рускоязычном Интернете (Рунете) являются Яндекс (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru), а в англоязычном - Yahoo! (www.yahoo.com) (Рис. 6).
Рисунок 6 - Поисковые серверы Яндекс, Rambler и Апорт
Важными показателями качества поискового сервера являются:
- объем базы данных (количество документов);
- скорость обхода Интернета программным роботом (с этим связана скорость обновления информации в базе данных);
- алгоритм индексации (только по ключевым словам Web-страницы или по всему тексту);
- возможности расширенного поиска с использованием языка запросов;
- структура системы каталогов.