Решение поисковых задач. Электронная почта.

Для поиска информации в Интернет разработаны специальные информационно-поисковые системы. Поисковые системы имеют обычный адрес и отображаются в виде Web-страницы, содержащей специальные средства для организации поиска (строку для поиска, тематический каталог, ссылки). Для вызова поисковой системы достаточно ввести ее адрес в адресную строку Браузера. По способу организации информации информационно-поисковые системы делятся на два вида: классификационные (рубрикаторы) и словарные.

Рубрикаторы (классификаторы) – поисковые системы, в которых используется иерархическая (древовидная) организация информации. При поиске информации пользователь просматривает тематические рубрики, постепенно сужая поле поиска. Сетевые каталоги организованы примерно так же, как и библиотечные. Они содержат различные разделы, подразделы и т.д. Работают с этими каталогами так же, как и с библиотечными - ‘спускаясь’ вниз по иерархической лестнице. Каталоги создаются вручную, т.е. информация в них заносится людьми. Благодаря ‘человеческому фактору’ информация в каталогах организована достаточно четко, что позволяет в определенных случаях достичь требуемого результата быстрее, чем при помощи поисковых машин. С другой стороны, в каталоги попадают далеко не все существующие страницы, а лишь ‘лучшие’ (с субъективной точки зрения создающего каталог). По этой причине найти какую-то достаточно специфическую информацию в каталоге зачастую невозможно.

Словарные поисковые системы – это мощные автоматические программно-аппаратные комплексы или поисковые машины. С их помощью просматривается (сканируется) информация в Интернет. Доступные в Сети страницы автоматически индексируются, т.е. создаются специальные базы данных, содержащие ключевые слова и связанные с ними адреса страниц, а уже в этих базах данных проводится поиск. В ответ на запрос осуществляется поиск в соответствии со строкой запроса. В результате пользователю предлагаются те адреса, на которых в момент сканирования найдены искомые слово или группа слов. Выбрав любой из предложенных адресов-ссылок, можно перейти к найденному документу. Таким образом, поисковые машины состоят из программ, собирающих информацию для базы данных, собственно базы, и программ для поиска в этой базе данных. Индексируют информацию так называемые роботы (сrawlers, spiders и пр.) - специальные программы, которые ‘ползают’ по сети, просматривают файлы и создают индексы, причем весь процесс происходит автоматически. Полнотекстовые поисковые машины индексируют каждое слово на WEB-странице (исключая лишь некоторые зарезервированные слова.

Кроме этого, существуют и так называемые мета-системы, представляющие собой интерфейсы для одновременного поиска с помощью нескольких поисковых машин. Так же многие поисковые системы содержат не только интерфейс для работы с индексом, но и каталоги.

К наиболее известным поисковым системам относятся AltaVista (разработка фирмы DEC, Яndex (CompTek International), RAMBLER (Stack Ltd., ориентирована на русскоязычный Internet), каталог YAHOO, синтез каталога и поисковой машины Lycos и др. Всего в Сети имеются сотни систем поиска. Адреса некоторых из них представлены в Приложении 2. Каждая поисковая система имеет строку для ввода запроса на поиск, в которую пользователь вводит ключевые слова для поиска. В большинстве случаев пользователь имеет возможность вводить несколько ключевых слов (допускаются символы типа * для указания любого набора символов и др.), связывая их логическими отношениями типа OR, AND, NOT и др. В таблице приведены правила формирования запросов, принятые в Апорт (http://www.aport.ru).

Оператор Синонимы Комментарий
И AND & По запросу будут найдены документы, содержащие оба ключевых слова. Его можно и не писать. Например, запрос: информатика и учебник эквивалентен информатика учебник
ИЛИ OR | Производится поиск тех документов, в которых используется любое из указанных слов или оба слова одновременно
НЕ NOT - ~ Поиск ограничивается документами, не содержащими слово, указанное после оператора
" " ' ' Двойные или одинарные кавычки позволяют находить словосочетание

В настоящее время программное обеспечение поиска информации в Сети является, пожалуй, наиболее динамично развивающейся областью (как и теория информационно-поисковых систем).