Лекция 11

Поиск информации в мировых информационных ресурсах с помощью сети Интернет

Интернет является глобальной информационной компьютерной сетью, построенной на основе Web технологий.

Технология Web позволяет не только обмениваться пользователям информацией между собой, но и позволяет обмениваться данными между пользователем и БД (человек-машина).

В сети Интернет информация передается пакетами, которые упорядочиваются определенным образом. Передача информации короткими сообщениями позволяет повысить ее надежность. В Интернет существует технология квитирования. Это технология, когда за каждый правильно полученный пакет клиент выписывает квитанцию и направляет ее на сервер.

Для поиска информации в Интернет существует несколько специальных приложений, облегчающих поиск информации в мировых информационных ресурсов. Это приложения называются поисковыми машинами, механизмами поиска, поисковыми роботами.

Наиболее распространенными машинами поиска являются Rambler, Google, AltaVista, Yandex, Yahoo.

Каждая из этих поисковых машин обладает индивидуальными параметрами, но решают одну задачу – поиск релевантной информации и даже пертинентной информации.

Машины поиска отличаются

- языком поиска;

- релевантностью поиска (т.е. одни системы находят документы ближе к запросу, а другие дальше от этого запроса);

- синтаксисом языка запроса;

- наличием интеллектуальных средств поиска (их наличие позволяет получать информацию близкую к потребностям пользователя);

- временем поиска;

- глубиной поиска (Под глубиной поиска понимается уровень просмотра документов в БД. Например, некоторые системы осуществляют поиск только по названиям файлов документов и даже не просматривают специальные разделы. Некоторые системы способны глубоко просматривать БД, включая текст документов. Проблема заключается в просмотре документов с расширением DOC, RTF, PDF.

Поиск информации в Интернет с помощью поисковой машины Rambler

 

Поисковая система Rambler воспринимает запрос на поиск документа на языке поисковых запросов или ИПЯ.

ИПЯ Rambler является разновидностью ИПЯ, позволяющего составлять логические выражения из терминов документа, связанных логическими операторами AND(и), OR(или), NOT(не).

В Rambler могут применяться сокращенные формы обозначения логических операторов, для которых используются символы & (AND), | (OR), ! (NOT).

В большинстве случаев регистр написания поисковых слов и операторов значения не имеет. Лишь только в некоторых случаях для повышения качества поиска это важно.

Например, если запрос состоит из 2-х, 3-х или 4-х слов, каждое из которых написано с большой буквы, то предполагается поиск по имени собственному, при этом автоматически производится изменение ограничения расстояния между словами запроса со значением по умолчанию на величину (n-1)*2, где n – число слов запроса. Это позволяет находить группу слов запроса, внутри которой не более одного лишнего слова или знака препинания. Например, Баден-Баден.

Запрос может содержать операторы. Операторы в документе не ищутся, они являются только инструкторами и являются бинарными, т.е. имеют левую и правую часть, каждая из которой также является запросом. Для изменения сферы действия операторов применяются скобки – ( ) и кавычки – ‘’. В Rambler используются одинарные кавычки.

Если оператор между словами или терминами явно не указан, то по умолчанию используется оператор AND.