Специализированные поисковые системы

Поисковые системы общего назначения

Понятие поисковой системы

 

Поисковая система – это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в вмде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации в порядке релевантности ( в соответствии запросу).

Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации.

Поисковые серверы можно разделить на две группы:

l Поисковые системы общего назначения

l Специализированные поисковые системы

 

Являются базами данных, содержащими тематически сгруппированную информацию об информационных ресурсах Всемирной паутины.

Позволяют находить Web сайты и Web-страницы по ключевым словам в базе данных или путем поиска в иерархической системе каталогов.

Интерфейс таких поисковых систем содержит список разделов каталога и поле поиска.

Заполнение баз данных осуществляется с помощью специальных программ-роботов, которые периодически «обходят» Web –серверы Интернета, читают всевстречающиесядокументы, выделяют в них ключевые слова и заносят в базу данных, содержащую URL –адреса документов.

 

Позволяют искать информацию в других информационных «слоях» Интернета :

l серверах файловых архивов,

l почтовых серверах.

Могут быть двух типов:

l На основе использования баз данных

l Каталоги файлов

 

Основные характеристики поисковых систем

 

1. Полнота

  1. Точность
  2. Актуальность
  3. Скорость поиска
  4. Наглядность

1.1. Полнота

Эта характеристика представляет собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу.

Пример. В Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль «, а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6

1.2. Точность

Определяется степенью соответствия найденных документов запросу пользователя.

Пример. Если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова(«как правильно выбрать магнитолу и установить их в автомобиль), то точность поиска считается равной 50/100 =0,5

 

1.3. Актуальность

Характеризуется временем , проходящим с момента публикации документов в сети Интернет , до занесения их в индексную базу поисковой системы.

Пример. На следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами.

Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых ситем , так называемой «быстрой базы», которая обновляется несколько раз в день.

1.4. Скорость поиска

Тесно связана с его устойчивостью к нагрузкам.

Пример. По данном ООО»Рамблер Интернет Холдинг» на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в сек. Поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить выполнение следующих запросов.

1.5. Наглядность

n Вследствие нечеткости составления запросов или неточности поиска, страницы выдачи не всегда содержат только нужную информацию.

n Различные элементы страницы выдачи поисковой системы помогают производить свой собственный поиск внутри найденного списка, через подробные пояснения , например указываются ссылки на страницы.