Информационно-поисковые системы (ИПС)

Каталог и файл

Порт

URL - Uniform Resource Locator

HTML - HyperText Markup Language

 

HTML - это подмножество языка SGML (Standard Generalized Markup Language), который используется для публикации документов на разных платформах. Подобно SGML, HTML это текст в формате ASCII с добавлением ряда управляющих кодов. Эти коды транслируются клиентской программой (браузером) и результат отображается на экране.

Элементами HTML являются ссылки, списки, заголовки, изображения, элементы форм. Конечно, HTML ограниченный язык и не может сравниться с издательскими системами такими, например, как PageMaker, но он постоянно развивается.

 

 

Ссылка HTML документа должна содержать адрес требуемого документа. Для повышения гибкости и независимости от технологий доступа для WWW была разработана специальная адресная система, известная как URL (унифицированный указатель ресурсов). URL позволяет указывать не только имя документа, но и протокол доступа к нему. URL состоит из нескольких частей: протокол://домен: порт/каталог/файл

В адресе URL не должно быть пробелов.

Протокол наиболее важная частъ URL, это совокупность правил по которым происходит взаимодействие между сервером и клиентом. Для WWW основным протоколом является http.

 

Домен (Адрес сервера)

Доменное имя сервера (или IP адрес) в Интернет, отделяется от имени протокола двумя косыми чертами "//".

 

Обозначает целым положительным числом точку входа на сервер. Является необязательным параметром, если не указан, то принимается равным 80.

 

Место расположения адресуемого ресурса. Имена каталогов и файлов должны соответствовать синтаксису Unix[27], т.е. подкаталоги разделяются прямой косой чертой "/"; большие и маленькие буквы различаются; если имя начинается с тильды "~", то это корневой каталог зарегистрированного пользователя; имя каталога должно оканчиваться косой чертой "/".

 

Информационно-поисковые системы представляет собой функциональную систему, предназначенную для хранения и поиска информации.

Поиск информации - это процесс отыскивания в массиве документов, соответствующих поступившему запросу.

Системы часто разделяют на фактографические и документальны. Фактографические системы в ответ на конкретные запросы о данных выдают конкретные ответы, содержащие по мере возможности, только действительно запрашиваемые данные, факты. Что же касается документальных систем, то они в ответ на запросы выдают подборки документов.

Документальная информационно-поисковая система не информирует пользователя о предмете запроса в том смысле, что она не изменяет его знания по этому предмету. Она информирует его лишь о наличии (или отсутствии) документов, имеющих отношение к его запросу, и о том, где эти документы можно найти.

Хотя эти два типа информационных систем схожи в том отношении, что ответы, которых ждут от фактографических систем, могут быть обнаружены в подборках документов, полученных в документальной системе, с точки зрения обработки эти системы совершенно различны. Документальный и фактографический поиск имеют совершенно различную организацию хранения, манипуляции со структурами данных и процессы обработки при выполнении различных операций.

Информационно-поисковые системы следует отличать от системы поиска данных (традиционно их называют базами данных), которые осуществляют поиск и выдачу пользователю фактических значений данных, как правило, в буквенной либо цифровой форме. Очевидно, что поиск данных есть частный случай поиска документов, при котором "документами" являются отдельные значения показателей либо текстовые фрагменты. В системах поиска данных информация представляется в виде таблиц. Фактически поиск данных сводиться к просмотру таблиц и выбору нужных значений в соответствии с заданными критериями поиска, которые формируются с помощью специального формализованного языка запросов (например, SQL - Structured Query Language).

В информационно-поисковых системах язык запросов менее формализован, как правило, в нем определены только операции, с помощью которых могут связываться между собой ключевые слова, содержащиеся в запросе.

Автоматизированная информационно-поисковая система (АИПС) является сложной информационной системой, включающей информационную базу, лингвистические, математические и технические компоненты.

Элементами реальной информационно-поисковые системы являются:

массив документов (текстов, записей), выступающих в качестве объекта поиска;

информационно-поисковый язык (ИПЯ) - искусственный язык, предназначенный для описания содержания и формы документов и (или) запросов для осуществления поиска;

правила индексирования (алгоритмы, методы), следуя которым производится описание средствами ИПЯ документов и запросов (перевод их с естественного языка на информационно-поисковый). В результате индексирования документа получается поисковый образ документа (ПОД), а при индексировании запроса - поисковые предписания (ПП);

правила (алгоритмы, методы) поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);

технические средства, с помощью которых реализуется ИПС, т.е. осуществляющие хранение и поиск информации;

обслуживающий персонал - индексаторы и технические работники, обеспечивающие обработку и ввод в систему документов, а также операторы информационно-поисковой системы, производящие поиск информации и выдачу ее потребителю (в качестве оператора может выступать и сам потребитель информации).

Информационно-поисковый язык, правила индексирования и поиска зависят от состава и тематики документов.

Все элементы информационно-поисковые системы могут быть разделены на две основные составляющие:

семантические[28] средства - ИПЯ, методы индексирования и поиска;

материальные составляющие (массивы документов, технические средства, персонал).

Совокупность информационно-поискового языка, методов индексирования и поиска принято в теории информационно-поисковых систем называть абстрактной информационно-поисковой системой. С помощью семантических средств информационно-поисковые системы осуществляет смысловые операции обработки документов, запросов и отбор документов, подлежащих выдаче.

Наиболее известными поисковыми системами в Internet являются: http://all.by, http://come.to/belarus http://www.rambler.ru, http://www.aport.ru, http://www.yandex.ru, http://www.yahoo.com, http://uk.altavista.com.