БАНКИ ДОКУМЕНТОВ

 

Объектами хранения информации в банке документов являются документы, либо факты, извлекаемые из документов. В зависимости от этого различают следующие виды информационного поиска: документальный и фактографический.

Целью документального поиска является нахождение в хранилище документов, соответствующих запросу пользователя (такие документы называются релевантными), и выдачи этих документов или сведений о них.

Автоматизированные банки информации, предназначенные для реализации документального поиска, получили названия документальных информационно-поисковых систем (ИПС) и в настоящее время широко используется в качестве справочного инструмента пользователей научно-технической информации, в информационном обслуживании специалистов, управленческих работников и др.

В автоматизированном банке документов выделяются следующие составные части:

1) информационно-поисковый массив документов (текстов) либо фактов, выступающих в качестве объектов поиска;

2) информационно-поисковый язык, предназначенный для отображения содержания документов и запросов пользователей для последующего осуществления поиска;

3) правила(алгоритмы, методы) индексирования, позволяющие перевести содержание документов и запросов с естественного языка на информационно-поисковый язык;

4) правила (алгоритмы, методы) поиска документов, соответствующих запросу, которые задаются в виде критерия соответствия (критерия выдачи);

5) комплекс программных и технических средств, с помощью которых реализуются процессы накопления, хранения и поиска документов;

6) коллектив специалистов (обслуживающий персонал), основными из которых являются администратор банка, аналитики, системные программисты и индексаторы.

Различают два основных режима работы банков документов: 1) изберательное распределение информации (ИРИ), обеспечивающее текущее информирование пользователей (абонентов банков) о новых поступлениях документов; 2) ретроспективный поиск (РП), обеспечиващий справочное обслуживание пользователей по разовым запрсам путем поиска в долговременном массиве документов.

В отличае от ретроспективного поиска в режиме ИРИ пеиодически (раз в две недели, в месяц и т.п.) производится поиск в массиве новых поступлений в соответствии с постоянно действующими запросами пользователей.

Информационную базубанков документов составляют информационно-поисковый массив (ПОД и ПОЗ), хранилище документов и информационно-поисковый язык ИПЯ.