Поисковый аппарат

Под информационным поиском понимается некоторая последовательность операций, выполняемых с целью отыскании документов (статей, научно-технических отчетов и т.д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.

Массив элементов информации, в котором производится информационный поиск, условно назван поисковым массивом.

Теория информационного поиска документальной информации разрабатывалась для научно – технической информации (НТИ), носители которой принято делить на первичные и вторичные.

Первичные документы: опубликованные документы; специальные виды технических изданий (нормативно-методическая и нормативно-техническая документация, патентно-лицензионная документация и т.д.); неопубликованные документы (депонированные рукописи, отчеты о выполнении научно-исследовательских работ, диссертаций и т.п.).

Вторичные документы: реферативные журналы; экспресс-информация органов НТИ; обзорные информации: реферативные и аналитические отчеты (разовые и периодические); информационные издания по патентам и стандартам.

Существуют различные виды информационного обслуживания: регламентированное обслуживание в форме подготовки и издания обзорных и реферативных информаций или обслуживание по стандартным запросам; оповещение отдельных специалистов (абонентов) о текущих публикациях; ретроспективный поиск, т.е. отыскание документов, в которых находятся сведения по конкретным запросам, в массиве всех накопленных источников информации.

Каждому документу, вводимому в поисковый массив, ставится в соответствие поисковый образ документа (ПОД), который представляет собой характеристику, отражающую основное смысловое содержание документа (отличие от кода в ФИС).

Запрос сформулирован в виде краткой характеристики поискового образа запроса или поискового предписания (ПОЗ).

Простейшим ПОД может быть заглавие документа, переписанное в форме перечня входящих в него слов.

Для сопоставления ПОД и ПОЗ разрабатывают и применяют различные критерии поискаиликритерии смыслового соответствия (КСС).

Точность поиска определяется точностью отображения документов и запросов с помощью ПОД и ПОЗ. Для оценки качества поиска вводят специальные критерии.

Релевантность - соответствие выдачи запросу, т.е. характеризуется качество алгоритма поиска (объективная характеристика).

Пертинентность -соответствие выдачи потребностям пользователя, т.е. характеризуется смысловыражающая возможность ИПЯ, точность отображения с его помощью информационных потребностей (субъективная характеристика, основана на мнении пользователя).