Поисковый аппарат
Под информационным поиском понимается некоторая последовательность операций, выполняемых с целью отыскании документов (статей, научно-технических отчетов и т.д.), содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на заданные вопросы.
Массив элементов информации, в котором производится информационный поиск, условно назван поисковым массивом.
Теория информационного поиска документальной информации разрабатывалась для научно – технической информации (НТИ), носители которой принято делить на первичные и вторичные.
Первичные документы: опубликованные документы; специальные виды технических изданий (нормативно-методическая и нормативно-техническая документация, патентно-лицензионная документация и т.д.); неопубликованные документы (депонированные рукописи, отчеты о выполнении научно-исследовательских работ, диссертаций и т.п.).
Вторичные документы: реферативные журналы; экспресс-информация органов НТИ; обзорные информации: реферативные и аналитические отчеты (разовые и периодические); информационные издания по патентам и стандартам.
Существуют различные виды информационного обслуживания: регламентированное обслуживание в форме подготовки и издания обзорных и реферативных информаций или обслуживание по стандартным запросам; оповещение отдельных специалистов (абонентов) о текущих публикациях; ретроспективный поиск, т.е. отыскание документов, в которых находятся сведения по конкретным запросам, в массиве всех накопленных источников информации.
Каждому документу, вводимому в поисковый массив, ставится в соответствие поисковый образ документа (ПОД), который представляет собой характеристику, отражающую основное смысловое содержание документа (отличие от кода в ФИС).
Запрос сформулирован в виде краткой характеристики поискового образа запроса или поискового предписания (ПОЗ).
Простейшим ПОД может быть заглавие документа, переписанное в форме перечня входящих в него слов.
Для сопоставления ПОД и ПОЗ разрабатывают и применяют различные критерии поискаиликритерии смыслового соответствия (КСС).
Точность поиска определяется точностью отображения документов и запросов с помощью ПОД и ПОЗ. Для оценки качества поиска вводят специальные критерии.
Релевантность - соответствие выдачи запросу, т.е. характеризуется качество алгоритма поиска (объективная характеристика).
Пертинентность -соответствие выдачи потребностям пользователя, т.е. характеризуется смысловыражающая возможность ИПЯ, точность отображения с его помощью информационных потребностей (субъективная характеристика, основана на мнении пользователя).