Рассмотрим примеры количественных соотношений для оценки эффективности поиска в документальных системах.
Критерии оценки документальных систем
Различают два класса оценок:
Внешние или функциональные оценки-основаны на сравнении результатов работы системы с результатами идеального содержательного поиска, осуществляемого экспертом. Они предполагают понятие релевантности.
Внутренние или нефункциональные оценки - могут основываться на таких структурных качествах системы как сложность, степень близости к человеческой логике или естественному языку, степень алгоритмичности и т.п.
Оценкаили метод оценки-это алгоритмическая процедура, которая любому оцениваемому объекту из данной области ставит в соответствие некоторый другой объект, называемый значением оценки. Полностью алгоритмическую процедуру оценки называют формальной оценкой. Различают два типа внешних оценок: оценки-описания, значения которых характеризуют непосредственно систему безотносительно к другим системам; оценки-шкалы,значения которых определяют сравнительные достоинства различных ИПС.
Содержательные представления о сравнительных достоинствах называется содержательной оценкой.
Определение полноты системы связано с определением содержательной выдачи на каждый запрос. Способы определения содержательной выдачи: сплошной просмотр всего экспериментального массива; метод документа-источника (метод Клевердона) (по некоторым документам массива, выбранным более или менее случайно, составляются запросы с таким расчетом, чтобы каждый документ источник был релевантен составленному по нему запросу); метод контрольных запросов (по запросу, полученному по произвольно выбранному документу – источнику проводится содержательный поиск путем сплошного просмотра массива, начиная, например, с документа-источника, до нахождения первого релевантного документа, который объявляется контрольным); метод формальных выдачприменяется при сравнении нескольких ИПС (оценка-шкала).
Введём обозначения:
a - число релевантных документов, выданных системой на запрос.
б - число всех нерелевантных, но выданных на запрос документов
в - число всех релевантных документов, но не выданных по запросу.
Полнота выдачи:
Точность выдачи
Потери информации
Информационный шум