МЕТРИКА ПРОСТРАНСТВА ПРИЗНАКОВ
ДИАГНОСТИКА ПО РАССТОЯНИЮ В ПРОСТРАНСТВЕ ПРИЗНАКОВ
МЕТРИКА ПРОСТРАНСТВА ПРИЗНАКОВ
План лекции
Анализ и проверка домашней работы
Организационный момент.
Ход лекции.
3. Ответьте на вопросы:
1. На чем основаны методы разделения в пространстве признаков?
2. Опишите пространство признаков. Чем эта система может быть охарактеризована?
3. В чем состоит условие компактности?
4. Дайте пояснение линейному методу разделения.
5. Приведите достаточное условие линейной разделимости двух непересекающихся областей. Приведите пример.
6. В каком случае может быть построена разделяющая функция?
7. Опишите метод трубок, который дает некоторые правила, с помощью которых можно образовать диагностически ценные комплексы признаков.
8. Поясните физический смысл метода потенциалов.
1.1 Координаты пространства.
1.2 Евклидово расстояние между точками.
1.3 Диагностическая мера расстояния.
1.4 Метрика в неизотропном пространстве признаков.
1.5 Обобщенная метрика пространства признаков
1.6 Замечание о классификации пространства признаков.
2.1 Выбор эталона.
2.2 Алгоритм распознавания.
2.3 Надежность распознавания.
2.4 Замечания о выборе метрики.
2.5 Диагностика по угловому расстоянию.
2.6 Диагностика по расстоянию до множества.
2.7 Алгоритм распознавания по методу среднего расстояния.
2.8 Метод минимального расстояния до множества.
В большинстве методов распознавания делается естественное предположение, что изображения объектов одного класса (образа) более близки друг другу, чем изображения разных классов. Метрические методы основаны на количественной оценке этой близости. В качестве изображения объекта принимается точка в пространстве признаков, мерой близости считается расстояние между точками.
1.1 Координаты пространства.Как известно, в пространстве признаков объект характеризуется N-мерным вектором
x = (x1, x2, ...,xN). (11.1)
Координаты пространства Xj могут быть непрерывными или дискретными величинами. В последнем случае xJ представляет признак kr имеющий несколько диагностических разрядов. Часто используется кодирование признаков в бинарном коде. Тогда координата Xj выражается двоичным числом и может иметь значения: Xj1 = О, Xj2 = 1. При использовании унитарного (двоичного) кода возможные значения таковы: xj1= —1, xj2 = 1.
В диагностическом пространстве объект описывается вектором, размерность которого может отличаться от размерности вектора в пространстве признаков. В качестве координат диагностического пространства принимаются функции
(11. 2)
В дальнейшем для простоты рассматриваются метрические методы в пространстве признаков, но все результаты легко переносятся на диагностическое пространство.
1.2 Евклидово расстояние между точками. Обычное расстояние между точками х и а пространства признаков
Равенство (11.3) устанавливает метрику евклидова пространства, причем основные метрические свойства этого пространства выражаются условиями:
(11.4)
В задачах распознавания часто удобно в качестве меры расстояния принимать квадрат расстояния
Величина L2 тесно связана с многомерным нормальным распределением, более проста для вычислений, а неравенство
(11.6)
влечет за собой более сильное неравенство
(11.7)
В некоторых случаях применяют термин ОБОБЩЕННОЕ ПРОСТРАНСТВО - Обобщенное расстояние удовлетворяет метрическим свойствам (11.4) евклидова пространства.
1.3 Диагностическая мера расстояния.Иногда оказывается целесообразным использовать в качестве диагностической меры расстояния некоторую степень расстояния
(11.9)
В дальнейшем будем часто использовать квадратичное (евклидово) расстояние (v = 2) и вторую степень расстояния. Тогда диагностическая мера расстояния между точками х и а
(11.11)
1.4 Метрикав неизотропном пространстве признаков. Предыдущие определения расстояния соответствовали однородному, изотропному пространству признаков, координаты которого имеют общую единицу измерений. Такое пространство однородных признаков используется в ряде задач распознавания Например, для акустической диагностики в качестве признаков могут применяться амплитуды соответствующих гармоник и т. п.
Диагностика с помощью признаков в двоичном коде соответствует использованию изотропного, однородного пространства признаков. Однако во многих задачах диагностики пространство признаков является анизотропным, т. е. единицы измерения в различных направлениях различны. Координатам xJ могут соответствовать параметры различной физической природы (например, x1 — температура; х2— давление и т. п.).
С помощью компонентов весового вектора
можно учесть различную диагностическую ценность признаков, придавая большее значение наиболее значимым признакам. Так как для диагностики важен относительный вес, то можно использовать условие нормирования в виде
(11.13)
Введение весовых коэффициентов деформирует пространство признаков.
1.5 Обобщенная метрика пространства признаков.Соотношение (11.11)устанавливает «неравноправие» отдельных координат в пространстве признаков, но оно не учитывает роль координаты Xj-для диагноза Dj. Диагностическое значение признаков различно для различных диагнозов и расстояние точки х до точки a принадлежащей диагнозу D
Для непрерывно распределенных признаков хJ вероятность дискретных значений заменяется плотностью вероятности, суммирование— интегрированием по области значений хJ .
1.6 Замечание о классификации пространства признаков.В зависимости от используемой метрики, будем различать три вида пространства признаков.
Неизотропное, неоднородное пространство соответствует метрике общего вида . Если для всех диагнозов
(11.21)
то пространство называется однородным, неизотропным. Наконец, при
(11.22)
пространство считается однородным и изотропным.