Снижение размерности признакового пространства

Причины снижения размерности:

1. Наглядное представление данных ()

2. Лаконизм моделей Þ упрощение счета и интерпретации

3. Сжатие объемов хранимой информации

Новые показатели z(1),...,z(p) – из числа исходных x(1),...,x(p) или определяются

по некоторому правилу по совокупности исходных (линейная комбинация)

Требования к новым показателям:

1. Максимальная информативность

2. Взаимная некоррелированность

3. Минимальное искажение геометрической структуры исходных данных

Ситуации, в которых снижение размерности осуществить легко:

1. Дублирование информации (сильно взаимосвязанные показатели)

## тест MMPI – изначальный сбор “лишних” данных для идентификации невалидности

2. Неинформативные показатели (практически не меняются при переходе от объекта к объекту)

## владение основами работы в интернете клиентов интернет-магазина

3. Возможность агрегирования (или даже физического суммирования однотипных показателей)

## зарплата по основному месту работы, по совместительству, от самостоятельной деятельности, прочие доходы

Критерии:

1. Внешней информативности – максимальная точность воспроизведения y

2. Автоинформативности – максимальная точность воспроизведения не только результирующего показателя y, но и исходных признаковx(1),..., x(p)