Снижение размерности признакового пространства
Причины снижения размерности:
1. Наглядное представление данных ()
2. Лаконизм моделей Þ упрощение счета и интерпретации
3. Сжатие объемов хранимой информации
Новые показатели z(1),...,z(p) – из числа исходных x(1),...,x(p) или определяются
по некоторому правилу по совокупности исходных (линейная комбинация)
Требования к новым показателям:
1. Максимальная информативность
2. Взаимная некоррелированность
3. Минимальное искажение геометрической структуры исходных данных
Ситуации, в которых снижение размерности осуществить легко:
1. Дублирование информации (сильно взаимосвязанные показатели)
## тест MMPI – изначальный сбор “лишних” данных для идентификации невалидности
2. Неинформативные показатели (практически не меняются при переходе от объекта к объекту)
## владение основами работы в интернете клиентов интернет-магазина
3. Возможность агрегирования (или даже физического суммирования однотипных показателей)
## зарплата по основному месту работы, по совместительству, от самостоятельной деятельности, прочие доходы
Критерии:
1. Внешней информативности – максимальная точность воспроизведения y
2. Автоинформативности – максимальная точность воспроизведения не только результирующего показателя y, но и исходных признаковx(1),..., x(p)