Расчета абсолютной величины разности d
АЛГОРИТМ
L - критерий Колмогорова – Смирнова
Если в методе c2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т.д. Если различия между двумя распределениями существенны, то в какой-то момент разности накопленных частот достигнут критического значения, и мы сможем признать различия статистически достоверными.
Гипотезы:
Н0: Различия между двумя распределениями недостоверны.
Н1: Различия между двумя распределениями достоверны.
Важное ограничение данного критерия: разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, дни недели, месяцы после начала учебы в данном классе, отметки и т.д.
Данный критерий также можно использовать в двух случаях:
1) для сопоставления эмпирического распределения с теоретическим,
2) для сопоставления двух эмпирических распределений.
Покажу оба примера.
Пример 1. Сопоставление эмпирического распределения с теоретическим
При проведении социально-психологического исследования студентка К. прохожим в возрасте от 25 до 55 лет задавала вопрос: «В какой из будних дней недели Ваша работоспособность самая высокая?». Полученные результаты представлены в таблице 22.1. Можно ли считать работоспособность в начале недели достоверно более высокой, чем в конце недели?
Таблица 22.1.
пн | вт | ср | чт | пт | сумма | |
Работоспособность |
между эмпирическим и равномерным распределениями[18]
1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).
2.
|
, где
Занести результаты во второй столбец.
3. Подсчитать накопленные эмпирические частости Σf*j по формуле:
,
где Σf*j- частость, накопленная на предыдущих разрядах;
j - порядковый номер разряда;
f*j- эмпирическая частость данного j-го разряда.
Занести результаты в третий столбец таблицы.
4. Подсчитать накопленные теоретические частости для каждого разряда по формуле:
,
где Σf*Т j- теоретическая частость, накопленная на предыдущих разрядах;
j - порядковый номер разряда;
f*Т j- эмпирическая частость данного разряда.
Занести результаты в четвертый столбец таблицы.
5. Вычислить разности между эмпирическими и теоретическими накопленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).
6. Записать в пятый столбец абсолютные величины полученных разностей, без их знака. Обозначить их как d.
7. Определить по пятому столбцу наибольшую абсолютную величину разности - dmax.
8. По Табл. 8 Приложения 3 определить или рассчитать критические значения dmax для данного количества наблюдений п.
Если dmax равно критическому значению d или превышает его, различия между распределениями достоверны.
Действуя по алгоритму, заполним вспомогательную таблицу для расчетов.
Таблица 22.2.
Эмпирическая частота | Эмпирическая частость | Накопленная эмпирическая частота | Накопленная теоретическая частость | Разность | |
Пн | 0,247 | 0,247 | 0,200 | 0,047 | |
Вт | 0,296 | 0,543 | 0,400 | 0,143 | |
Ср | 0,235 | 0,778 | 0,600 | 0,178 | |
Чт | 0,099 | 0,877 | 0,800 | 0,077 | |
Пт | 0,123 | 1,000 | 1,000 | 0,000 | |
Суммы | 1,000 |
Шаг 2. Подсчитаем эмпирические частости для каждого разряда по формуле
.
Шаг 3. Подсчитаем накопленные эмпирические частости. Для первого дня она будет такой же, как и эмпирическая частость этого дня. Во вторник – сумма частости первого и второго дня и т.д. Можно к каждой предыдущей сумме прибавлять частость данного дня.
Шаг 4. Подсчитаем накопленные теоретические частости. Если бы распределение было равномерным, то теоретические частости по каждому разряду (дню) были бы одинаковы.
, где k – количество разрядов.
Накопленные теоретические частости считаем суммированием.
Шаг 5 – 6. Вычислим разности между эмпирическими и теоретическими накопленными частостями и их абсолютные значения (без знака) запишем в таблицу.
Шаг 7. Определим наибольшее значение разности dmax. В нашем примере dmax = 0,178.
Шаг 8. По Таблице 8 Приложения 3 рассчитаем критические значения.
Ответ: Н0 отвергается. Распределение отличается от равномерного, т.е. работоспособность достоверно выше в начале недели (р≤0,05).
Пример 2. Сопоставление двух эмпирических распределений
Продолжим предыдущий пример. Подобное же исследование проведено и другой студенткой. Она получила результаты, представленные в таблице 22.3. Одинаковы ли распределения данных, полученные разными студентками (табл. 22.1 и 22.3)?