Расчета абсолютной величины разности d

АЛГОРИТМ

L - критерий Колмогорова – Смирнова

Если в методе c2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т.д. Если различия между двумя распределениями существенны, то в какой-то момент разности накопленных частот достигнут критического значения, и мы сможем признать различия статистически достоверными.

Гипотезы:

Н0: Различия между двумя распределениями недостоверны.

Н1: Различия между двумя распределениями достоверны.

Важное ограничение данного критерия: разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, дни недели, месяцы после начала учебы в данном классе, отметки и т.д.

Данный критерий также можно использовать в двух случаях:

1) для сопоставления эмпирического распределения с теоретическим,

2) для сопоставления двух эмпирических распределений.

Покажу оба примера.

 

Пример 1. Сопоставление эмпирического распределения с теоретическим

При проведении социально-психологического исследования студентка К. прохожим в возрасте от 25 до 55 лет задавала вопрос: «В какой из будних дней недели Ваша работоспособность самая высокая?». Полученные результаты представлены в таблице 22.1. Можно ли считать работоспособность в начале недели достоверно более высокой, чем в конце недели?

Таблица 22.1.

  пн вт ср чт пт сумма
Работоспособность

 


между эмпирическим и равномерным распределениями[18]

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

2.

fэмп - эмпирическая частота по данному разряду, n - общее количество наблюдений.
Подсчитать относительные эмпирические частоты (частости) для каждого разряда по формуле:

, где

Занести результаты во второй столбец.

3. Подсчитать накопленные эмпирические частости Σf*j по формуле:

,

где Σf*j- частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

f*j- эмпирическая частость данного j-го разряда.

Занести результаты в третий столбец таблицы.

4. Подсчитать накопленные теоретические частости для каждого раз­ряда по формуле:

,

где Σf*Т j- теоретическая частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

f*Т j- эмпирическая частость данного разряда.

Занести результаты в четвертый столбец таблицы.

5. Вычислить разности между эмпирическими и теоретическими накопленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).

6. Записать в пятый столбец абсолютные величины полученных раз­ностей, без их знака. Обозначить их как d.

7. Определить по пятому столбцу наибольшую абсолютную величину разности - dmax.

8. По Табл. 8 Приложения 3 определить или рассчитать критические значения dmax для данного количества наблюдений п.

Если dmax равно критическому значению d или превышает его, различия между распределениями достоверны.

 

Действуя по алгоритму, заполним вспомогательную таблицу для расчетов.

Таблица 22.2.

  Эмпирическая частота Эмпирическая частость Накопленная эмпирическая частота Накопленная теоретическая частость Разность
Пн 0,247 0,247 0,200 0,047
Вт 0,296 0,543 0,400 0,143
Ср 0,235 0,778 0,600 0,178
Чт 0,099 0,877 0,800 0,077
Пт 0,123 1,000 1,000 0,000
Суммы 1,000      

 

Шаг 2. Подсчитаем эмпирические частости для каждого разряда по формуле

.

Шаг 3. Подсчитаем накопленные эмпирические частости. Для первого дня она будет такой же, как и эмпирическая частость этого дня. Во вторник – сумма частости первого и второго дня и т.д. Можно к каждой предыдущей сумме прибавлять частость данного дня.

Шаг 4. Подсчитаем накопленные теоретические частости. Если бы распределение было равномерным, то теоретические частости по каждому разряду (дню) были бы одинаковы.

, где k – количество разрядов.

Накопленные теоретические частости считаем суммированием.

Шаг 5 – 6. Вычислим разности между эмпирическими и теоретическими накопленными частостями и их абсолютные значения (без знака) запишем в таблицу.

Шаг 7. Определим наибольшее значение разности dmax. В нашем примере dmax = 0,178.

Шаг 8. По Таблице 8 Приложения 3 рассчитаем критические значения.

 

 

Ответ: Н0 отвергается. Распределение отличается от равномерного, т.е. работоспособность достоверно выше в начале недели (р≤0,05).

 

Пример 2. Сопоставление двух эмпирических распределений

Продолжим предыдущий пример. Подобное же исследование проведено и другой студенткой. Она получила результаты, представленные в таблице 22.3. Одинаковы ли распределения данных, полученные разными студентками (табл. 22.1 и 22.3)?