Тема 3. Проверка статистических гипотез применительно к правоохранительной и управленческой деятельности

Организация медицинской помощи женщинам и детям

Организация медицинской помощи женщинам и детям

n Стационарная медицинская помощь женщинам оказывается в акушерско-гинекологических отделениях родильных домов либо крупной многопрофильной больнице. В последние годы в крупных городах появились специализированные родильные дома для женщин, страдающих невынашиванием беременности.

n В структуре стационара родильного дома предусмотрены приемное отделение, 1 физиологическое и 2 обсервационных отделения, которые в свою очередь включают дородовые палаты, родблок и послеродовые палаты, палаты для совместного пребывания матери и ребенка; палаты для новорожденных; отделение патологии беременности и гинекологические (консервативное и оперативное).

n Для рационального использования коечного фонда, сокращения необоснованного пребывания женщин в стационаре все госпитализированные должны быть максимально обследованы в женской консультации и при поступлении иметь подробную выписку из амбулаторной карты.

n В свою очередь при выписке из стационара они должны иметь подробные рекомендации по дальнейшему наблюдению за состоянием их здоровья в условиях женской консультации.

 

В ходе работы с полученным материалом исследователю приходится проверять те или иные предположения (гипотезы) относительно неизвестных характеристик распределений.

Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной.

Например, если нулевая гипотеза Н0: М(Х)=10, то гипотеза Н1 может иметь вид М(Х)=12 или М(Х)¹10.

В некоторых задачах формулируют лишь основную гипотезу Н0, предполагая по умолчанию, что гипотеза Н1 есть отрицание Н0.

В ходе проверки гипотезы Н0 можно прийти к правильному решению либо совершить ошибку. Различают ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута гипотеза Н0, когда она верна. Пусть a – вероятность такой ошибки (уровень значимости). Под уровнем значимости понимают вероятность (достаточно малую), при которой событие (в данном случае отсутствие ошибки) можно считать практически невозможным.

Ошибка второго рода состоит в том, что будет принята гипотеза Н0, когда она ложная. Пусть a/ – вероятность такой ошибки.

Желательно провести проверку гипотез так, чтобы свести к минимуму вероятность a+a/.

Закон распределения генеральной совокупности может быть известен или неизвестен. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (например А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.

Проверка гипотезы о предполагаемом законе неизвестного распределения производится при помощи специально подобранной случайной величины - критерия согласия.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Известно несколько критериев согласия: c2 (“хи квадрат”) Пирсона, Колмогорова, Смирнова и т.д.

Общая идея применения критериев согласия заключается в следующем.

На основании статистического материала необходимо проверить гипотезу Н0 о том, что случайная величина Х подчиняется некоторому определенному закону распределения. Этот закон может быть задан в той или иной форме, например в виде функции распределения или плотности вероятности.

Характеристикой степени расхождения теоретического и эмпирического распределений является некоторая величина U, которая может вычисляться различными способами, например как сумма квадратов отклонений теоретических вероятностей от соответствующих частот с некоторыми коэффициентами ("весами"), либо как максимальное отклонение эмпирической функции распределения от теоретической и т.д. Величина U также является случайной, ее закон распределения зависит от закона распределения случайной величины Х и от числа опытов (объема выборки). Допустим, что этот закон распределения известен.

В результате серии опытов выбранная мера расхождения U приняла некоторое значение u. Вопрос заключается в следующем: можно ли объяснить такое расхождение случайными причинами или оно велико и указывает на наличие существенной разницы между теоретическим и эмпирическим распределениями и, следовательно, на непригодность гипотезы Н0. Для ответа на этот вопрос необходимо вычислить вероятность того, что за счет случайных причин, связанных с недостаточным объемом выборки, мера расхождения окажется не меньше, чем наблюдаемое в опыте значение u (т.е. Uu), причем в предположении, что гипотеза Н0 верна. Если эта вероятность мала, то гипотезу Н0 следует отвергнуть как мало правдоподобную, если же эта вероятность велика, то следует признать, что экспериментальные данные не противоречат гипотезе Н0.

Рассмотрим применение критерия Пирсона. Критерий Пирсона может применяться для различных распределений, что является его достоинством. При этом, он не доказывает справедливость гипотезы, а лишь указывает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Произведена выборка объемом n. По данным выборки построен интервальный статистический ряд:

Таблица 1

Ji

Требуется проверить, согласуются ли экспериментальные данные с гипотезой о законе распределения случайной величины Х. Этот закон распределения называют "теоретическим".

Если известен теоретический закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из интервалов . Проверка согласованности теоретического и эмпирического распределений заключается в оценке расхождений между теоретическими вероятностями и относительными частотами . В качестве меры расхождения естественно выбрать сумму квадратов отклонений , взятых с некоторыми "весами" :

Коэффициенты вводятся потому, что отклонения, относящиеся к разным интервалам , нельзя считать равноправными по значимости. Абсолютное значение отклонения необходимо сравнивать в самой вероятностью , т.е. значения необходимо принять обратно пропорциональными вероятностям .

К. Пирсон предложил и показал, что при больших объемах выборок закон распределения величины U практически не зависит от функции распределения F(x) и числа опытов n, а зависит только от числа интервалов k.

При таком выборе коэффициентов мера расхождения обозначается :

.

Для удобства вычислений, чтобы не иметь дела с дробными величинами с большим количеством нулей можно перейти от относительных частот к частотам:

.

Полученное значение называют также наблюдаемым значением и обозначают . Для распределения составлены специальные таблицы, по которым можно найти критические точки . Параметрами распределения являются количество степеней свободы r и вероятность a. Вероятность a, называемая также уровнем значимости, показывает вероятность того, что расхождение между теоретическим и эмпирическим распределениями носит незначимый характер.

Таким образом, чтобы проверить нулевую гипотезу Н0, необходимо вычислить наблюдаемое значение критерия и по заданному уровню значимости a и числу степеней свободы k найти критическую точку .

Правило. Если - нет оснований отвергнуть нулевую гипотезу.

Если - нулевую гипотезу следует отвергнуть.

Пример 8. При уровне значимости 0,95 проверить гипотезу о нормальном распределении генеральной совокупности. Задано интервальное распределение выборки объема n=130 (таблица 2).

Таблица 2

i
xi
xi+1
ni

Решение

1. Найдем середины интервалов и получим последовательность равноотстоящих вариант и соответствующих им частот ni:

 

ni

2. Найдем выборочную среднюю и выборочное среднее квадратичное отклонение s*:

3. Найдем интервалы (zi, zi+1):

 

 

  Границы интервала Границы интервала
i xi xi+1
-1,54
-1,54 -1,052
-1,052 -0,563
-0,563 -0,075
-0,075 0,413
0,413 0,901
0,901 1,39
1,39

4. Найдем искомые вероятности pi и искомые частоты : :

i zi zi+1 Ф(zi) Ф(zi+1) pi
-1,54 -0,5 -0,4382 0,0618
-1.54 -1,052 -0,4382 -0,3531 0,0851
-1.052 -0,563 -0,3531 -0,2123 0,1408
-0.563 -0,075 -0,2123 -0,0279 0,1844
-0.075 0,413 -0,279 0,1591 0,187
0.413 0,901 0,1591 0,3159 0,1568
0.901 1,39 0,3159 0,4177 0,1018
1.39 0,4177 0,5 0,0823

5. Вычислим :

6. Найдем число степеней свободы: k=s-3=8-3=5.

По таблице критических точек распределения c2, по уровню значимости a=0,95 и числу степеней свободы k=5 найдем

Так как , то следует отвергнуть нулевую гипотезу. Т.е. расхождение эмпирических и теоретических частот значимое, данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.

На практике довольно часто возникает задача сравнения дисперсий Применительно к статистическим исследованиям социально-правовых процессов речь может идти, например, о сравнении точности методов измерений, о возможности или невозможности сравнения средних оценок и т.п.

Пусть генеральные совокупности X и Y распределены нормально. По независимым выборкам с объемами n1 и n2, извлеченным из этих генеральных совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при уровне значимости α проверить нулевую гипотезу Н0: генеральные дисперсии рассматриваемых совокупностей равны между собой D(X)=D(Y). Поскольку генеральные дисперсии неизвестны и известны исправленные дисперсии, т.е. их несмещенные оценки, то требуется сравнить математические ожидания исправленных выборочных дисперсий. Такая задача ставится потому, что исправленные дисперсии, как правило, оказываются различными. Возникает вопрос: исправленные дисперсии различаются незначимо или значимо (существенно).

Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие исправленных выборочных дисперсий незначимо и может быть объяснено случайными причинами, в том числе и случайным отбором объектов выборки. Если нулевая гипотеза отвергнута, т.е. генеральные дисперсии неодинаковы, то различие исправленных выборочных дисперсий и не может быть объяснено случайными причинами.

В качестве критерия проверки нулевой гипотезы о равенстве генеральных дисперсий примем отношение большей исправленной дисперсии к меньшей, т.е. случайную величину:

Случайная величина F при условии справедливости нулевой гипотезы имеет распределение Фишера-Снедекора со степенями свободы k1=n1-1 и k2=n2-1, где n1 и n2 – объемы выборок, по которым вычислены большая и меньшая дисперсия соответственно.

Критическая область строится в зависимости от конкурирующей гипотезы.

1. Конкурирующая гипотеза Н1: D(X)>D(Y).

В этом случае строят одностороннюю, а именно правостороннюю критическую область, исходя из требования, что вероятность попадания критерия F в эту область в предположении справедливости нулевой гипотезы равна принятому уровню значимости:

Критическая точка находится по таблице критических точек распределения Фишера-Снедекора, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы – неравенством .

Правило. Чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: D(X)=D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(X)>D(Y), необходимо вычислить отношение большей исправленной дисперсии к меньшей (наблюдаемое значение критерия):

,

затем по таблице критических точек распределения Фишера-Снедекора при заданном уровне значимости α и числам степеней свободы k1 и k2 найти критическую точку . Если – нет оснований отвергнуть нулевую гипотезу, если – нулевую гипотезу следует отвергнуть.

2. Конкурирующая гипотеза Н1: D(X)≠D(Y).

В этом случае строят двухстороннюю критическую область.

Правило. Чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: D(X)=D(Y) о равенстве генеральных дисперсий при конкурирующей гипотезе Н1: D(X) ≠D(Y), необходимо вычислить отношение большей исправленной дисперсии к меньшей (наблюдаемое значение критерия):

,

затем по таблице критических точек распределения Фишера-Снедекора при уровне значимости α/2 и числам степеней свободы k1 и k2 найти критическую точку . Если – нет оснований отвергнуть нулевую гипотезу, если – нулевую гипотезу следует отвергнуть.

Пример 9. Сотрудники различных подразделений УВД по N-ской области два раза в год сдают нормативы по служебной подготовке, причем в зимний и летний периоды перечень нормативов несколько отличается. Например, в зимний период сдают нормативы по лыжным гонкам, а летом – по бегу и плаванию и т.д.

Сформированы 2 контрольные группы сотрудников. Первую группу нормативов обе группы сдавали, готовясь по традиционной методике. Вторую группу нормативов группа №1 сдавала, готовясь по традиционной методике, группа №2 готовилась по новой методике. Результаты сдачи нормативов приведены в таблице, при этом одинаковые баллы по различным нормативам просто просуммированы.

Неравенство количества оценок в одной и той же группе по первой и второй группе нормативов объясняется тем, что во время сдачи нормативов некоторые сотрудники находились в служебных командировках, на больничном и т.д.

Результаты сдачи нормативов приведены в таблице 3:

 

 

Таблица 3

Оценка "5" "4" "3" "2"
Группа №1, первая группа нормативов
ni
Группа № 2, первая группа нормативов
ni
Группа №1, вторая группа нормативов
ni
Группа №2, вторая группа нормативов
ni
             

Необходимо выяснить, значимо или незначимо отличаются дисперсии средних оценок у групп сотрудников по первой и второй группе нормативов.

Решение. Найдем общее число оценок и относительные частоты каждой из оценок:

Таблица 4

Оценка "5" "4" "3" "2" Всего
Группа №1, первая группа нормативов
ni
pi 0,161 0,272 0,519 0,049  
Группа № 2, первая группа нормативов
ni
pi 0,144 0,289 0,478 0,089  
Группа №1, вторая группа нормативов
ni
pi 0,208 0,325 0,377 0,091  
Группа №2, вторая группа нормативов
ni
pi 0,185 0,467 0,326 0,022  
               

 

Найдем выборочные средние и дисперсии по каждой группе оценок.

Здесь и далее первый индекс соответствует номеру группы сотрудников, второй – номеру группы нормативов. ijн – неисправленные выборочные дисперсии, ij – исправленные выборочные дисперсии.

Выдвигаем нулевую гипотезу Н0: дисперсии средних оценок сдачи нормативов в зимний и летний периоды различаются незначимо. Конкурирующая гипотеза Н1: дисперсии различаются значимо, D(X1j)≠D(X2j).

Для проверки нулевой гипотезы воспользуемся критерием Фишера-Снедекора. Для этого найдем наблюдаемые значения переменной Fнабл и критические точки распределения Фишера-Снедекора Fкр при уровне значимости α=0,05.

1. Для группы №1, которая готовилась к сдаче нормативов по традиционной методике:

Поскольку , то нет оснований отвергать нулевую гипотезу. Дисперсии различаются незначимо. Погрешность определения средней оценки осталась на прежнем уровне.

2. Для группы №2, которая готовилась к сдаче нормативов по новой методике:

Поскольку , то нет оснований отвергать нулевую гипотезу. Дисперсии различаются незначимо. Погрешность определения средней оценки осталась на прежнем уровне.

Таким образом, погрешности определения средних оценок различаются незначимо и можно производить сравнение средних оценок.

Сравнение выборочных дисперсий часто предшествует задаче сравнения двух средних выборочных значений при неизвестных генеральных дисперсиях.. Этот случай характерен для малого объема выборок, когда получить хорошие оценки генеральных дисперсий невозможно. В то же время, априорно можно предположить, что неизвестные генеральные дисперсии равны между собой. Если же нет оснований считать дисперсии одинаковыми, можно проверить гипотезу о равенстве генеральных дисперсий, пользуясь критерием Фишера-Снедекора.

Итак, в предположении, что генеральные дисперсии одинаковы требуется проверить нулевую гипотезу Н0: M(X)=M(Y) о равенстве математических ожиданий генеральных совокупностей. Т.е. требуется установить значимо или незначимо различаются выборочные средние, найденные по независимым малым выборкам объемов m и n.

В качестве критерия проверки нулевой гипотезу примем случайную величину:

,

где и - выборочные средние, n и m – объемы выборок (количество оценок), и – исправленные дисперсии.

Известно, что величина Т при справедливости нулевой гипотезы имеет t-распределение Стьюдента с k=n+m-2 степенями свободы.

Как и ранее, критическая область строится в зависимости от вида конкурирующей гипотезы. Далее рассмотрим лишь случай, когда конкурирующая гипотеза Н1:M(X)≠M(Y) – математические ожидания генеральных совокупностей неодинаковы.

Правило. Чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: M(X)=M(Y) о равенстве математических ожиданий двух генеральных совокупностей с неизвестными, но равными генеральными дисперсиями, при конкурирующей гипотезе Н1=M(X)≠M(Y), необходимо вычислить наблюдаемое значение критерия:

и по таблице критических точек распределения Стьюдента (двухсторонняя область) по заданному уровню значимости и числу степеней свободы k=n+m-2 найти критическую точку .

Если – отвергнуть нулевую гипотезу нет оснований.

Если – отвергнуть нулевую гипотезу нет оснований.

Пример 10. По данным примера 9 установить, значимо или незначимо отличаются результаты сдачи нормативов по служебной подготовке у сотрудников, которые готовились по новой методике.

Решение. Эту задачу необходимо разделить на две подзадачи.

Во-первых, необходимо определить, значимо или незначимо влияет на результаты сдачи летний и зимний набор нормативов. Для этого необходимо сравнить средние оценки в зимний и летний период у группы сотрудников, которая готовилась по традиционной методике.

Наблюдаемое значение критерия для группы №1:

Критическое значение критерия .

Поскольку , то нет оснований отвергнуть нулевую гипотезу – выборочные средние оценки различаются незначимо. Таким образом, летний и зимний набор нормативов незначимо влияет на результаты сдачи.

Во-вторых, необходимо определить, значимо или незначимо влияет на результаты сдачи нормативов новая методика подготовки. Напомним, что к первой сдаче нормативов группа №2 готовилась по традиционной методике, а к второй сдаче нормативов – по новой методике. При этом выше было установлено, что различие в наборе нормативов на результаты сдачи влияет незначимо.

Наблюдаемое значение критерия для группы №2:

Критическое значение критерия .

Поскольку , то нулевую гипотезу следует отвергнуть – выборочные средние оценки различаются значимо.

Таким образом, новая методика значимо влияет на результаты сдачи нормативов по служебной подготовке, причем это положительное влияние – средний балл увеличился с 3,489 до 3,815.