Проверка статистических гипотез

С теорией статистического оценивания параметров тесно связана проверка статистических гипотез. Она используется в том случае, когда необходим обоснованный вывод о преимуществах того или иного способа вложения инвестиций, об уровне доходности ценных бумаг, об эффективности лекарственных препаратов, о значимости построенной математической модели и т.д.

При изучении многих статистических данных необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен и есть основания предположить, что он имеет определенный вид (например, А), то выдвигают гипотезу: генеральная совокупность распределена по закону А. В данной гипотезе речь идет о виде предполагаемого распределения.

Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр равен определенному значению , то выдвигают гипотезу: . Здесь речь идет о предполагаемой величине параметра одного известного распределения. Возможны гипотезы о равенстве параметров

двух или нескольких распределений, о независимости выборок и др.

Все выводы, которые делаются в МС, вообще говоря, являются гипотезами, т.е. предположениями о неизвестных параметрах известных распределений, об общем виде неизвестного теоретического распределения или функции распределения изучаемой СВ. Такие гипотезы называют статистическими гипотезами.

Различают простые и сложные, параметрические и непараметрическиестатистические гипотезы.

Статистическая гипотеза называется простой, если она однозначно определяет закон распределения СВ. Сложной называют гипотезу, состоящую из конечного или бесконечного числа простых гипотез. Например, гипотезы «вероятность появления события A в схеме Бернулли равна », «закон распределения СВ – нормальный с параметрами, » являются простыми в отличие от сложных гипотез: «вероятность появления события A в схеме Бернулли заключена между и », «закон распределения СВ не является нормальным». Гипотеза называется параметрической, если в ней содержится некоторое условие о значении параметра известного распределения. Гипотезу, в которой сформулированы предположения относительно вида распределения, называют непараметрической.

Если исследовать всю генеральную совокупность, то, естественно, можно было бы наиболее точно установить справедливость выдвигаемой гипотезы. Однако такое исследование не всегда возможно, и суждение об истинности статистических гипотез проверяется на основании выборки.

Выдвигаемую (проверяемую) гипотезу называют основной или нулевой гипотезой . Если, например, по полигону или гистограмме частот, построенным по некоторой выборке, можно предположить, что СВ распределена по нормальному закону, то может быть выдвинута гипотеза . Одновременно с гипотезой выдвигается альтернативная (конкурирующая) гипотеза . Если гипотеза будет отвергнута, то имеет место конкурирующая ей гипотеза.

Конкурирующей (альтернативной) называют гипотезу , являющуюся логическим отрицанием . Нулевая и альтернативнаягипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез. Например, если, то альтернативная гипотеза может иметь вид , или .

Выдвинутая гипотеза может быть правильной или неправильной, в связи, с чем возникает необходимость ее проверки. Поскольку проверку осуществляют статистическими методами, ее называют статистической. В результате статистической проверки гипотезы неправильное решение может быть принято в двух случаях: с одной стороны, на основании результатов опыта можно отвергнуть правильную гипотезу; с другой – можно принять неверную гипотезу. Очевидно, последствия этих ошибок могут оказаться различными.

Отметим, что правильное решение может быть принято также в двух случаях:

1) гипотеза принимается, и она в действительности является правильной;

2) гипотеза отвергается, и она в действительности не верна.

По полученным значениям статистики основная гипотеза принимается или отклоняется.

При этом так как выборка носит случайный характер, могут быть допущены два вида ошибок:

– может быть отвергнута правильная гипотеза, в этом случае допускается ошибка первого рода,

– может быть принята неверная гипотеза, тогда допускается ошибка второго рода (см. схему).

Вероятность совершить ошибку I рода, т.е. отвергнуть гипотезу , когда она верна, называется уровнем значимости критерия.

Обычно принимают . Смысл при в 5 случаях из 100 имеется риск допустить ошибку I рода, т.е. отвергнуть правильную гипотезу. Вероятность допустить ошибку II рода, т.е. принять гипотезу , когда она неверна, обозначают .

Вероятность не допустить ошибку II рода, т.е. отвергнуть гипотезу , когда она ошибочна, называется мощностью критерия.

Используя терминологию статистического контроля качества продукции можно сказать, что вероятность представляет «риск поставщика» (или «риск производителя»), связанный с вероятностью признать негодной по результатам выборочного контроля всю партию годных изделий, удовлетворяющих стандарту, а вероятность – «риск потребителя», связанный с вероятностью принять по анализу выборки негодную партию, не удовлетворяющую стандарту. В некоторых прикладных исследованиях ошибка I рода означает вероятность того, что сигнал, предназначенный наблюдателю, не будет принят, а ошибка II рода – вероятность того, что наблюдатель примет ложный сигнал.

Для проверки справедливости нулевой гипотезы используют специально подобранную СВ , точное или приближенное распределение которой известно. Эту СВ , которая служит для проверки нулевой гипотезы, называют статистическим критерием (или просто критерием).

Для проверки статистической гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и получают частное (наблюдаемое) значение критерия .

После выбора определенного статистического критерия для решения вопроса о принятии или непринятии гипотезы множество его возможных значений разбивают на два непересекающихся подмножества, одно из которых называется областью принятия гипотезы (или областью допустимых значений критерия), а второе – критической областью.

Критической областьюназывается совокупность значений статистического критерия K, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы(областью допустимых значений критерия) называется совокупность значений статистического критерия , при которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез.Если наблюдаемое значение статистического критерия принадлежит критической области, то основная гипотеза отвергается в пользу альтернативной; если оно принадлежит области принятия гипотезы, то гипотезу принимают.

Поскольку статистический критерий K – одномерная СВ, то все ее возможные значения принадлежат некоторому интервалу. Следовательно, и критическая область, и область принятия гипотезы – также интервалы. Тогда должны существовать точки, их разделяющие.

Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.

Вероятности оценок I и II рода (и ) однозначно определяются выбором критической области. Естественным является желание сделать и сколь угодно малыми. Однако эти требования являются противоречивыми, ибо при фиксированном объеме выборки можно сделать сколь угодно малой лишь одну из величин – или , что сопряжено с неизбежным увеличением другой.

Одновременное уменьшение вероятностей и возможно лишь при увеличении объема выборки. При разработке статистических критериев необходимо уменьшать как ошибку I рода, так и ошибку II рода.

Поскольку одновременное уменьшение ошибок I и II рода невозможно, то при нахождении критических областей для данной статистики уровень значимости задают, стараясь подобрать такой критерий, чтобы вероятность ошибки II рода была наименьшей.

Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством , где .

Левосторонней называют критическую область, определяемую неравенством , где .

Двусторонней называют критическую область, определяемую неравенствами , , где .

Если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами , , где или, что равносильно, .

Как найти критическую область? Пусть – статистический критерий, выбранный для проверки нулевой гипотезы , – некоторое число, . Найдем правостороннюю критическую область, определяемую неравенством , где . Для ее отыскания достаточно найти критическую точку . Рассмотрим вероятность в предположении, что гипотеза верна. Очевидно, что с ростом вероятность уменьшается. Тогда можно выбрать настолько большим, что вероятность станет ничтожно малой. Другими словами, при заданном уровне значимости можно определить критическое значение из неравенства .

Критическую точку ищут из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий K примет значение, большее , была равна принятому уровню значимости : . (1)

Для каждого из известных статистических критериев (нормального, Стьюдента, критерия Пирсона , Фишера-Снедекора, Кочрена и др.) имеются соответствующие таблицы, по которым находят , удовлетворяющее этим требованиям. После нахождения по данным выборок вычисляют наблюдаемое значение критерия K.

Если окажется, что , (т.е. реализовалось маловероятное событие), то нулевая гипотеза отвергается. Следовательно, принимается конкурирующая гипотеза . Если же , то в этом случае нет оснований отвергнуть выдвинутую гипотезу . Следовательно, гипотеза принимается. Другими словами, выдвинутая статистическая гипотеза согласуется с результатами эксперимента (выборочными данными).

Левосторонняя критическая область определяется неравенством , где . Критическую точку находят из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий K примет значение, меньшее , была равна принятому уровню значимости : . (2)

Двусторонняя критическая область определяется неравенствами , , где .

Критические точки находят из требования, чтобы при условии справедливости нулевой гипотезы сумма вероятностей того, что критерий ,K примет значение, меньшее или большее , была равна принятому уровню значимости : . (3)

Если распределение критерия симметрично относительно нуля, и для увеличения его мощности выбрать симметричные относительно нуля точки и , то , и из следует . (4)

Это соотношение и служит для отыскания критических точек двусторонней критической области.

Отметим, что принцип проверки статистической гипотезы не дает логического доказательства ее верности или неверности. Принятие гипотезы следует расценивать не как раз и навсегда установленный, абсолютно верный содержащийся в ней факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

Если проверка статистических гипотез основана на предположении об известном законе распределения генеральной совокупности, из которого следует определенное распределение критерия, то критерии проверки таких гипотез называют параметрическими критериями. Если закон распределения генеральной совокупности неизвестен, то соответствующие критерии называются непараметрическими. Понятно, что непараметрические критерии обладают значительно меньшей мощностью, чем параметрические. Отсюда следует, что для сохранения той же мощности при использовании непараметрического критерия по сравнению с параметрическим необходимо иметь значительно больший объем наблюдений.

Наиболее распространенным критерием проверки статистических гипотез о виде распределения генеральной совокупности (т.е. непараметрическим критерием) является критерий Пирсона .