Сравнение двух групп: критерий Стьюдента

Лекция № 5

 

1 Принцип метода (критерий Стьюдента)

2 Обобщение критерия Стьюдента для различных выборок.

3 Примеры.

1 Принцип метода (критерий Стьюдента). Дисперсионный ана­лиз позволяет проверить значимость различий нескольких групп. Нередко нужно срав­нить только две группы. В этом случае можно применить крите­рий Стьюдента, который является частным случаем дисперсионного анализа.

Вспомним, что точность выборочной оценки среднего харак­теризуется стандартной ошибкой среднего

,

где п — объем выборки, а σ — стандартное отклонение совокуп­ности, из которой извлечена выборка.

С увеличением объема выборки стандартная ошибка средне­го уменьшается, следовательно уменьшается и неопределенность в оценке выборочных средних. Поэтому уменьшается и неопре­деленность в оценке их разности.

Чтобы формализовать приведенные рассуждения, рассмот­рим отношение:

 

 

Для двух случайных выборок, извлеченных из одной нор­мально распределенной совокупности, это отношение, как пра­вило, будет близко к нулю. Чем меньше (по абсолютной ве­личине) t, тем больше вероятность нулевой гипотезы. Чем боль­ше t, тем больше оснований отвергнуть нулевую гипотезу и счи­тать, что различия статистически значимы.

Для нахождения величины t нужно знать разность выбороч­ных средних и ее ошибку. Вычислить разность выборочных сред­них нетрудно – просто вычтем из одного среднего другое. Слож­нее найти ошибку разности. Для этого обратимся к более общей задаче нахождения стандартного отклонения разности двух чи­сел, случайным образом извлеченных из одной совокупности.

Можно доказать, что дисперсия разности (суммы) двух случайно из­влеченных значений равна сумме дисперсий совокупностей, из кото­рых они извлечены.

В частности, если извлекать значения из одной совокупности, то дисперсия их разности будет равна удвоенной дисперсии этой совокупности. Говоря формально, если значение Х извле­чено из совокупности, имеющей дисперсию , а значение Y из совокупности, имеющей дисперсию , то распределение всех возможных значений X-Y имеет дисперсию

.

Почему дисперсия разностей больше дисперсии совокупности, легко понять: в половине случаев члены пары лежат по разные стороны от среднего, поэтому их раз­ность еще больше отклоняется от среднего, чем они сами.

Чтобы оценить дисперсию разности членов двух совокупно­стей по выборочным данным, нужно в приведенной выше фор­муле заменить дисперсии их выборочными оценками:

Этой формулой можно воспользоваться и для оценки стан­дартной ошибки разности выборочных средних. В самом деле, стандартная ошибка выборочного среднего — это стандартное от­клонение совокупности средних значений всех выборок объемом n. Поэтому

Тем самым, искомая стандартная ошибка разности средних

.

Теперь мы можем вычислить отношение t (критическое значение t).

Напомним, что мы рассматриваем отношение

 

 

Воспользовавшись результатом предыдущего раздела, имеем

.

Если ошибку среднего выразить через выборочное стандарт­ное отклонение, получим другую запись этой формулы:

где п — объем выборки.

Если обе выборки извлечены из одной совокупности, то вы­борочные дисперсии и – это оценки одной и той же дис­персии σ2. Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как

.

Значение t, полученное на основе объединенной оценки:

.

Если объем выборок одинаков, оба способа вычисления t да­дут одинаковый результат. Однако если объем выборок разный, то это не так.

Теперь посмотрим, какие значения t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.

Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения t. Чтобы по­нять, какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный экс­перимент.

На рис. 1А приведено распределение значений t, вычисленных по 200 па­рам выборок. По нему уже можно судить о распределении t. Оно симметрично относительно нуля, поскольку любую из пары вы­борок можно счесть «первой». Как мы и предполагали, чаще все­го значения t близки к нулю; значения, меньшие -2 и большие +2, встречаются редко.

На рис. 1Б видно, что в 10 случаях из 200 (в 5% всех случаев) t меньше -2,1 или больше +2,1. Иначе говоря, если обе выборки из­влечены из одной совокупности, вероятность того, что значение t лежит вне интервала от -2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение прини­мает форму гладкой кривой, показанной на рис. 1В. Теперь 5% крайних значений соответствуют закрашенным областям гра­фика левее -2,1 и, правее +2,1. Итак, мы нашли, что если две вы­борки извлечены из одной и той же совокупности, то вероят­ность получить значение t, большее +2,1 или меньшее -2,1, со­ставляет всего 5%. Следовательно, если значение t находится вне интервала от -2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми.

Рисунок 1

А. Из некоторой совокупности извлекли 200 пар случай­ных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Большая часть значений сгруппирована вокруг нуля, однако некото­рые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1, составляет 5%. В. Про­должая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихо­ванные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно, «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем на­ходить различия там, где их нет. Чтобы снизить вероятность ошибочного за­ключения, мы можем выбрать более высокое критическое значение. Напри­мер, чтобы площадь заштрихованной области составляла 1% от общей площа­ди под кривой, критическое значение должно составлять 2,878.

Обратите внимание, что таким образом мы выявляем отли­чия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нуле­вую гипотезу как при t < -2,1, так и при t > +2,1. Этот вариант кри­терия Стьюдента называется двусторонним; именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем, го­воря о критерии Стьюдента, мы будем иметь в виду двусторон­ний вариант.

Если значение t меньше -2,1 или боль­ше +2,1, то при уровне значимости 0,05 мы сочтем различия ста­тистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вы­вод о существовании различий мы будем делать в 5% случаев.

Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а, скажем, 0,01. Однако, во-первых, ошибочные выводы о существовании различий все же не исключены, просто их вероятность снизилась до 1%, и, во-вторых, вероятность не найти различий там, где они есть, те­перь повысилась.

Критические значения t (подобно критическим значениям F, они сведены в таблицу) зависят не только от уровня значимо­сти, но и от числа степеней свободы v. Если объем обеих выборок — n, то число степеней свободы для критерия Стьюдента рав­но 2 (n - 1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно – чем больше выборка, тем менее вы­борочные оценки зависят от случайных отклонений и тем точнее представляют исходную совокупность

 

2 Обобщение критерия Стьюдента для различных выборок.Критерий Стьюдента легко обобщается на случай, когда выборки содержат неодинаковое число членов. Напомним, что по оп­ределению

,

где и – стандартные ошибки средних для двух выборок. Если объем первой выборки равен и n1, а объем второй – n2, то

и ,

где s1 и s2 – стандартные отклонения выборок. Перепишем оп­ределение t, используя выборочные стандартные отклонения:

Объединенная оценка дисперсии для выборок объема n1 и n2 равна

Тогда

Это определение t для выборок произвольного объема. Число степеней свободы ν=n1+n2–2.

Заметим, что если объемы выборок равны, то есть n1 = n2 = n, то мы получим ранее использовавшуюся формулу для t.

3 Примеры.При испытании двух типов фильтров для очистки воздуха в объемах пх = пy = 50 штук получено среднее значение чистоты воздуха х = 92%, у = 96%. Проверить, является ли рас­хождение значений х и у случайными, если известны D(x)= 0,09%; D(у) = 0,04%.

Решение. Выдвигаем гипотезу Hо: М(х) = М(у). Определяем статистику При уровне значимости α= 0,05, находим:

 

 

По таблице находим критическое значение tкр = 1,96.

Сравниваем t = 8 > tкр = 1,96. Следовательно, гипотеза H0 от­вергается, так как имеются качественные различия между двумя типами фильтров.

 

ВОПРОСЫ И ЗАДАНИЯ

 

1 В каких случаях применяется критерий Стьюдента.

2 Как соотносится дисперсия разности (суммы) двух случайно из­влеченных значений с дисперсиями совокупностей, из кото­рых они извлечены.