Сравнение двух групп: критерий Стьюдента
Лекция № 5
1 Принцип метода (критерий Стьюдента)
2 Обобщение критерия Стьюдента для различных выборок.
3 Примеры.
1 Принцип метода (критерий Стьюдента). Дисперсионный анализ позволяет проверить значимость различий нескольких групп. Нередко нужно сравнить только две группы. В этом случае можно применить критерий Стьюдента, который является частным случаем дисперсионного анализа.
Вспомним, что точность выборочной оценки среднего характеризуется стандартной ошибкой среднего
,
где п — объем выборки, а σ — стандартное отклонение совокупности, из которой извлечена выборка.
С увеличением объема выборки стандартная ошибка среднего уменьшается, следовательно уменьшается и неопределенность в оценке выборочных средних. Поэтому уменьшается и неопределенность в оценке их разности.
Чтобы формализовать приведенные рассуждения, рассмотрим отношение:
Для двух случайных выборок, извлеченных из одной нормально распределенной совокупности, это отношение, как правило, будет близко к нулю. Чем меньше (по абсолютной величине) t, тем больше вероятность нулевой гипотезы. Чем больше t, тем больше оснований отвергнуть нулевую гипотезу и считать, что различия статистически значимы.
Для нахождения величины t нужно знать разность выборочных средних и ее ошибку. Вычислить разность выборочных средних нетрудно – просто вычтем из одного среднего другое. Сложнее найти ошибку разности. Для этого обратимся к более общей задаче нахождения стандартного отклонения разности двух чисел, случайным образом извлеченных из одной совокупности.
Можно доказать, что дисперсия разности (суммы) двух случайно извлеченных значений равна сумме дисперсий совокупностей, из которых они извлечены.
В частности, если извлекать значения из одной совокупности, то дисперсия их разности будет равна удвоенной дисперсии этой совокупности. Говоря формально, если значение Х извлечено из совокупности, имеющей дисперсию , а значение Y из совокупности, имеющей дисперсию
, то распределение всех возможных значений X-Y имеет дисперсию
.
Почему дисперсия разностей больше дисперсии совокупности, легко понять: в половине случаев члены пары лежат по разные стороны от среднего, поэтому их разность еще больше отклоняется от среднего, чем они сами.
Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным, нужно в приведенной выше формуле заменить дисперсии их выборочными оценками:
Этой формулой можно воспользоваться и для оценки стандартной ошибки разности выборочных средних. В самом деле, стандартная ошибка выборочного среднего — это стандартное отклонение совокупности средних значений всех выборок объемом n. Поэтому
Тем самым, искомая стандартная ошибка разности средних
.
Теперь мы можем вычислить отношение t (критическое значение t).
Напомним, что мы рассматриваем отношение
Воспользовавшись результатом предыдущего раздела, имеем
.
Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулы:
где п — объем выборки.
Если обе выборки извлечены из одной совокупности, то выборочные дисперсии и
– это оценки одной и той же дисперсии σ2. Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как
.
Значение t, полученное на основе объединенной оценки:
.
Если объем выборок одинаков, оба способа вычисления t дадут одинаковый результат. Однако если объем выборок разный, то это не так.
Теперь посмотрим, какие значения t мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности.
Так как выборочные средние обычно близки к среднему по совокупности, значение t будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения t. Чтобы понять, какую величину t следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент.
На рис. 1А приведено распределение значений t, вычисленных по 200 парам выборок. По нему уже можно судить о распределении t. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю; значения, меньшие -2 и большие +2, встречаются редко.
На рис. 1Б видно, что в 10 случаях из 200 (в 5% всех случаев) t меньше -2,1 или больше +2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение t лежит вне интервала от -2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 1В. Теперь 5% крайних значений соответствуют закрашенным областям графика левее -2,1 и, правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятность получить значение t, большее +2,1 или меньшее -2,1, составляет всего 5%. Следовательно, если значение t находится вне интервала от -2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми.
Рисунок 1
А. Из некоторой совокупности извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1, составляет 5%. В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно, «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем находить различия там, где их нет. Чтобы снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от общей площади под кривой, критическое значение должно составлять 2,878.
Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при t < -2,1, так и при t > +2,1. Этот вариант критерия Стьюдента называется двусторонним; именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем, говоря о критерии Стьюдента, мы будем иметь в виду двусторонний вариант.
Если значение t меньше -2,1 или больше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вывод о существовании различий мы будем делать в 5% случаев.
Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а, скажем, 0,01. Однако, во-первых, ошибочные выводы о существовании различий все же не исключены, просто их вероятность снизилась до 1%, и, во-вторых, вероятность не найти различий там, где они есть, теперь повысилась.
Критические значения t (подобно критическим значениям F, они сведены в таблицу) зависят не только от уровня значимости, но и от числа степеней свободы v. Если объем обеих выборок — n, то число степеней свободы для критерия Стьюдента равно 2 (n - 1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно – чем больше выборка, тем менее выборочные оценки зависят от случайных отклонений и тем точнее представляют исходную совокупность
2 Обобщение критерия Стьюдента для различных выборок.Критерий Стьюдента легко обобщается на случай, когда выборки содержат неодинаковое число членов. Напомним, что по определению
,
где и
– стандартные ошибки средних для двух выборок. Если объем первой выборки равен и n1, а объем второй – n2, то
и
,
где s1 и s2 – стандартные отклонения выборок. Перепишем определение t, используя выборочные стандартные отклонения:
Объединенная оценка дисперсии для выборок объема n1 и n2 равна
Тогда
Это определение t для выборок произвольного объема. Число степеней свободы ν=n1+n2–2.
Заметим, что если объемы выборок равны, то есть n1 = n2 = n, то мы получим ранее использовавшуюся формулу для t.
3 Примеры.При испытании двух типов фильтров для очистки воздуха в объемах пх = пy = 50 штук получено среднее значение чистоты воздуха х = 92%, у = 96%. Проверить, является ли расхождение значений х и у случайными, если известны D(x)= 0,09%; D(у) = 0,04%.
Решение. Выдвигаем гипотезу Hо: М(х) = М(у). Определяем статистику При уровне значимости α= 0,05, находим:
По таблице находим критическое значение tкр = 1,96.
Сравниваем t = 8 > tкр = 1,96. Следовательно, гипотеза H0 отвергается, так как имеются качественные различия между двумя типами фильтров.
ВОПРОСЫ И ЗАДАНИЯ
1 В каких случаях применяется критерий Стьюдента.
2 Как соотносится дисперсия разности (суммы) двух случайно извлеченных значений с дисперсиями совокупностей, из которых они извлечены.