Интервальное статистическое распределение

 

Если признак может принимать любые значения из некоторого промежутка, т.е. является непрерывной случайной величиной, то необходимо промежуток между наименьшим и наибольшим значениями признака в выборке разбить на несколько интервалов одинаковой (или разной) длины. При этом количество интервалов k не должно быть меньше 6 – 10 и больше 20 – 25 (выбор числа интервалов зависит от объема выборки n).

При подборе количества интервалов можно пользоваться приближенной формулой, которую предложил американский статистик Sturgess (Стерджесс):

– целая часть числа х.

Затем определяем длину частичного интервала группировки:

, где R = – размах выборки.

Находим границы каждого из непересекающихся частичных интервалов :

a1 = xmin; b1 = a1 + h;

a2 = b1; b2 = a2 + h и т.д.

 

Далее каждому интервалу требуется поставить в соответствие число выборочных значений признака, попавших в этот интервал. В результате получим интервальное статистическое распределение:

 

Таблица 3.3

Интервалы [a1; b1) [a2; b2) [a3; b3) ... [ak; bk)
Частоты m1 m2 m3 ... mk

 

Используя интервальное статистическое распределение, можно вычислить относительную частоту, накопленную частоту, эмпирическую функцию распределения, так же как и для дискретного статистического распределения.

Если в интервальном распределении каждый интервал заменить числом, лежащим в его середине (ai + bi)/2, то получим дискретное статистическое распределение. Такая замена вполне естественна, так как, например, при измерении размера детали с точностью до одного миллиметра, всем размерам из промежутка [49,5 мм; 50,5 мм) будет соответствовать одно число, равное 50.

Для графического изображения интервального распределения используется гистограмма. Для ее построения в прямоугольной системе координат по оси абсцисс откладываем границы интервалов группировки и на этих интервалах как на основаниях строим прямоугольники, высоты которых откладываются на оси ординат. Различают:

а) гистограмму абсолютных частот, когда высота прямоугольника равна ;

б) гистограмму относительных частот, когда высота прямоугольника равна .

Гистограмма является выборочным аналогом графика плотности вероятности. Площадь на интервале (aj; am) можно интерпретировать как приближенное значение вероятности попадания случайной величины Х в этот интервал, т.е. .

Основное свойство гистограммы: ее площадь для абсолютных частот равна n, а для относительных частот равна единице.

Отношение относительной частоты к длине частичного интервала h называют плотностью распределения частоты на интервале (рис. 3.5).

 

Рис. 3.5. Гистограмма относительных частот

 

При построении графика эмпирической функции распределения для интервального ряда необходимо учитывать, что функция определена только на концах интервалов.

Таким образом, статистическое распределение выборки можно рассматривать как статистический аналог для распределения генеральной совокупности. Из-за случайных колебаний эти два распределения, как правило, не будут совпадать, но можно ожидать, что при большом объеме выборки ее распределение будет служить приближением для генеральной совокупности, т.е. , если .

Пример 2. Получены данные о выработке продукции 30-ю рабочими в отчетном месяце в процентах к предыдущему месяцу

 

n Х – выработка продукции, %
1-10
11-20
21-30
                       

 

Необходимо:

1) составить интервальное статистическое распределение;

2) построить гистограмму относительных частот.