Полигон и гистограмма
Эмпирическая функция распределения
Статистическое распределение выборки
Тема 4. Выборочный метод
Пусть для изучения количественного (дискретного или непрерывного) признака X из генеральной совокупности извлечена выборка х1, х2, ..., хk объема n. Наблюдавшиеся значения хi признака X называют вариантами, а последовательность вариант, записанных в возрастающем порядке, − вариационным рядом.
Статистическим распределением выборки называют перечень вариант хi вариационного ряда и соответствующих им частот ni (сумма всех частот равна объему выборки n) или относительных частот wi (сумма всех относительных частот равна единице).
Статистическое распределение выборки можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты интервала принимают сумму частот вариант, попавших в этот интервал).
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события X < х:
F*(x) = nx /n,
где nx − число вариант, меньших х; n − объем выборки.
Эмпирическая функция обладает следующими свойствами.
Свойство 1. Значения эмпирической функции принадлежат отрезку [0; 1].
Свойство 2. F*(х) − неубывающая функция.
Свойство 3. Если xi − наименьшая варианта, а хk − наибольшая, то F*(x) = 0 при х ≤ x1 и F*(x) = l при х > xk.
А. Дискретное распределение признака X. Полигоном частот называют ломаную, отрезки которой соединяют точки (x1, n1), (х2, n2), .... (хk, nk), где xi − варианты выборки и ni − соответствующие им частоты.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x1; w1), (x2; w2), ..., (xk; wk), где xi − варианты выборки и wi − соответствующие им относительные частоты.
Б. Непрерывное распределение признака X. При непрерывном распределении признака весь интервал, в котором заключены все наблюдаемые значения признака, разбивают на ряд частичных интервалов длины h и находят ni − сумму частот вариант, попавших в i-й интервал. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению ni / h (плотность частоты). Площадь частичного i-го прямоугольника равна h×(ni / h) = ni − сумме частот вариант, попавших в i-й интервал. Площадь гистограммы частот равна сумме всех частот, т. е. объему выборки n.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению wi / h (плотность относительной частоты). Площадь частичного i-гo прямоугольника равна h×(wi / h) = wi − относительной частоте вариант, попавших в i-й интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т. е. единице.