Структурные (порядковые) характеристики.
Квантили– порядковые характеристики, т.е. значения признака занимающие определенное место в ранжированной совокупности.
Определение. Квантилем Qp порядка р, 0 < p <1, называется такое значение признака в упорядоченной совокупности, которое делит ее в отношении р:(1-р). Если совокупность объема n, то n1 = np, n2 = n(1-p), n = n1 + n2.
К числу наиболее часто применяемых квантилей относятся:
1. медиана (р=1/2), т.е. делит упорядоченную выборку на 2 равные части;
2. квартиль (р=1/4), т.е. делит упорядоченную выборку на 4 равные части;
3. квинтель (р=1/5), т.е. делит упорядоченную выборку на 5 равных частей;
4. децили (декатили) (р=1/10);
5. процентили (персентили, перцентили) (р=1/100).
Если имеется дискретная выборка значений Х = {x1, .., xn}, то их сначала надо упорядочить по возрастанию: x*1,..., x*n. Далее медиану находят по формуле:
Ме =
Если рассматривается ИВР, то сначала находится интервал, содержащий медиану, а затем применяют формулу
или
,
где n – объем выборки; h – длина интервала ВР;
хМе – левая (нижняя) граница медианного интервала;
– накопленная относительная частота интервала, предшествующего медианному;
– относительная частота медианного интервала.
В случае ИВР аналогичным образом можно записать формулу для вычисления квантиля порядка р.
или
,
где n – объем выборки; h – длина интервала ВР;
хQp – левая (нижняя) граница квантильного интервала, порядка р;
– относительная частота квантильного интервала;
– накопленная относительная частота интервала, предшествующего квантильному.
Определение. Мода (Мо) – это значение признака, встречающееся в рассматриваемой совокупности наиболее часто.
Для дискретного ряда мода находится по определению и соответствует варианте с наибольшей частотой.
При определении моды обычно применяют следующие соглашения:
– Если все значения ВР имеют одинаковую частоту, то говорят, что этот ряд не имеет моды.
– Если две соседние варианты имеют одинаковую доминирующую частоту, то мода вычисляется как среднее арифметическое этих вариант.
– Если две несоседние варианты имеют одинаковую доминирующую частоту, то такой ВР называют бимодальным.
– Если таких вариант больше двух, то ВР называют полимодальным.
Для вычисления моды интервального вариационного ряда сначала необходимо найти модальный интервал. Если рассматривается ИВР с равными интервалами, то модальный интервал определяется по наибольшей частоте. Далее мода вычисляется по формуле:
, (6)
n – объем выборки; h – длина интервала ВР;
хМо – левая (нижняя) граница модального интервала,
wМо – относительная частота модального интервала,
wМо-1 – относительная частота интервала, предшествующего модальному.
wМо+1 – относительная частота интервала, следующего за модальным.
Заметим, что в определении (6) вместо относительных частот можно использовать абсолютные:
.