Структурные (порядковые) характеристики.


Квантили– порядковые характеристики, т.е. значения признака занимающие определенное место в ранжированной совокупности.

Определение. Квантилем Qp порядка р, 0 < p <1, называется такое значение признака в упорядоченной совокупности, которое делит ее в отношении р:(1-р). Если совокупность объема n, то n1 = np, n2 = n(1-p), n = n1 + n2.

К числу наиболее часто применяемых квантилей относятся:

1. медиана (р=1/2), т.е. делит упорядоченную выборку на 2 равные части;

2. квартиль (р=1/4), т.е. делит упорядоченную выборку на 4 равные части;

3. квинтель (р=1/5), т.е. делит упорядоченную выборку на 5 равных частей;

4. децили (декатили) (р=1/10);

5. процентили (персентили, перцентили) (р=1/100).

 

Если имеется дискретная выборка значений Х = {x1, .., xn}, то их сначала надо упорядочить по возрастанию: x*1,..., x*n. Далее медиану находят по формуле:

Ме =

Если рассматривается ИВР, то сначала находится интервал, содержащий медиану, а затем применяют формулу

или ,

где n – объем выборки; h – длина интервала ВР;

хМе – левая (нижняя) граница медианного интервала;

– накопленная относительная частота интервала, предшествующего медианному;

– относительная частота медианного интервала.

В случае ИВР аналогичным образом можно записать формулу для вычисления квантиля порядка р.

или ,

где n – объем выборки; h – длина интервала ВР;

хQp – левая (нижняя) граница квантильного интервала, порядка р;

– относительная частота квантильного интервала;

– накопленная относительная частота интервала, предшествующего квантильному.

 

Определение. Мода (Мо) – это значение признака, встречающееся в рассматриваемой совокупности наиболее часто.

Для дискретного ряда мода находится по определению и соответствует варианте с наибольшей частотой.

При определении моды обычно применяют следующие соглашения:

– Если все значения ВР имеют одинаковую частоту, то говорят, что этот ряд не имеет моды.

– Если две соседние варианты имеют одинаковую доминирующую частоту, то мода вычисляется как среднее арифметическое этих вариант.

– Если две несоседние варианты имеют одинаковую доминирующую частоту, то такой ВР называют бимодальным.

– Если таких вариант больше двух, то ВР называют полимодальным.

 

Для вычисления моды интервального вариационного ряда сначала необходимо найти модальный интервал. Если рассматривается ИВР с равными интервалами, то модальный интервал определяется по наибольшей частоте. Далее мода вычисляется по формуле:

, (6)

n – объем выборки; h – длина интервала ВР;

хМо – левая (нижняя) граница модального интервала,

wМо – относительная частота модального интервала,

wМо-1 – относительная частота интервала, предшествующего модальному.

wМо+1 – относительная частота интервала, следующего за модальным.

Заметим, что в определении (6) вместо относительных частот можно использовать абсолютные:

.