Принципы построения статистических группировок


Приемы проведения статистических группировок весьма разнообразны и зависят от задач, которые в соответствии с целью исследования ставятся перед группировками. Однако, построение группировки почти всегда начинается с определения состава группировочных признаков. Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. В каждом конкретном исследовании включение признака в состав группировочных должно быть теоретически обосновано.

После определения основания группировки решается вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.

Следует учесть, что с одной стороны большое количество групп, более полно описывает характер исследуемого объекта. С другой стороны большое количество групп затрудняет выявление закономерности при исследовании социально-экономических явлений. Поэтому эта проблема решается в каждом конкретном случае (учитывая, особенности объекта и цели исследования).

Существуют стандартные процедуры, с помощью которых определяются число групп:

1) определение числа групп с использованием формулы Стерджесса (применение формулы даёт хорошие результаты, если совокупность состоит из большого числа единиц):

 

(3.1)

где n-число групп; N-число единиц совокупности.

2) определение числа групп на основе применения показателя среднего арифметического отклонения (s). Если величина интервала равна 0,5s, то совокупность разбивается на 12 групп, когда величина равна 2/3s и s, то совокупность делится соответственно на 6 и 9 групп.

После определения числа групп следует определить интервалы группировки.

Интервал-это значение варьирующего признака, лежащее в определенных границах. Интервал очерчивает количественные границы групп.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы в зависимости от их величины бывают:

равные, когда разность между max и min значениями в каждом из интервалов одинакова. Величина равного интервала определяется по формуле:

 

(3.2)

где h- величина равного интервала (шаг интервала);

R=Xmax-Xmin - размах вариации; n-число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значение, а значение несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют, и она будет являться шагом интервала.

Группировку с равными интервалами применяют, когда вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер.

Группировку с неравными интервалами применяют в том случае, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно.

В зависимости от ограниченности различают интервалы:

открытые, когда указана только одна граница (верхняя или нижняя);

закрытыми, когда обозначены обе границы.