Постановка задачи

Формирование и свойства эмпирических совокупностей

Лекция 4

 

 

Результаты наблюдения над лесными объектами обычно фиксируются в журналах, бланках, анкетах и других документах учета или заносятся непосредственно в соответствующие файлы портативных компьютеров. Зафиксированные сведения об изучаемом объекте представляют первичный фактический материал, который нуждается в соответствующей обработке с целью исследования генеральной совокупности.

На практике мы дело только с выборочной совокупностью (выборкой), т.е. частью генеральной совокупности, поэтому возникает потребность по результатам сравнительно небольшой выборки сделать предположение о состоянии всей генеральной совокупности.

Иногда требуется сопоставить одну совокупность величин другой совокупности и выяснить, имеется ли между ними какие-либо различия или взаимосвязь.

Для того, чтобы сделать статистическое заключение о рассматриваемом объекте, следует выполнить ряд взаимосвязанных операций:

1. Грамотно обеспечить отбор единиц выборочной совокупности;

2. Систематизировать и сгруппировать результаты наблюдений;

3. Графически представить эмпирические совокупности;

4. Получить статистические показатели для эмпирических совокупностей;

5. Получить статистические параметры для генеральной совокупности.

Единицы выборочной совокупности (варианты) должны быть отобраны так, чтобы по ним с достаточной точностью можно было судить о свойствах генеральной совокупности.

Зачастую в исследованиях производится отбор так называемых "типичных" представителей генеральной совокупности. Такой подход субъективен и не может служить основой получения качественной информации.

Заданная точность в характеристике генеральной совокупности обеспечивается случайнымотбором необходимого количества вариант.

КЛАССИФИКАЦИЯ И ГРУППИРОВКА ВАРИАНТ

 

Первичные данные наблюдений представляют собой ряд значений, который называется статистической совокупностью, а каждый член этой совокупности - вариантой. Число вариант в совокупности представляет объем совокупности N.

 

Статистическая обработка первичных данных начинается с расположения вариант в определенной последовательности, зависящей от характера варьирования изучаемого признака:

1. Количественное:

· непрерывное;

· дискретное.

2. Качественное:

· атрибутивное.

При непрерывном варьировании отдельные значения признака могут иметь любоезначение меры (протяженности, объема, веса и т.д.) в определенных пределах. Например, толщина деревьев в древостое принимает различные численные значения от самого тонкого до самого толстого.

При дискретном варьировании отдельные значения признака выражаются отвлеченными числами (чаще всего целыми). Например, число деревьев на пробной площади, диаметр деревьев в ступенях (классах) толщины и т.д.

При атрибутивном варьировании значения признака классифицируют по градациям этого признака. Например, цвет, повреждаемость, тип леса, класс бонитета и т.д.

При количественном варьировании первоначальное упорядочивание совокупности проводят в порядке возрастания или убывания. При малом числе вариант (до 20) строится непосредственный ряд значений.

Пример 2.3. Двойной ряд значений толщины деревьев в примере 2.1 может быть получен в программе MS Excel с помощью статистической функции "ЧАСТОТА" (рис. 2.3).

Размещение значений признака в порядке их возрастания (убывания) с указанием числа их повторяемости называют вариационным рядом. В вариационном ряду значения признака, разнесенные по классам, называют распределением частот. Очевидно, что сумма частот равна объему выборки N.

Величина классового промежутка, на которую разбивается ряд варьирующих значений признака определяется по формуле:

,

где

X max, X min – максимальное и минимальное значения признака;

n – число классовых промежутков.

Число классовых промежутков зависит от объема выборки и ориентировочно равно корню квадратному из числа наблюдений.