Вариационный ряд


Статистические группировки и вариационные ряды.

Http://nachalka.info

С использованием интерактивных технологий и ресурса

Окружающего мира

Русского языка

Математики

Изучите содержание и возможности информационно-образовательной среды «Начальная школа Кирилла и Мефодия» http://nachalka.info

Требования к оформлению итогового проекта

Задание 3. «Репортаж с урока информатики»

Опишите фрагменты уроков информатики с использованием ресурсов:

- электронного приложения к УМК НВ Матвеевой

- сетевой олимпиады «ТРИЗформашка» к УМК М.А. Плаксина

- «Виртуальные лаборатории по информатике для начальной школы» на портале www.school-collection.ru

 

Задание 4. «Репортаж с урока»

Опишите фрагменты уроков по выбору:


 

Принципы построения вариационных рядов. Вариация. Особенности построения интервальных рядов.

Средние величины (средняя арифметическая, средняя геометрическая, структурные средние) Способы нахождения средних величин. Меры рассеяния. Способы определения и смысл среднего квадратичного отклонения и дисперсии. Взаимосвязь средних величин и мер рассеяния. Трактовка анализа вариационных рядов. Анализ вариационных рядов при помощи программы MS Excel.

 

Понятие вариационного ряда. Первичные статистические данные, с которыми имеет дело историк, часто представлены неупорядоченной последовательностью чисел, характеризующей ту или иную сторону процесса или явления. В этой совокупности чисел бывает трудно разобраться, и первичная обработка материалов сводится к приведению имеющихся данных к виду, удобному для анализа.

Пример 1. При обследовании студентов первого курса по возрасту были зафиксированы следующие данные:

17 18 18 18 19 18 20 20 19 18 18 21 19 22 23 18 19 19 19 21 21 18 18 18 18 22 19 18 20 18 19 18 20 19 21 20 22 18 19 21 19 19 22 23 19 20 21 22 17 19.

Полученный в результате обследования набор чисел будем в дальнейшем называть статистической совокупностью, а сами числа, показывающие изменение (вариацию) подлежащего изучению признака, - вариантами (обозначим их хi, где i - номер варианта)

Если упорядочить совокупность исходных данных в убывающем или возрастающем порядке, то получим так называемый ранжированный ряд.

Используем для упорядоченной таким образом совокупности более компактную запись (см. табл. 1) В первой колонке поставим различающиеся по величине варианты, расположив их в возрастающем порядке, во второй - числа, показывающие, сколько раз (или как часто) встречаются отдельные значения вариант (назовем их частотами и обозначим ni)

Полученный ряд называется вариационным. Сведение первичных данных в вариационный ряд облегчает анализ совокупности. Например, в каком во3расте обследованной группе чаще встречаются студенты? в возрасте 18-19 лет. Меньше всего? Сколько? студентов с крайними для данной группы значениями возрастов (17 лет, 23 года). Кроме того, вариационный ряд является исходным материалом для большинства методов математической статистики.

При построении вариационного ряда можно приписывать вариантам не частоты, а рассматривать доли каждой варианты во всей совокупности. Они вычисляются как отношения соответствующих частот к объему всей совокупности и называются частостями (обозначим их qi). Частости могут быть выражены в относительных числах или процентах (см. табл.1). Вычислите

Дискретный и интервальный вариационные ряды. Изменение признака, по которому обследуются объекты, может быть дискретным и непрерывным. Дискретной вариацией признака называется такая, при которой отдельные значения варианты отличаются на некоторую конечную величину. В приведенном примере вариация признака зафиксирована как дискретная (отдельные значения варианты отличаются на единицу). Вариация называется непрерывной, если отдельные значения признака могут отличаться друг от друга на сколько угодно малую величину. Примером непрерывной вариации признака служит распределение посевных площадей по урожайности.

В зависимости от вида вариации различают дискретные и интервальные вариационные ряды. Дискретный признак служит основой для построения дискретного ряда (см. табл. 1). В случае непрерывного признака варианты объединяют в интервалы, образуя интервальный ряд.

В практике исторических исследований непрерывные вариации признака встречаются сравнительно редко, тем не менее, интервальные ряды имеют большое значение в обработке исторических данных. Дело в том, что некоторые признаки, принципиально являясь дискретными, принимают такое большое количество значений, что составленный по ним дискретный ряд является практически необозримым, при этом весьма затрудняется дальнейший его анализ. В такой ситуации прибегают к построению интервального ряда (см. табл. 2).

Принципы построения интервального ряда. Первым шагом при построении интервального вариационного ряда является выбор определенного принципа, который кладется в основу построения интервального ряда. Выбор этого принципа зависит от степени однородности рассматриваемой совокупности.

Ели совокупность однородна, то при построении ряда используют принцип равных интервалов. При этом вопрос об однородности решается содержательным анализом изучаемых явлений.

Следует отметить, что принцип равных интервалов примечается также в тех случаях, когда признак изменяется значительными скачками, природа которых неясна.

Пример 2. Приведем пример вариационного интервального ряда, построенного по принципу равных интервалов (см. таблицу 2).

Если совокупность не совсем однородна, то при построении ряда используют принцип неравных интервалов, при этом стремятся добиться качественной однородности объектов внутри интервалов, например, при построении вариационного ряда распределения в городов и поселков городского типа по числу жителей, применив принцип равных интервалов, мы вынуждены образовать, скажем, такие интервалы: до 50 тыс. жителей, от 50 тыс., до 100 тыс. и т. д., от 450 тыс. до 500 тыс., 500 тыс. и более. Но различия между населенными пунктами, имеющими 3 тыс. жителей и 50 тыс. жителей, безусловно, существеннее, чем такие же по абсолютной величине различия между городами, насчитывающими 453 тыс. и 500 тыс. жителей. Очевидно, что эти данные целесообразно свести в вариационный ряд с неравными интервалами (см. табл. 3), которые объединяют схожие по размерам города и поселки. Интервалы, у которых отсутствует верхняя граница на3ывается открытым.

Но не всегда удается получить удовлетворительные результаты и с помощью неравных интервалов. Тогда в основу построения интервального ряда кладется социально-экономический критерий, который призван определить типы, однородные в социально-экономическом отношении. Социально-экономический анализ направлен на то, чтобы определить границы интервалов там, где количественное изменение признака приводит к появлению нового качества. Подобный принцип носит название типологического.

Широко использовал типологический принцип в своих статистических исследованиях В. И. Ленин. В частности, анализируя данные германской сельскохозяйственной переписи 1907 г., Ленин вместо 18 групп-интервалов по обеспеченности землей, построенных официальной статистикой, выделил три социально отличные группы хозяйств: пролетарские, крестьянские и капиталистические. Такое выделение позволило выявить степень развития капитализма в сельском хозяйстве Германии (См.: Ленин В. И. Поли. собр. соч., т. 19, с. 326-330.).

Наконец, еще более тонким способом группировки является способ специализированного интервала, идея которого принадлежит В. И. Ленину. Суть этого метода заключается в том, что совокупность разбивается на однородные группы (отрасли, типы хозяйства и т. п.) и для каждой группы утроится своя шкала интервалов.

Для того чтобы построить интервальный ряд, после выбора принципа построения нужно определить величину интервала. Величина интервала должна быть такой, чтобы, с одной стороны, ряд не оказался слишком громоздким и, с другой стороны, в нем не исчезали бы особенности изучаемого явления. Величина интервала для ряда с равными интервалами определяется соотношением

h=R/k,

где R-размах вариации; k-количество интервалов.

Для ранжированного ряда легко посчитать размах вариации, т. е. разность между на и большим и наименьшим значениями признака: R=xmax.- xmin, где xmax - наибольшее в ряду значение варианты; xmin - наименьшее значение варианты.

Тогда для подсчета величины интервала достаточно определить количество интервалов. Вопрос о количестве интервалов решается исследователем в каждом конкретном случае в зависимости от поставленной задачи и особенностей исходных данных.

Величину интервала можно подсчитать и непосредственно. Для ряда с равными интервалами может быть предложена следующая приближенная формула для "оптимальной" (наилучшей) величины интервала:

 

где n-объем совокупности (число элементов совокупности); lgn-десятичный логарифм числа n.

Пример 3. Пусть статистическая совокупность состоит из 400 элементов, наибольшее значение варианты равно 65, наименьшее-5, т. е. в наших обозначениях n=400, xmax=65, xmin=5. Определить величину интервала для этих данных.

Воспользовавшись таблицей логарифмов и подставив исходные значения в формулу для оптимальной величины интервала - формулу (4.2), получим

 

Определение величины интервала для ряда, в основу построения которого положен не принцип равных интервалов, должно базироваться на знании исходного материала, универсальных рекомендаций в этом случае дать не возможности.

Закономерность распределения признака. Анализ вариационного ряда начинается с выявления зависимости между вариантами и частотами.

В случае неравных интервалов закономерность соотношения между вариантами и частотами (частотами) может не проявиться или же иметь искаженный вид. Поэтому для рядов с неравными интервалами необходимо обеспечить сравнимость частот (частоты), что достигается вычислением плотности распределения.

Плотность распределениярассчитывается как отношение частоты (ni) или частоcти (qi) к величине соответствующего интервала (hi). В зависимости от того, какое берется соотношение, различают абсолютную и относительную плотности распределения:

 

где fia- абсолютная плотность распределения; fio-относительная плотность распределения.

Пример 4. В табл. 4 дано распределение крестьянских хозяйств Актюбинского уезда по величине посева. Анализируя изменение частоты, мы заметим, что самой многочисленной является группа хозяйств, имеющих размер посева от 5 до 10 дес. Примерно в полтора раза меньше хозяйств с посевом от 3 до 5 дес. Группа хозяйств с размером посева от 15 до 25 дес. превосходит группу хозяйств, засевающих от 10 до 15 дес. Эти выводы верны для групп, но не могут дать верного представления о фактическом распределении признака. Дело в том, что группы (интервалы), которые мы рассматриваем, неодинаковы, более крупные из них уже в силу своей величины могут содержать в себе большее число хозяйств, чем менее крупные. Чтобы избавиться от искажающего влияния неравных интервалов и сделать частоты сопоставимыми, рассчитаем плотности распределения, т. е. вычислим, сколько хозяйств приходится на единицу интервала (столбец 4-й табл. 4).

После обеспечения сравнимости частот видим несколько иную картину. Плотность, возрастая, достигает максимального значения на интервале 3-5 и затем постепенно убывает. Значит, самой многочисленной в переводе на единицу группировочного признака является группа хозяйств с посевами от 3 до 5 дес.