Статистические величины
Сущность и значение средних величин.
В результате группировки единиц совокупности по величине варьирующего признака получают ряды распределения - первичную характеристику массовой статистической совокупности. Чтобы охарактеризовать такую совокупность в целом, часто пользуются средней величиной.
Средняя величина - обобщающая характеристика изучаемого признака в исследуемой совокупности. Она отражает его типичный уровень в расчете на единицу совокупности в конкретных условиях места и времени.
Метод средних величин заключается в замене индивидуальных значений варьирующего признака единиц наблюдения, т.е. в замене x1, x2, x3, ... xn некоторой уравненной величиной
Средние величины применяются для оценки достигнутого уровня изучаемого показателя, при анализе и планировании производственно-хозяйственной деятельности предприятий (объединений), фирм, банков и других хозяйственных единиц; средние используются при выявлении взаимосвязей явлений, при прогнозировании, а также расчете нормативов. Средняя величина всегда именованная, имеет ту же размерность (единицу измерения), что и признак у отдельных единиц совокупности.
Основным условием научного использования средней величины является качественная однородность совокупности, по которой исчислена средняя. Поэтому очень важное правило - вычислять средние величины лишь по однородной совокупности единиц. Только при выполнении этого условия средняя как обобщающая характеристика отражает общее, типичное, закономерное, присущее всем единицам исследуемой совокупности. Прежде чем вычислять средние величины, необходимо произвести группировку единиц исследуемой совокупности, выделив качественно однородные группы.
Средняя, рассчитанная по совокупности в целом, называется общей средней, средние, исчисленные для каждой группы, - групповыми средними .
Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику размера явления, складывающуюся в конкретных условиях данной группы.
Средняя арифметическая простая и взвешенная.
Если имеется несколько различных индивидуальных величин одного и того же вида и надо исчислить среднюю, то необходимо найти сумму всех индивидуальных величин и поделить полученную сумму на их число.
Обозначим индивидуальные значения признака через x1, x2, x3, ...xn, число индивидуальных величин - n, среднюю величину -
Средняя величина, вычисленная по формуле:
называется средней арифметической простой.
Средняя арифметическая простая равна частному от деления суммы индивидуальных значений признака на их количество.
Пример. Требуется вычислить средний стаж работы 12 работников туристической фирмы. При этом известны индивидуальные значения признака (стажа) в годах: 6, 4, 5, 4, 3, 3, 5, 6, 3, 7, 4, 5.
Как видим, средняя арифметическая может оказаться дробным числом, если даже индивидуальные значения признака заданы только целыми числами. Это вытекает из сущности средней арифметической, которая есть величина абстрактная (теоретическая), т.е. она может принимать такое числовое значение, которое не встречается в представленной совокупности индивидуальных значений признака.
Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности.
Средняя арифметическая простая применяется в тех случаях, когда каждое индивидуальное значение признака встречается один (или одинаковое число) раз. Другими словами, средняя арифметическая простая рассчитывается по группировочным единицам совокупности.
Но чаще бывает так, что отдельные значения исследуемой совокупности встречаются не один, а много, причем не одинаковое число раз, т.е. представляют собой ряд распределения.
В эти случаях рассчитывают среднюю арифметическую взвешенную.
Средняя арифметическая взвешенная равна сумме произведений вариант (x) на их частоты или веса (f), поделенной на сумму частот.
Обозначим индивидуальные значения признака (варианты) x1, x2, x3, ...xn, а числа, показывающие, сколько раз повторяется варианта (частоты) - f1, f2, f3, ... fn, то средняя арифметическая взвешенная будет равна:
Заметим, что в нашем примере одно и то же значение признака встречается несколько раз. Объединив данные по величине признака и подсчитав число случаев повторения каждого из них, проведем расчет среднего стажа по сгруппированным данным с помощью формулы средней взвешенной арифметической.
Стаж работы, годы |
3 |
4 |
5 |
6 |
7 |
Итого |
Количество работников, человек |
3 |
3 |
3 |
2 |
1 |
12 |
Средняя арифметическая взвешенная, по которой производился расчет в рассмотренном примере, не имеет принципиальных отличий от простой средней арифметической (средние, рассчитанные по разным формулам совпадают), просто суммирование f раз одного и того же значения признака (варианта) заменено в ней умножением варианта на f.
При этом величина средней зависит уже не только от величины индивидуальных значений признака (как в простой средней арифметической), но и от соотношения их весов (частот). Чем большие веса имеют малые значения вариантов, тем меньше величина средней и наоборот.
Вычисление средней арифметической интервального ряда.
Вариационные ряды получаются в результате группировок, причем часто группировочные признаки показаны не одной величиной, а в определенных интервалах. Такие ряды называются интервальные.
Вычисление средней из интервального ряда имеет некоторые особенности. Для того, чтобы рассчитать среднюю арифметическую интервального ряда, надо сначала определить среднюю для каждого интервала, а затем - среднюю для всего ряда.
Средняя для каждого интервала определяется как полусумма верхней и нижней границ, т.е. по формуле средней арифметической простой.
Определение варианты как полусуммы верхней и нижней границ интервального ряда исходит из предположения, что индивидуальные значения признака внутри интервала распределяются равномерно и, следовательно, средние значения интервалов достаточно близко примыкают к средней арифметической в каждой группе.
В действительности это не всегда так, поэтому средние, вычисленные из интервальных рядов, являются приблизительными.
Свойства средней арифметической.
Средняя арифметическая обладает некоторыми свойствами, которые определяют ее широкое применение в экономических расчетах и в практике статистического исследования.
Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной:
Свойство 2 (нулевое). Алгебраическая сумма линейных отклонений (разностей) индивидуальных значений признака от средней арифметической равна нулю:
i - линейные (индивидуальные) отклонения от средней, т.е. xi -
Это свойство можно сформулировать следующим образом: сумма положительных отклонений от средней равна сумме отрицательных отклонений.
Логически оно означает, что все отклонения от средней в ту и в другую сторону, обусловленные случайными причинами, взаимно погашаются.
Свойство 3 (минимальное). Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное:
что означает: сумма квадратов отклонений индивидуальных значений признака каждой единицы совокупности от средней арифметической всегда меньше суммы квадратов отклонений вариантов признака от любого значения (А), сколь угодно мало отличающегося от средней у выбранной единицы исследуемой совокупности.
Для сгруппированных данных имеем:
Минимальное и нулевое свойства средней арифметической применяются для проверки правильности расчета среднего уровня признака; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.
Рассмотренные свойства выражают сущностные черты средней арифметической. Существуют также расчетные (вычислительные) свойства средней арифметической, имеющие прикладное значение:
- если значения признака каждой единицы совокупности (все усредняемые варианты) уменьшить или увеличить на одну и ту же величину А, то и со средней арифметической произойдут аналогичные изменения;
- если значения признака каждой единицы совокупности разделить или умножить на какое-либо постоянное число А, то средняя арифметическая уменьшится или увеличится в А раз;
- если вес (частоту) каждого значения признака разделить на какое-либо постоянное число А, то средняя арифметическая не изменится.
В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность в связи с использованием ЭВМ при расчете обобщающих статистических показателей.
Абсолютные и относительные статистические величины.
Результаты статистического наблюдения регистрируются в виде первичных абсолютных величин. Абсолютная величина отражает уровень развития явления. В статистике все абсолютные величины являются именованными, измеряются в конкретных единицах. И в отличие от математического понятия абсолютные величины могут быть .как положительными, так и отрицательными. Абсолютные величины делятся на:
1) Индивидуальные – характеризуют размер признака отдельных единиц совокупности.
2) Суммарные. Характеризуют итоговое значение признака по определённой части совокупности. Они разделяются на:
a) моментные - показывают фактическое наличие на определённый момент или дату.
b) интервальные - итоговый накопленный результат за период в целом. В отличие от моментных, они допускают их последующее суммирование.
Абсолютная величина не даёт представления об изучаемом явлении, не показывает его структуру, соотношение между отдельными частями и развития во времени. Эти функции выполняют относительные показатели. Относительная величина – это обобщающий показатель, который даёт числовую меру соотношения двух сопоставляемых абсолютных величин. Основное условие правильного расчёта относительной величины – это сопоставимость сравниваемых показателей и наличие реальных связей между изучаемыми явлениями. Таким образом, по способу получения относительные показатели всегда величины производные, определяемые в форме коэффициентов, промилле и т.п.
Показатели вариации и способы их расчета.
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией (изменчивостью) признаков, характеризующих отдельные единицы совокупности.
Величины признаков изменяются под действием различных факторов. Очевидно, что чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Например, размер заработной платы рабочих зависит от нескольких факторов: специальности, разряда, стажа работы, образования, состояния здоровья и т.д. Чем больше различия между значениями факторов, тем больше вариация в уровне заработной платы.
При характеристике колеблемости признака используют систему абсолютных и относительных показателей.
Абсолютные показатели вариации:
- Размах вариации R = xmax - xmin;
- Среднее линейное отклонение
- Дисперсия
- Среднеквадратическое отклонение
Абсолютные показатели, кроме дисперсии, измеряются в тех же единицах, что и сам признак.
Относительные показатели вариации:
- Коэффициент осцилляции
- Относительное линейное отклонение
- Коэффициент вариации
Относительные показатели чаще всего выражаются в процентах
Размах колебаний, или размах вариации, представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:
R = xmax - xmin
Безусловным достоинством этого показателя является простота расчета. Однако размах вариации зависит от величины только крайних значений признака, поэтому область его применения ограничена достаточно однородными совокупностями. В частности, на практике он находит применение в предупредительном контроле качества продукции.
Точнее характеризует вариацию признака показатель, основанный на учете колеблемости всех значений признака. Поскольку средняя арифметическая является обобщающей характеристикой свойств совокупности, большинство показателей вариации основано на рассмотрении отклонений значений признака отдельных единиц совокупности от этой величины. К таким показателям относятся среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, представляющие собой среднюю арифметическую из отклонений индивидуальных значений признака от средней арифметической. Среднее линейное отклонение рассчитывается из отклонений в первой степени, дисперсия и среднее квадратическое - из отклонений во второй степени. Так как алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической (согласно нулевому свойству) всегда равна нулю, то для расчета среднего линейного отклонения используется арифметическая сумма отклонений, т.е. суммируются абсолютные значения индивидуальных отклонений значений признака независимо от знака.
Среднее линейное отклонение
для несгруппированных данных
для сгруппированных данных (вариационного ряда)
Дисперсия
Дисперсия рассчитывается по следующим формулам:
для несгруппированных данных
для сгруппированных данных (вариационного ряда)
Дисперсия имеет большое значение в статистическом анализе. Однако её применение как меры вариации в ряде случаев бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого признака. В таких случаях для измерения вариации признака вычисляют среднее квадратическое отклонение.
Среднее квадратическое отклонение
для несгруппированных данных
для вариационного ряда
Дисперсия и среднее квадратическое отклонение недостаточно полно характеризуют колеблемость признака, т.к. показывают абсолютный размер отклонений, что затрудняет сравнение изменчивости различных признаков.
Для характеристики колеблемости явлений среднее квадратическое отклонение сопоставляется с его средней величиной и выражают в процентах. Такой показатель называется коэффициентом вариации. Коэффициент вариации рассчитывается по формуле:
Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической.
Выражая коэффициент вариации в процентах, различные абсолютные среднеквадратические отклонения приводят к одному основанию и дают возможность сравнивать, оценивать колеблемость величин различных признаков. При помощи коэффициента вариации возможно, например, сравнение размера колеблемости производительности труда рабочих, занятых производством различных видов продукции, размера колеблемости урожаев различных сельскохозяйственных культур и т.д.
Чем меньше коэффициент вариации, тем меньше колеблемость признака, и наоборот.
Относительное линейное отклонение определяется как отношение среднего линейного отклонения к средней арифметической в процентах:
Отношение размаха вариации к средней арифметической в процентах называется коэффициентом осцилляции:
Самым распространенным относительным показателем колеблемости признака является коэффициент вариации. Он более точно, чем абсолютный, характеризует различие колеблемости признаков.
По величине коэффициента вариации можно судить о степени вариации признаков совокупности. Чем больше его величина, тем больше разброс значений вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя.
Коэффициент вариации важен в тех случаях, когда нужно сравнивать средние квадратические отклонения, выраженные в разных единицах измерения.
Мода и медиана.
Мода в статистике – это величина варьирующего признака, который чаще всего встречается в данной совокупности или признак, который имеет наибольшую частоту.
Медиана – это значение признака, которая делит ряд распределения пополам, т.е. по обе стороны этого признака будет находиться одинаковое единиц изучаемого признака.
Мода и медиана – это описательное–среднее. Описательный характер моды и медианы связан с тем, что в них не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте.
Основные свойства дисперсии.
Дисперсия обладает рядом математических свойств, использование которых значительно упрощает и облегчает её вычисление. Основные свойства дисперсии:
- Дисперсия постоянной величины равна нулю.
- Если все значения признака уменьшить или увеличить на какое-то постоянное число, то дисперсия от этого не изменится.
- Если все значения признака уменьшить или увеличить в K раз, то дисперсия от этого соответственно увеличится или уменьшится в K2 раз.
- Сумма квадратов отклонений индивидуальных значений признака x от их средней
Доказано, что эти две суммы отличаются на квадрат разности между
Это свойство дает возможность упрощать расчеты среднего квадратического отклонения путем замены громоздких отклонений от любого произвольно взятого числа, удобного для проведения расчетов, с последующей поправкой.
- Дисперсия признака равна разности между средним квадратом значений признака и квадратом их средней, т.е.
Рассмотрим вычисление дисперсий c применением её свойств.
Один из упрощенных способов вычисления дисперсии основан на следующем равенстве:
Этот способ исчисления дисперсии называется способом моментов или способом отсчета от условного нуля.
Дисперсия альтернативного признака. В ряде случаев возникает необходимость измерить вариацию альтернативного признака. Обозначив отсутствие интересующего признака через "0"; его наличие - через "1"; долю единиц, обладающих данным признаком - через q, исчислим среднее значение альтернативного признака и его дисперсию.
Среднее значение альтернативного признака равно
т.к. (сумма долей единиц, обладающих и не обладающих данным признаком, равна единице).
Дисперсия альтернативного признака определяется следующим образом:
Подставив в формулу дисперсии вместо 1-p значение q=1-p, получим:
Таким образом,
Правило сложения дисперсий.
На вариацию признака влияют различные причины, факторы. Все они делятся на случайные и систематические (постоянные). Поэтому вариация может быть случайной, вызванной, вызванной действием случайных причин, и систематической, обусловленной воздействием постоянных факторов. В связи с этим возникает необходимость в определении случайной и систематической вариации, их роли в общей вариации и влияния на нее.
Как уже отмечалось, общая дисперсия характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию, и рассчитывается следующим образом:
Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой, т.е. расчленяют по нему всю совокупность на группы и определяют, как изменяется, варьируется общий результат под влиянием фактора, положенного в основание группировки.
Вариация, обусловленная фактором, положенным в основание группировки, называется межгрупповой вариацией.
Размеры ее определяются при помощи дисперсии групповых средних.
Межгрупповая дисперсия i) около общей средней (xi) и исчисляется по формулам:
где xi - средняя по каждой отдельной группе;
n - число единиц совокупности;
f - частоты или веса.
Таким образом, межгрупповая дисперсия (дисперсия групповых средних) равна средней арифметической из квадратов отклонений частных средних от общей средней.
Она характеризует систематическую вариацию, которая возникает под влиянием фактора признака, положенного в основу группировки.
Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем среднюю из внутригрупповых дисперсий.
Средняя из внутригрупповых дисперсий характеризует случайную вариацию, которая возникает по влиянием всех факторов, кроме положенного в основание группировки.
Чтобы определить её, надо рассчитать вначале внутригруппировочные дисперсии по каждой группе в отдельности, а затем среднюю их них.
Средне квадратическое отклонение.
Средне квадратическое отклонение (σ) и дисперсия (σ2) определяются так:
Для несгруппированных данных (первичного ряда)
σ = σ2 =
для вариационного ряда
σ = σ2 =
формула для расчета дисперсии может быть преобразована:
σ2 = = = =
= -
т.е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,
σ2 = -
Среднее квадратическое отклонение по своей величине всегда превышает значение среднего линейного отклонения в соответствии со свойствами мажорантности средних.