2. Средние величины, способы их вычисления

Количественные значения признаков, характеризующих единицы совокупности, могут варьироваться под влиянием разнообразных условий (факторов), одни из которых являются общими (типичными) для всех этил единиц, другие — индивидуальными (нетипичными) Применение средних величин как раз и позволяет количественно определить наиболее типичные признаки массовых явлений. Предположим, что следователь в январе закончил расследование по трем уголовным делам, в феврале — по четырем, в марте — по шести, в апреле - - по пяти, в мае - - по двум, в июне —• по четырем. На полученные значения могли повлиять самые различные факторы и прежде всего сложность дел, объем работы по каждому из них и т. д. Но если абстрагироваться от всех частностей, вызвавших различия в количестве расследованных ва месяц дел, то можно оказать, что в среднем каждый месяц заканчиваются расследованием четыре дела (за полгода расследовано 3+4+6 + 5+2+4—24 дела, что при делении на шесть месяцев и дает указанную величину).

Таким образом, средняя величина — это обобщающий показатель, характеризующий количественное значение признака в результате абстрагирования от его индивидуальных различий.

Для правильного исчисления средних должна быть взята качественно однородная совокупность. «Средняя величина, — подчеркивал К. Маркс, — есть всегда средняя многих различных индивидуальных величин одного и того же вида»1. Иными словами, исчисление средних должно основываться на методе научных группировок, который обеспечивает выделение однотипных, однородных совокупностей. В. И. Ленин, критикуя несостоятельность методологии средних при разработке материалов

Приведенная формула используется в том случае когда значение признака у каждой единицы встречается лишь один раз.

В тех случаях, «огда статистическая совокупность представлена в сгруллированном виде и каждое значение признака, называемого вариантой, имеет свою частоту повторения (вес), то применяется средняя арифметическая взвешенная,

Предположим, имеются показанные в табл. 9 данные лаборатории заготовительного пункта о жирности принятого молока в течение месяца.

 

Данные о жирности молока, принятого   заготовительным пунктом

 

Таблица

 

 

Содержание

 

 

 

 

 

 

 

 

жира,

 

 

 

 

 

 

 

 

в процентах

2,4

2,6

2,8

3,0

3,2

3,4

3,6

3,8

Объем мо-

 

 

 

 

 

 

 

 

лока, в лит-

 

 

 

 

 

 

 

 

рах

80

120

!,50

250

100

120

120

60

 

 

 

Из таблицы видно, что у каждого осредняемого признака (процента жирности) есть своя частота повторения (например, 2,4% повторяется 80 раз, 2,6% —120 раз и т. д.), т. с. вес. При расчете средней в этом случае формула принимает вид:

 

(3)

где

х — средняя величина;

S — знак суммирования;

х— варианта (значения признака);

f— вес (частота вариант).

Применительно к приведенным в табл. 9 данным .это означает, что каждую варианту необходимо умножить на частоту се повторения и разделить на общее количество единиц признака, т. е.

 

X =

 

2,4-80+2,6-120+2.8-150+3,0 • 250+3,2-100+ 80+120+Ï5Ô+250+100+Î2Ô+120+60'

+3.4-120+3,6-120+3,8-60

— 0,1 /Q .

 

50

 

Здесь расчет средней арифметической взвешенной дан по дискретному ряду распределения.

Расчет средней по интервальному ряду распределения рассмотрим исходя из приведенных в табл. 10 данных.

Таблица    10

Сроки и количество осужденных к лишению свободы по ст. 92 УК РСФСР

 

Сроки  лишения  свободы

 

 

 

 

 

(от — до, лет)

2—3

3—6

6—8

8—10

10- ' Б

Количество   осужденных

 

 

 

 

 

(чел.)

4

4

35

45

12

Прежде чем произвести расчет средней, необходимо интервальный ряд превратить в дискретный. Для этого надо найти среднее значение варианты каждой группы ряда с помощью средней арифметической простой,_что составит: *І=(2+3):2=2,5; 72= (3+6):2=4,5; Т3= = (6+8): 2=7; Х4= (8+101) : 2 = 9; *9= (10+15) : 2=1 ='12,5.

После преобразования интервального ряда чв дискретной дальнейшие вычисления производятся по формуле (3), т. е. средние варианты умножаются на веса (частоты), полученные произведения суммируются и делятся на сумму частот.

Применительно к найденным по данным табл. 10 средним значениям расчет принимает вид:

 

х =

 

2!5-4+4,5-4+7-35+9-45+12,5-12       918

100

4+4+35+45+12 = 9,2 года.

 

Из приведенных расчетов нетрудно заметить, что величина средней зависит не только от величины вариант, но и от величины их частот. Чем меньшие частоты имеют большие значения вариант, тем меньше величина средней, и наоборот.

В статистике достаточно часто івстречаются случаи, когда необходимо рассчитать среднюю по формуле сРедней гармонической, которая представляет собой величину, обратную средней арифметической. Среднюю гармоническую применяют в тех случаях,

51

 

когда в качестве весов выступает сумма произведений осредняемого признака  на частоту его повторения.

Предположим, что по данным табл. 11 нужно определить среднюю заработную плату одного рабочего в целом по заводу.

Таблица   11 К. расчету средней гармонической взвешенной

 

Номер цеха

Средняя заработная плата рабочих, в руб.

Фонд заработной платы Ірабочих, в тыс. руб.

1 2 3

108 120

145

24,84 45,72 71,63

 

 

 

Величина средней заработной платы (осрсдняемый признак), как известно, определяется отношением фонда заработной платы (произведение осредняемого признака на частоту повторения) к среднесписочной численности соответствующей категории персонала (частота повторения признака) . А для того, чтобы установить последнюю из перечисленных величин для нашего примера, необходимо фонд заработной платы каждого цеха разделить на среднюю заработную плату одного рабочего данного цеха. Так, разделив 24,84 тыс. руб. на 108 руб., получаем, что в первом цехе численность рабочих составила 230 чел. Аналогичным образом устанавливаем численность рабочих во втором цехе (381 чел.) и в третьем (494 чел.). Определив затем суммарный фонд заработной платы рабочих трех цехов (24,84+ +45,72 + 71,63 = 142,19 тыс. руб.) и численность рабочих в этих цехах (230+381+494=1105 чел.) и разделив первое из .полученных значений на Івторое, находим среднюю заработную плату одного рабочего для всех цехов (142390:1105=128,6 руб.). Этот логический путь расчета можно заменить более рациональным, применив методику расчета по средней гармонической взвешенной. Тогда среднюю заработную плату одного рабочего для всех цехов можно рассчитать следующим образом:

24840 + 45720+71630

142190

24840_ ~Ш8~

45720      71630 120   +    145

— 1^!о, о руб.

1105

 

S2

 

В общем виде формула средней гармонической взвешенной имеет вид:

,

її

Хп

где WbTPfcWs, ...,№„- вес;

Ль *2, #з,..., л:„ —• значения признака; Е — знак суммирования.

Тажим образом, для исчисления средней гармонической взвешенной нужно найти отношение между суммой весов и суммой результатов деления каждого веса на соответствующую варианту признака. Если вес каждой варианты равен единице, то при п вариантах расчет производится по формуле средней гармонической простой:

а;=        г-               (о)

2 — X

Как видим, в зависимости от характера исходных данных статистика оперирует несколькими видами средних, из которых чаще всего применяются средние взвешенные. Формулы простых средних используются сравнительно редко (когда варианты осредняемого призна* ка не повторяются).

В отдельных случаях для характеристики типичных размеров признака определяют моду и медиану.

Модой называется величина признака, чаще 'всего встречающаяся в вариационном ряду. Так, для приведенных в табл. 9 данных о жирности молока модальным будет значение 3%, имеющее наибольшую частоту (250).

По данным интервальных вариационных рядов мода определяется по следующей формуле:

 

где

 

І *           I Ш          114— 1

(6)

Mo=x0+d-              f—-і        ;               ,

I m     /m—l~r/m     /m+1

Mo— мода;

xQ— начальная граница модального интервала, т. е. интервала, обладающего наибольшей численностью в данном распределении;

 

53

 

d— величина  модального  интервала; /m_i— частота  интервала,  предшествующего  модальному;

fm— частота модального интервала; fm+t— частота интервала, следующего за модальным. Рассчитаем моду по данным табл. 10:

 

М0=8+2-

 

10

10+33

 

= 8,5 года.

 

Медианой называется значение признака, делящее численность упорядоченного вариационного ряда на две равные части.

Для определения медианы сначала определяют    ее

 

место (или номер) по формуле

 

п+1

 

где п — чис-

 

ло членов ряда.

Исходя из данных табл. 9, номер медианы равен (8+1) :<2, т. е. ее числовое значение соответствует полусумме показателей, идущих под четвертым и пятым номерами, или: (3,0+3,2) : 2=3,1%.

Медиана интервального вариационного ряда находится по формуле:

 

т-1

- От—

 

(7)

Іде        M?— медиана;

JCo— начальные  границы    медианного    интервала;

d— величина  медианного интервала; 2/— объем ряда; SVn-i— сумма    накопленных  частот  интервалов,

предшествующих медианному; fm— частота медианного интервала.

Чтобы определить медиану применительно к. изложенным в табл. 10 данным, сперва необходимо подсчитать сумму накопленных частот (графа 3 в табл. 12).

54

 

:

; 1

 

изучаемой  единицы  к другой  менее  значительна,   чец| в первой группе, и где количественные признаки кале, дои единицы в меньшей степени отличаются от получен-I ного среднего значения.

Однако по мере усложнения изучаемых явлений подобная «очевидность» колеблемости признаков исчеза-ет. Здесь уже приходится использовать специальные показатели, позволяющие измерить вариацию (изменение, колеблемость) величины количественного признака от одной единицы однородной совокупности к другой.

К таким показателям относятся размах вариации, дисперсия и среднее квадратическое отклонение.

Размах вариации -- это разность между максимальным и минимальным значением признака. Названная величина определяется по формуле:

 

А —

 

(8)

 

R

где

размах вариации; максимальное значение признака; — минимальное  значение  признака.

В нашем случае Ri = 13 — 1 = 12 лет, R2==8 — 4=4 года, т. е. размах вариации для первой группы в три раза превышает аналогичный показатель для второй группы

Однако этот вывод опирается только на два крайних значения признака и не учитывает колеблемость основной массы признаков внутри ряда. Для измерения колеблемости всех членов ряда используются два другие из названных показателей вариации — средний квадрат отклонения (дисперсия) и среднее квадратиче-акое отклонение.

Дисперсия — это средний квадрат отклонений вариант от их средней величины. Рассчитывается дисперсия при равенстве весов или их отсутствии по формуле:

 

<r =

 

(9)

 

а при наличии частот повторения признака   (весов) -по формуле:

V/V     z:\2t

(10)

2/

Іде а2 («сигма малая»   в квадрате) — дисперсия;    остальные обозначения — те же, что и ранее.

56

 

В нашем примере, используя формулу (9), находи!

(1—6)2+(3—6)2+(5—6)2+(8—6)2+(13—б)2

I"*"        5 .

= 17,6; (4—6)2+ (5—6)2+ (6—6) 2+(7—6) 2+(8—б)2

м:

5 = 2,0.

Расчет подтвердил наш интуитивный вывод о том, что колеблемость изучаемого признака в первой группе осужденных является большей, нежели во второй, но подтвердил уже конкретным языком цифр, поскольку чем больше дисперсия, тем значительнее изменения (колеблемость) признака.

Дисперсия выражается отвлеченным числом и не имеет обозначения. Для того, чтобы увидеть, как колеблемость проявляется в определенной размерности (в приведенном примере — в годах), можно вычислить среднее квадратическое отклонение.

Среднее квадратическое отклонение ( а ) - - это корень квадратный из дисперсии. Общая формула этого показателя может быть записана так:

(11)

а при отсутствии весов или их равенстве:

(12)

Таким образом, среднее квадратическое отклонение Дает абсолютную меру вариации. Применительно к первой группе осужденных этот показатель равен:

di= y 17,6=4,2 года, ко второй: 02=1/2=1,4 года.

Для измерения относительных размеров колеібле-Мости признака применяется коэффициент вариации.

Коэффициент вариации представляет собой отношение среднего квадрэтического отклонения к среднему значению признака и может быть вычислен в долях единицы или в процентах.

57

 

Для его определения    используется следующая формула:

V — коэффициент вариации; о— среднее квадратическое отклонение; х — средняя величина.

В   использованном  выше  примере  коэффициент  вариации для первой группы осужденных «равен:

где

для второй группы:

Чем больше коэффициент вариации, тем разнороднее совокупность. Этот показатель - - критерий типичности, представительности средней.

Если проанализировать все рассмотренные показатели вариации применительно к нашему примеру, то можно сделать вывод, что средний срок лишения свободы (6 лет) наиболее типичен для второй группы осужденных. В эту группу входят осужденные за более однородные преступления (по признаку их тяжести), чем в первую прупяу.

Таким образом, в тех случаях, когда необходимо изучить, насколько надежна (типична) средняя, применяются различные показатели вариации. Выбор этих показателей зависит от того, насколько глуїбоко и точно требуется измерить колеблемость изучаемого признака. Так, размах вариации дает определенное представление о величине 'колеблемости признака, но учитывает лишь его крайние значения.

«все книги     «к разделу      «содержание      Глав: 25      Главы: <   11.  12.  13.  14.  15.  16.  17.  18.  19.  20.  21. >