ТЕМА 3. СВОДКА И ГРУППИРОВКА ДАННЫХ

Понятие сводки.Статистическая сводка – это научно организованная обработка материалов статистического наблюдения, ее целью является получение на основе сведенных материалов обобщающих статистических показателей, отражающих сущность социально–экономических явлений.

Статистические сводки различаются по ряду признаков:

- по сложности построения сводка может быть простая и сложная. Если представлять общие итоги по изучаемой совокупности в целом без какой-либо предварительной систематизации собранного материала - это простая сводка. Сложная сводка представляет собой комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему и представление результатов группировки и сводки в виде статистических таблиц;

- по способу разработки сводки делятся на централизованные, когда все данные сосредотачиваются в одной организации и сводятся по разработанной методике (используется для обработки материалов единовременных статистических наблюдений). При децентрализованной обобщение материала осуществляется снизу доверху по иерархической лестнице управления, подвергаясь на каждом из них соответствующей обработке (используется для обработки статистической отчетности);

- по технике выполнения сводка подразделяется на механизированную и ручную.

Таким образом, статистическая сводка представляет собой систематизацию и группировку цифровых данных, характеристику образованных групп системой показателей, подсчет соответствующих итогов и представление результатов сводки в виде таблиц, графиков.

Метод группировки.Исходная информация на стадии сводки систематизируется, образуются отдельные статистические совокупности, т.е. осуществляется статистическая группировка.

Группировка – это разбиение совокупности на группы, однородные по какому–либо признаку. Особым видом группировки является классификация. Она основывается на самых существенных признаках, которые меняются очень мало (например, классификация видов экономической деятельности, классификация основных фондов).

Отличительными чертами классификации являются: а) в основу кладется качественный признак, б) стандартность, в) устойчивость.

Метод группировки основан на двух категориях – группировочном признаке и интервале.

Группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Они бывают атрибутивные – по качественному признаку и количественные.

Группировочные признаки классифицируются следующим образом:

- по форме выражения: атрибутивные, не имеющие количественного выражения (профессия, образование); количественные: 1) дискретные (прерывные), значения которых выражаются только целыми числами (количество комнат, детей); 2) непрерывные – значения, которые могут быть как целые, так и дробные (возраст, рост);

- по характеру колеблемости: альтернативные, которыми одни единицы обладают, а другие нет (например, качество); имеющие множество количественных значений;

- по роли признака во взаимосвязи изучаемых явлений: факторные, воздействуют на другие признаки; результативные, испытывающие на себе влияние других.

После определения основания группировки необходимо найти количество групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.

Если в основу группировки положен количественный признак, то для нахождения оптимального числа групп используется формула Стерджесса:

n = 1 + 3,322 ln N , (3.1)

где n – число групп;

ln – натуральный логарифм;

N – количество элементов совокупности.

После определения числа групп следует определить интервалы группировки.

Интервал – представляет собой промежуток между максимальным и минимальным значениями признака в группе.

Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки в зависимости от их величины бывают равные и неравные. Неравные интервалы в экономической практике используются чаще. При неравном интервале, ширина интервала постепенно увеличивается, а верхний интервал часто незакрыт вовсе. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.

Величину равного интервала (h) можно найти по следующей формуле:

, (3.2)

где – максимальное значение признака в совокупности;

– минимальное значение признака в совокупности.

Полученную по формуле величину округляют. Она является шагом интервала.

Существуют следующие правила определения шага интервала.

Если величина интервала представляет собой величину, имеющую один знак до запятой (например, 0,76; 1,585; 3,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала (0,8; 1,6; 3,8).

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа (например, 14,532, это значение можно округлить до 15).

Если величина интервала представляет собой трех, четырехзначное число и так далее, то значение интервала можно округлить до ближайшего числа кратного 50 или 100. Например, 138 следует округлить до 150.

Существуют открытые и закрытые интервалы.

Открытые – это интервалы, когда имеется только либо верхняя, либо нижняя граница. Необходимость в открытых интервалах обусловлена, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами. Например, до 5, менее 4,5 или 10 и более, свыше 105. Ширина открытого интервала принимается равной ширине смежного с ним интервала.

Закрытые, когда есть и нижняя и верхняя граница. Если в совокупности неделимые единицы, например, количество человек, комнат в квартире, то группы целесообразно формировать следующим образом 1–3, 4–7, 8–11. При непрерывном изменении признака одно и то же число служит верхней и нижней границами двух смежных групп, например, рост студента в сантиметрах 90–120, 120–150, 150–180.

Для выполнения статистических расчетов необходимо нахождение серединного значения интервала, его можно определить несколькими способами.

Суммируем верхнюю и нижнюю границу интервала и делим на 2.

К середине 2–го интервала прибавляем величину интервала.

От середины 2–го интервала минус величину интервала (для открытого).

К середине предпоследнего интервала прибавляем величину интервала (для открытых).

Виды статистических группировок.Существуют следующие виды группировок: типологическая, структурная, аналитическая и комбинированная.

Суть типологической группировки заключается в выделении из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные. Если атрибутивный признак, то число групп определяется свойствами изучаемого явления. Например, группировка населения по половозрастному признаку, численность по годам, ППП, в том числе рабочие, ученики, ИТР, служащие, МОП. Выделение типов на основе количественного признака состоит в определении групп с учетом значений изучаемых признаков. Пример: ясельный 0–2; дошкольный 3–6; школьный 7–17; трудоспособный 16–54 для женщин и 16–59 для мужчин. Типологические группировки широко применяются в исследовании социально–экономических явлений и процессов.

Структурная группировка – это группировка, используемая для изучения строения изучаемой совокупности. В большинстве своем структурные группировки производятся на основе образования качественно однородных групп. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания, состав предприятий по численности занятых, стоимости основных фондов и др.

Аналитическая группировка – используется для изучения связи между отдельными признаками. Например, между стажем работы и квалификацией, разрядом рабочего и образованием. Особенностями аналитической группировки являются следующие: во–первых, в основу кладется факторный признак; во–вторых, каждая выделенная группа характеризуется средними значениями результативного признака.

Комбинированная группировка – это образование групп по двум и более признакам, взятым в определенном сочетании. При этом атрибутивные признаки располагаются вначале в определенной последовательности, исходя из логики взаимосвязи показателей. Пример, образованы группы по формам хозяйствования, они разделены на подгруппы по уровню рентабельности или по производительности труда, фондоотдачи.

В зависимости от числа признаков, положенных в основание комбинированной группировки, ее делят на простую группировку, выполненную по одному признаку и сложную – производимую по двум и более признакам.

Вторичная группировка.Вторичной группировкой называется перегруппировка уже сгруппированного материала, без обращения к первичным данным.

К ней прибегают, когда из большого числа первоначально образованных групп надо получить меньшее число более крупных, когда в целях сравнения нужно привести в сопоставимый вид по–разному сгруппированный материал.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам, а также когда границы новых и старых интервалов совпадают.

Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

Статистические таблицы.Результаты сводки и группировки материалов наблюдений представляют в виде статистических таблиц. Они позволяют изложить материал наиболее удобно, компактно, наглядно и рационально.

В статистических таблицах различают подлежащее и сказуемое. Подлежащим – является тот объект, о котором идет речь в таблице, и представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемым в таблице называют показатели, с помощью которых изучается объект, т.е. подлежащее.

Статистические таблицы могут быть простыми и сложными. К простым относятся перечневые таблицы, в которых подлежащим служит перечень отдельных объектов. В сложных таблицах подлежащее представляет собой совокупность, расчлененную на группы по одному или нескольким признакам.

Таблицы, в подлежащем которых имеет место группировка по одному признаку, именуют групповыми. При наличии в подлежащем группировки по двум и более признакам таблица именуется комбинационной.

К числу сложных таблиц относят корреляционные и балансовые таблицы.

Деление таблиц на простые, групповые и комбинационные основано на степени расчленения подлежащего. Однако и сказуемое может быть представлено по–разному.

Если все показатели сказуемого характеризуют подлежащее отдельно, независимо друг от друга, то такая разработка сказуемого называется простой. Если же в сказуемом один признак комбинируется с другим, то такая разработка сказуемого называется сложной.

Впервые статистические таблицы были применены при изложении статистических данных в 1727 г. в России И.К. Кириловым в работе «Цветущее состояние Всероссийского государства». Применение комбинационных таблиц относится к более позднему периоду (1882).

Статистические графики.Статистический график – это чертеж, на котором при помощи условных геометрических фигур (линий, точек, символов) изображаются статистические данные.

Основоположником графического метода в статистике считают английского экономиста У. Плейфейра. В его работе «Коммерческий и политический атлас» (1786г.) впервые были применены способы графического изображения статистических данных.

Основные элементы графика включают в себя:

Поле графика – это место, на котором он выполняется.

Графический образ – это символические знаки, с помощью которых изображаются статистические данные.

Пространственные и масштабные ориентиры.

Экспликация графика – это пояснение его содержания, включает в себя заголовок графика, объяснения масштабных шкал, пояснения отдельных элементов графического образа.

По способу построения графики делятся на диаграммы, картограммы, картодиаграммы.

Диаграмма представляет чертеж, на котором статистическая информация изображается посредством геометрических фигур или символических знаков.

· Линейные диаграммы, для них применяется система прямоугольных координат. Достоинства в том, что на одном и том же графике можно изобразить несколько показателей, что важно для сравнения.

· Столбиковые диаграммы в них используется прямоугольная система координат. При этом каждое значение изучаемого показателя изображается в виде вертикального столбика. Основание выбирается произвольно, а высота соответствует изображаемым данным. Расстояние между столбиками должно быть одинаковым. Уровни показателя изображаются внутри столбика.

· Ленточные (полосовые) графики Основания столбиков располагаются вертикально, а масштабная линейка наносится на горизонтальную ось. Применяется в практике для систематического отображения хода выполнения производственных заданий нарастающих итогом.

· В круговых диаграммах площадь окружности принимается за величину всей изучаемой совокупности, а площади отдельных секторов отображают удельный вес (долю) ее составных частей. Необходимо иметь в виду, что 1% = 3,6°.

· Радиальная диаграмма строится на базе полярных координат. Началом отсчета в них служит центр окружности, а носителями масштабных шкал являются радиусы круга. Обычно в основе радиальных диаграмм лежат повторяющиеся годовые циклы с помесячным или поквартальными данными. Например, годовой цикл делится на 12 частей. На каждом радиусе в соответствии с установленным масштабом наносятся точки, соответствующие изучаемым за каждый месяц данным. Полученные таким образом точки, соединяют между собой линиями. В результате получается спиралеобразная линия, характеризующая внутригодовые циклы.

· В фигурных диаграммах данные изображаются рисунками – символами, которые в наибольшей степени соответствуют существу отображаемых явлений. Применяют для рекламы. В них каждому знаку–символу условно придается определенное числовое значение, и путем последовательного их расположения на поле графика формируются соответствующие полосы. Недостатком является то, что наряду с целыми фигурами приходится иметь дело с их частями.

· Знаки Варзара. Русский статистик В.Е.Варзар (1851-1940) предложил использовать прямоугольные фигуры для графического изображения трех показателей, один из которых является произведением двух других. В каждом прямоугольнике сумма прямоугольника равна величине третьего показателя, который равен произведению двух первых (например, стоимость это произведение цены за единицу продукции на количество этой продукции).

Картограмма – это схематичная карта или план местности, на которой отдельные территории в зависимости от величины изображаемого показателя обозначаются с помощью графических символов (штриховки, расцветки, точек).

Картодиаграмма – представляет собой сочетание контурной карты (плана) местности с диаграммой. В отличие от диаграммы, используемые геометрические символы располагаются по всей карте.

В настоящее время разработаны пакеты прикладных программ компьютерной графики такие как Statgraf , Supercalc, Exel.