1. ГРУППИРОВКА И ЭМПИРИЧЕСКАЯ ТИПОЛОГИЗАЦИЯ

.

1. ГРУППИРОВКА И ЭМПИРИЧЕСКАЯ ТИПОЛОГИЗАЦИЯ

Группировка и классификация — элементарные процедуры упорядочения данных, предваряющих их анализ. С помощью этих действий мы "уплотняем" ин­формацию, как бы расширяем области подобия и уста-навливаем новые границы различий в массе эмпири­ческих данных, не выходя при этом за пределы индикативных свойств (т. е. на "языке" фиксированных данных наблюдения» опроса, документов). Типологичес­кий анализ опирается на те же или аналогичные проце­дуры» но предусматривает более высокий уровень обоб­щения, основанием которого выступают не сочетания признаков-индикаторов, но понятия, с ними соотноси­мые. Это уже стратегия анализа на качественно ином уровне обобщения.

Простая группировка — это классификация или упорядочение данных по одному признаку. Связывание фактов осуществляется здесь в соответствии с описа­тельной гипотезой относительно ведущего признака группировки (или признака классификации). Так, в за­висимости от гипотез можно сгруппировать выборочную совокупность по возрасту, полу, роду занятий, обра­зованию, по высказанным суждениям и т. д.

Квалифицированные данные или количественные показатели группируются в ранжированные ряды по возрастанию (убыванию) признака, качественные или атрибутивные группируются по принципу построения неупорядоченных номинальных шкал.

Все операции последующего анализа покоятся на изучении сгруппированных данных.3

3 О технике группировки, классификации и статистическом анализе рядов распределения см. [12, 79, 109, 199, 259]. Наиболее полное пособие по методам анализа данных — новейшая публика­ция Г. Г. Татаровой [2вО]. См. также "Аннотированный список" в приложении 2.

 

Число членов группы называют частотой или численностью группы, а отношение данной численности к общему числу наблюдений — долей или относитель­ной частотой. Статистические приемы поиска средней тенденции (мода, медиана, среднеарифметическая), под­счет дисперсии отклонения позволяют оценить сгруп­пированный ряд в емком показателе и отобразить ре­зультаты графически (с. 155, рис. 6). Простейший ана­лиз группировки — исчисление частот по процентам.

Перекрестная группировка (или перекрестная классификация) — это связывание данных предвари­тельно упорядоченных по двум признакам (свойствам, показателям) с целью: (а) обнаружить какие-то взаимо­зависимости, (б) осуществить взаимоконтроль показате­лей (например, ответов на основной и контрольный вопросы — с. 261, схема 20), сформировать новый со­ставной показатель (индекс) на основе совмещения двух свойств или состояний объекта, определить (об этом ниже) направление связей влияния одного явления (ха­рактеристики, свойства) на другое.

Перекрестная классификация (группировка) произ­водится в таблицах, где указывается наименование таб­лицы (какие признаки, свойства сопрягаются) и общая численность включенных в группировку объектов (см. схему 8, с. 161).

Одна из задач перекрестной классификации — поиск устойчивых связей, выявляющих структурные свойства изучаемого явления. Например, можно выявить типичес­кие соотношения возрастов мужей и жен (табл. 6).

Мужья в большинстве случаев старше жен. Так, из 719 мужчин в возрасте 20—24 лет 158 (21%) имеют суп­руг моложе себя, а 62 (8,6%) — старше. Из 850 жен-Щинвтом же возрасте только 10 старше своих мужей, но в 336 случаях (39,5%) они моложе мужей.

Табл. 7 иллюстрирует использование перекрестной группировки для установления зависимости между предметной областью научного знания и длительностью "долужизни" публикаций (последняя определяется как период сокращения ссылок вдвое сравнительно с перво­начальным периодом).

 

Таблица 6 Перекрестная классификация возраста супругов

Возраст

Возраст жены (лет)

Итого

 

 

 

 

 

 

 

 

 

(чел.)

мужа (лет)

15-19

20-24

35-29

30-34

35-39

10-44

45-19

50-»

 

15-19

42

10

3

 

 

 

 

 

55

20.24

158

504

51

10

1

 

 

 

719

25-29

52

271

184

22

7

2

 

 

538

30-34

5

52

87

69

13

5

 

 

231

35-39

1

12

27

29

21

2

3

 

95

40-44

 

1

9

18

17

8

2

1

50

48-49

1

 

3

в

IS

16

7

1

49

50

 

 

1

4

11

15

21

43

95

Итого

259

850

365

188

47

33

45

1838

(чел.)

 

 

 

 

 

 

 

 

 

Источник: [270. С 801]. Данные по США.

 

Из таблицы видно, что наиболь­шим "долголетием" обладают публикации по экономи­ке, наименьшим — в ряде естественно-научных экспе­риментальных дисциплин и в математике.

Таблица 7

Время "полужизни" публикаций (период, за который число ссылок сокращается вдвое) в зависимости от области знания

 

Наука

 

Время

"полужизни"

(лет)

 

Наука

 

Время

"полужизни"

(лет)

Экономика

33,0

Биология

5,0

География

16,0

Вычислительная

 

Геология

11,8

математика

4,95

Ботаника

10,0-11,8

Физика

3,9-4,6

Химия Математика

8,1 5,42-10,5

Биомедицина

3,0

Источник: [278. С. 96].

 

Наконец, типичный случай использования пере­крестной группировки—поиск тенденции, динамики процесса (табл. 8). Приведенные в табл. 8 данные хоро­шо иллюстрируются графически (рис. 13).

 

Таблица 8

Распределение рабочих, занятых в народном хозяй­стве СССР, по уровню образования (в % к общей численности занятых)

Уровень образования

Доля рабочих, имеющих данный уровень образования.

 

1959 г.

1970 г.

1979 г.

1984г.

Высшее, незаконченное высшее, среднее специальное

2

4

9

 

Полное среднее

6

16

33

82

Неполное среднее

32

39

34

 

Начальное и более низкое

60

41

24

8

Источник: [270. С. 96].

 

Эмпирическая типологизация — наиболее силь­ный прием анализа по описательному плану. Этот ме­тод можно характеризовать как поиск устойчивых соче­таний свойств социальных объектов (или явлений), рассматриваемых в соответствии с описательными 'гипотезами в нескольких измерениях одновременно.

Основную идею подобной типологизации сформу­лировал применительно к социологии П. Лазарас-фельд. Он ввел понятие "пространство свойств" [360. С. 40—53].

Так, нетрудно вообразить свойства социальной груп­пы в трехмерном физическом пространстве, т. е. в де­картовой системе координат. Скажем, свойство А будем откладывать в "высоту", свойство В - в "ширину", а С – в "длину".

 

 

В этом трехмерном пространстве следует теперь оп­ределить, какова же упорядоченность свойств. Можно ли, допустим, сказать, что слабому выражению свойства А преимущественно соответствует слабое же выражение свойства В и сильное выражение свойства С или все три переменные ведут себя хаотически в отношении друг друга?

Чтобы определить степень упорядоченности свойств, образующих трехмерное пространство, И- А. Таганов и О. И. Шкаратан применили статистический критерий энтропии (Я). При значении Н=1 наблюдается полная упорядоченность состояний трех свойств, при значении Н=0 фиксируется полный хаос.

Указанные авторы провели массовое обследование рабочих для выявления признаков, образующих устой­чивые подгруппы рабочих. Всего было исследовано 27 признаков, из которых построено 2925 всевозможных трехмерных сочетаний, и для каждого сочетания рассчи­тан показатель энтропии. Обнаружилось, что наиболь­шую упорядоченность связей дают три переменные: профессия, квалификация и образование. Именно они являются свойствами, детерминирующими возникнове­ние неоднородных групп [257].

Более сложная задача — проанализировать степень скопления или рассеяния признаков (свойств) в много­мерном пространстве. Такое пространство нельзя наг­лядно представить в трехмерной системе координат, его можно описать в математических символах. Задачи многомерной эмпирической типологизации свойств ре­шают с помощью математических процедур распознава­ния образов — таксономии и кластерного анализа, при­чем в этом случае исходные данные могут быть пред­ставлены в упорядоченных (метрических также) или в неупорядоченных шкалах.

Рассмотрим для примера таксономический анализ мигри­рующих из села в город и из города в село жителей Сибири [94].4 Т. И. Заславская и ее коллеги, впервые применившие ме­тод таксономии к социальным объектам, при массовом обследо­вании мигрантов фиксировали десятки признаков: пол, возраст, семейное положение, профессию, образование, занятие до и после переезда, направление миграции, район выезда и въезда, цели миграции и т. д. Задача — на основе этих сведений определить, какие крупные половозрастные и социальные группы образуют миграционные потоки из села в город и обратно — из города в село. Выявление подобных социальных типов важно для прак­тической регуляции миграционных потоков.

4 Литература о методах многомерной классификации: 206, 204, 2в4, 259, 260, 264].

 

Таблица 9 Направление миграционных потоков в различных типологических группах населения

Направление миграции

 

 

Типологические группы (в % к численности группы)

I

II

III

IV

V

VI

Из крупного или среднего города в село

7,3

0,8

0,0

1.2

0,0

3,0

Из малого города в село

8,0

6,6

3,2

10,0

0.0

21,2

Из села в село

47,7

14,6

13,8

41,7

22,8

15,2

Из села в малый

16,2

47,0

35,0

4,1

31,0

22,7

город

 

 

 

 

 

 

Из села в средний или крупный город

20,8

31,0

48,0

42,4

46,2

37,9

 

В итоге таксономического анализа было обнаружено, в ча­стности, шесть различных групп (таксонов): (I) — семейные мужчины и женщины, (И) — неженатые молодые мужчины, (III) — молодые девушки и незамужние женщины, (IV) — пре­старелые женщины без мужей, (V) — одинокие женщины среднего возраста без специальности, (VI) — одинокие женщи­ны, имеющие специальность. Эти таксоны существенно разли­чаются по характеру миграции (табл. 9).

Так, группа семейных (I) в основном перемещается из села в село, что также свойственно группе IV (это "бабушки", пере­езжающие из села в село к взрослым детям). Молодежь (груп­пы II и III) по преимуществу движется в город, причем девуш­ки больше, чем юноши.

Выделенные здесь типы довольно обобщены. Продолжая таксономический анализ, авторы обнаружили аемало более специфических и относительно малочисленных групп, разли­чающихся по набору свойств.

Интереснейший результат получил А. М. Демидов5, кото­рый подверг кластерному анализу данные массового опроса россиян в проекте изучения стилей жизни с интервалом в 1 год.

5 Публикуется с согласия автора (ВЯ.)

 

Исходные данные фиксировали ценностные ориентации, поведенческие установки, образцы поведения, потребитель­ские привычки, восприятия некоторых стандартов жизни.

Весь этот колоссальный по объему и взаимосочетаниям материал был подвергнут кластерному анализу — типологиэа-ции на осаове выявления устойчивых сочетаний множества признаков. Полученная типология поддается интерпретации в пространстве свойств двух векторов: "надежды — разочарова­ния" и "амбиции — пассивность" (рис. 14).

 

Стили жизни ("со-циостили", как обозначил это автор) образовали следующие кластеры (сочетания свойств): "ретрограды" — характеризуются пассивным восприя­тием жизни, пессимизмом, разочарованием, ценностной дезо­риентацией, страхом перед будущим, социальной дезориента­цией. Сильно выражены стремление к порядку и стабильнос­ти, патернализму, авторитарные тенденции при одновременном недоверии существующим социальным институтам. Преобла­дают материалистические, меркантильные ориентации, обус­ловленные в основном тяжелыми условиями жизни;

"победители" — также отличаются ценностной дезориен­тацией, разочарованием, отсутствием социальных надежд и ил­люзий. Однако в отличие от "ретроградов" это группа активных амбициозных людей, ориентированных на достижение личного материального успеха без оглядки на общество, социальные цен­ности и идеологии. Сильно выражены индивидуализм, стремле­ние к личной свободе, неверие в социальные институты. Эта группа ориентирована на быстрое достижение материальных благ без долгосрочной социальной перспективы;

"традиционалисты" — как и "ретрограды", характери­зуются пассивным отношением к жизни, отсутствием амби­ций, скептическим отношением к модернизации общества и социальным новациям. В то же время "традиционалисты" в отличие от "ретроградов" обладают твердой системой тради­ционных ценностей, верят в общество, социальные институты, глубоко моральны. Этот ценностный потенциал позволяет им более уверенно чувствовать себя в жизни, с большим оптимиз­мом смотреть в будущее;