3. ПОИСК ВЗАИМОСВЯЗЕЙ МЕЖДУ ПЕРЕМЕННЫМИ

К оглавлению1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 
34 35 36 37 38 39 40 41 42 43 44 45 

 

Перекрестная группировка по двум и более призна­кам — прямой путь к обнаружению возможных взаи­мосвязей между переменными. Для этого нужно соста­вить таблицу определенным образом, например, подсчи­тать пропорции частот одного признака в зависимости от частот другого. Для неискушенного читателя при из­ложении результатов социологических обследований разумнее использовать процентные отношения группи­ровок. В научной публикации следует указывать стати­стические критерии взаимосвязей и их значимости.

Правила процентирования6 вовсе не так просты, как может показаться неопытному исследователю. Ос­новной вопрос: принимать ли за 100% данные по стро­ке или по столбцу?

6 Подробно эти правила излагает X. Хейман [339]

 

Это зависит от двух обстоятельств: от характера выборки обследованных и от логики ана­лиза. Выборка может быть либо репрезентативной (вы­борочная совокупность есть микромодель генеральной совокупности), либо нерепрезентативной. В последнем случае нам как минимум неизвестны пропорции суще­ственных характеристик в генеральной совокупности, или мы знаем, что эти пропорции в выборке не соблюда­ются. Возможна двоякая логика анализа "от причин к следствию" или "от следствий к причинам", что опреде­ляется гипотезой и содержанием данных.

Если выборка представительна и отражает пропор­ции изучаемых групп в генеральной совокупности (дан­ного завода, например), тогда можно вести двоякий ана­лиз данных: по логике "от причин к следствию" и "от следствия к причинам".

Рассмотрим пример. Предположим, что 1000 человек, ра­ботающих на акционерном предприятии, где акции принадлежат исключительно его сотрудникам, распределились в зависи­мости от того, участвуют или не участвуют они в технической и организационной модернизации производства, следующий образом (табл. 10).

 

Таблица 10

Исходная перекрестная группировка данных: статус и участие в инновациях (N= 1000 чел.)

Статус

Участие в инновациях (чел.)

Итого

 

 

участвуют

не участвуют

 

 

Рабочие                 

250

455

705

ИГР                   

140

120

260

Служащие                

10

25

35

Итого                  

400

600

1000

 

Проведем анализ по логике "от возможных причин — к следствию". Предпосылкой более или менее активного учас­тия в разработке нововведений может быть статус работника, тогда как вовлеченность в дела производства сама по себе не может быть причиной того или иного статуса, это — возмож­ное следствие первого фактора. При таком подходе за 100% следует брать данные по строке (табл. 10, а).

 

Вывод: наиболее активные инноваторы — ИГР, наименее активные — служащие. Статус инженерно-технических работ­ников способствует их модернизационной активности в боль­шей мере, чем положение служащих или рабочих данного предприятия.

Теперь проведем анализ по логике "от следствия к при­чинам": 100% суммируются в столбце (табл. 10, б).

 

С логической точки зрения здесь проверяется гипотеза о вкладе каждой категории работников в разработку нововведе­ния, а не гипотеза об их соотносительной активности. Вывод из табл. 10, б: вклад рабочих — наибольший, так как они преобла­дают в составе персонала предприятия. Об относительной же активности рабочих по этим расчетам мы судить не можем.7

7 Имеется в виду, конечно, не значимость, качество предложенных Идей, но их численность. Предложения специалистов-инженеров или администраторов-служащих могут быть более радикальными, чем предложения рабочих.

 

Итак, ретроспективный и проектирующий анализы предполагают различные по содержанию выводы.

 

В репрезентативных выборках возможно проценти-рование "по диагонали" таблицы. Например, для табл. 6

Таблица 10, а

Участие в инновациях как следствие статуса работников

 

Статус

Участие в инновациях (чел.)

Итого

 

участвуют

не участвуют

 

Рабочие                   

35

65                        

100

ИГР                      

64

46                      

100

Служащие                

29

71                    

100

 

Таблица 10, б

Активность персонала в зависимости от статуса работника

Статус

Участие в инновациях (чел.)

 

 

участвуют

не участвуют

Рабочие                         

60

76

ИГР                           

35

20

Служащие                        

5

4

Итого                          

100

100

 

(если данные представительны) можно подсчитать про­центные доли всех 47 выделенных в ней сочетаний возрастных характеристик мужей и жен, из чего, ска­жем, следует, что более всего в изученной совокупности представлены молодые пары в возрасте 20—24 лет, како­вые составляют около 55% от всех пар (504:1838/2= =0,55), среди 50-летних и старше супружеские пары од­ного возраста составляют лишь 5% и т. д.

Если выборка нерепрезентативна, процентирование можно вести только в рамках каждой подвыборки раз­дельно. Обычно такие подвыборки образуют по признакам, являющимся возможными причинами искомых связей: половозрастные, имущественные, этнической принадлеж­ности, шкалы по уровню образования, другим объектив­ным характеристикам социального статуса, места прожи­вания и т. д. Здесь несоответствие долей выборок реаль­ному распределению определенных групп в генеральной совокупности не исказит вывод (логика табл. 10, а). В противном же случае (по логике табл. 10, б) достоверность вывода будет прямо зависеть от представительности выборки.

 

Наконец, в случаях, когда представительность пере­крестной классификации в принципе нельзя установить (например, о ценностных ориентациях и политических взглядах, отношений к партиям, где распределение в ге­неральной совокупности заранее вообще неизвестно), расчет процентов допустим в обоих направлениях и по диагонали с условием, что установленные связи требуют дополнительной проверки, ориентировочны. Для такой проверки используют систему так называемых конт­рольных (опосредующих) переменных.

Анализ взаимосвязи двух переменных с помощью контрольного (опосредующего) фактора — прием, используемый для того, чтобы установить прямые и опосредованные, причинные и сопутствующие связи, а также уточнить их напряженность. Рассмотрим три вымышленных примера, в которых проиллюстрируем основные логические проблемы этого метода.8

8 Задачи этого класса применительно к социологии были впервые сформулированы в 40-е гг. П. Лааарсфел ьдом и П. Кен дал л и получи­ли в дальнейшем более полное логическое обоснование в работах X. Хеймана [339. С. 286—295].

 

Пример 1. Надо определить, имеется ли связь меж­ду интересом людей к познавательным программам телевидения (обозначим как фактор П) и к развлека­тельным программам (фактор Р). Для установления взаимосвязи между этими явлениями используем про­стейший показатель — коэффициент ассоциации двух качественных переменных по Юлу. Чтобы подсчитать коэффициент ассоциации Юла, достаточно фиксировать наличие (+) или отсутствие (-) каждого из двух сопос­тавляемых качеств А к В.

Построим двухмерную классификационную табли­цу (схема 27).

Коэффициент ассоциации Юла (Q) высчитывается по формуле; Q=(ad – cb)/(ad – сb), где (схема 25) частоты а, b, с, d обозначают наличие или отсутствие признака П или Р. Свойства коэффициента: 1>Q>-1; Q=0, если какая-либо из частот (а, b, с или d) равны 0. При значе­нии коэффициента существенно выше или ниже 0 при некотором доверительном интервале (допустимой ошибке) связь имеется.

Допустим, что в нашем примере наблюдается такое распределение (условные числа).

 

Схема 27

Модель перекрестной группировки двух дихотомичес­ких признаков ПиР для расчета коэффициента ассоциации Юла (Q)

 

Px +

Рx-

п +

а

И

п-

с

d

Между П и Р обнаружена весьма высокая связь.

 

Однако эта связь может быть лишь видимостью. Введем контрольную переменную — уровень образова­ния телезрителей (обозначим О) — и получим две двухмерные таблицы: для лиц с высоким (0+) и низ­ким (О~) уровнем образования (табл. 11, а). Подсчита­ем коэффициент Юла для таблиц 11, аи 11, б:

 

Таблица 11

Взаимосвязь интересов телезрителей к познаватель­ным (П) и развлекательным (Р) программам

 

рx+

Рx-

 

П+

410

130

540

П -

130

410

540

 

540

540

1080

 

Таблица 11, а

Взаимосвязь интересов телезрителей к познаватель­ным (П) и развлекательным (Р) программам раздельно для имеющих высокое образование (О+) и низкое образование (О~)

О+

О-

 

П+

 П -

 

 

 П +

П-

 

Г

400

 80

480

Р*        

 400

80

480

р-

50

 10

60

Р-         

 50

10

60

 

 

 

Таблица 11, б

Взаимосвязь между уровнем образования (О) и интере­сом к познавательным программам (П), между уровнем образования и интересом к развлекательным программам (Р)

 

 

П +

П -

 

 

П+

П -

 

О +

450

90

540

О +

480

60

640

О -

90

450

540

О -

во

480

540

 

540

540

1080

 

540

540

1080

Связи между признаками П и Р в производных таб­лицах, выравненных по образованию, не обнаружено. Между тем в исходной табл. 11 связь высокая. Остает­ся предположить, что П и Р зависят от уровня образова­ния, но независимы относительно друг друга. Проверим это предположение, сгруппировав данные так, чтобы выявить связи между контрольным фактором (О — об­разование) и каждым из первоначальных (П и Р) (табл. 11, б). Видно, что связь между образованием и интересом к программам познавательных передач такая же, как между образованием и интересом к развлека­тельным программам, высока.

 

Здесь действует следующее правило: если введение контрольной переменной уменьшает связь между двумя ис­ходными переменными, но связь между контрольной пере­менной и каждой из исходных достаточно высока, то конт­рольная переменная выступает либо в качестве интерпре­тирующей, либо в качестве объясняющей. Различие же меж­ду интерпретацией и объяснением состоит в следующем. Интерпретация — способ истолкования факторов, рассматри­ваемых как посредствующие переменные какого-то процесса, причины которого неясны. Объяснение суть истолкование ряда факторов, рассматриваемых в качестве причинных.

Чтобы иллюстрировать метод обнаружения интерпре­тирующей и объясняющей связи, рассмотрим другой пример, используя ту же логику рассуждения и те же цифровые дан­ные.

Пример 2. Обозначим Пр профессию телезрителей (Пр и Пр2 — это две группы профессий). И+ наличие, И~ отсут­ствие интереса к определенным программам. Для таблицы 11» используя те же данные, что в табл. 10, связь равняется 0,82 по коэффициенту ассоциации Юла (Qnp.K= 0,82).

Введем контрольную переменную О — образование. Перестроив таблицы, как в предыдущем случае, найдем, что в производных связь потерялась: при фиксированном уров­не образования не обнаруживается связи между профессией и интересом к передачам определенного типа. Иначе говоря, люди с высшим образованием — инженеры, врачи, учителя — примерно одинаково интересуются передачами данного класса. Рабочие, продавцы магазинов, служащие учреждений, не имеющие высшего образования, также обнаруживают большую схожесть в отношении к телепрограммам этого класса.

Как и в предыдущем случае, введение контрольной пе­ременной снизило (или в нашем условном примере свело к нулю) связь между исходными факторами. Однако заключе­ние во втором случае будет отличаться от вывода, который следует из первого примера.

В первом примере образование предшествует интересу телезрителей к развлекательным или образовательным программам и потому объясняет связи так: между интере­сом к развлекательным и образовательным программам существует связь сопутствия, ибо, не будучи прямо связанны­ми между собой, обе эти разновидности интересов связаны с третьим фактором — образованием, которое и является при­чинной переменной. Логика объяснений связей между П и Р через О:

Во втором примере контрольная переменная (образова­ние) не предшествует, но действует одновременно с одной из основных переменных (профессия). В этом случае она опос­редует связь между основными факторами и уточняет, интер­претирует ее: дело не столько в профессии, сколько в образо­вании. Логика объяснений связей между П и И через О:

Пр--- О --- И

Пример 3. Возможна ситуация, когда связь между дву­мя исходными переменными после введения контрольной не исчезает и не уменьшается, но она исчезает между одной из исходных переменных и контрольной. Рассмотрим этот вариант на условном примере с телезрителями.

А — интерес телезрителей к программам "Что, где, ког­да?"; В — их интерес к программам "В мире животных". Контрольная переменная (О) — образование.

Имеем серию из трех типов таблиц: исходная, промежуточная и итоговая. Первичная связь такова.

 

Таблица 12

Взаимосвязь между интересом телезрителей к двум типам программ А и В

 

 

В +

В -

 

А +

400

600

1000

А -

100

100

200

 

500

700

1200

 

 

Стратегия социологического иследования

Между интересом к передачам "Что, где, когда?" и "В мире животных" есть незначительная связь в пользу второй (Q=-0,20). Введем контрольную — образование (Табл. 12, а)

Связь усиливается: люди с высоким образованием проявляют больший интерес к передачам "Что, где, ког­да?", люди с низким образованием больше интересуются циклом "В мире животных". Перестроив таблицы, рас­смотрим теперь связи между образованием и интересом к двум типам передач последовательно (табл. 12, б).

Оказывается, что связи между образованием и ин­тересом к программам "Что, где, когда?" (фактор А) нет: люди смотрят или не смотрят эти программы неза­висимо от уровня образования.

Здесь действуют какие-то иные факторы помимо образования. Правда, есть не­значительная связь между уровнем образования и инте­ресом к передачам "В мире животных" (фактор В).

Этот тип анализа можно назвать спецификацией, или уточнением, в отличие от анализа по логике объяс­нения, или интерпретации.

Во всех рассмотренных примерах мы имели дело с тремя переменными. Однако их могло бы быть и боль­ше. Логика анализа при этом остается прежней, меняет­ся лишь численность промежуточных членов в порядке анализа вследствие добавления новых контрольных факторов. Аналогична стратегия поиска взаимосвязей между более чем тремя, притом не дихотомическими, а многочленными качественными или количественными переменными. Принципиальное отличие — в технике анализа.

Вместо измерения ассоциации двух переменных с помощью критерия Юла или Пирсона устанавливаются многофакторные функциональные связи (корреляции) и связи детерминации (регрессионный анализ). Приемы такого анализа рассматриваются в специальной литера­туре по статистике и математическим методам в социологии [см., напр., 79, 160, 199, 285, 266].

Анализ многомерных взаимосвязей и взаимозависимостей — типичная задача в социологии. Как правило, такие зависимости не удается "схватить" сразу каким-то единственным математическим мето­дом. Прибегают к различным средствам анализа в по­исках наиболее "наглядного", убедительного отображе­ния. Один из способов такого рода — метод отображе­ния взаимосвязей в корреляционном графе, предложен­ный эстонским математиком Л. Выханду [40].

Граф — это фигура, состоящая из точек (их называ­ют вершинами графа) и отрезков, соединяющих некоторые из этих точек (ребра графа). О графе мы уже упо­минали, рассматривая социометрические процедуры. Изображение связей в группе с помощью сопрограммы есть граф (рис. 12, с. 316). В социограмме указываются вершины графа (члены группы) и связи между ними (ребра графа).

Бели бы удалось измерить корреляции или тесноту связей между всеми членами группы (вершинами) и со­ответственно этому выделить наиболее близкие и наибо­лее отдаленные связи, такое изображение можно было бы назвать корреляционным графом.

Чтобы построить корреляционный граф, измеряют парные связи между всеми переменными, обозначенны­ми на графе как его вершины. Например, имея пять пе­ременных А, В, С, I) и Е, покажем, как связана каждая из них с каждой другой в матрице интеркорреляций (табл. 13).

 

Таблица 13

Матрица интеркорреляций пяти переменных (А, В, С, D, Е)

 

А

В

С

D

Е

А

1

0,96

0,90

0,01

0,06

В

0,96

1

0,15

0,85

0,95

С

0,90

0,15

1

0,02

0,14

D

0,01

0,85

0,02

1

0,60

Е

0,00

0,95

0,14

0,60

1

Связи между выделенными переменными можно описать графом, изображенном на рис. 16.

Между вершинами Л, В и С существуют взаимосвязи

Кл*=0'96» Клс=0>9°; квс=0'15* Связь RBC можно опус­тить, так как она намного слабее ("длиннее"), чем связь С и В через вершину А.

Рис. 16. Корреляционный граф по методу Выханду.

 

Иными словами, переменная А является для В и С либо объясняющей, либо интерпретирующей (В и С свя­заны как сопутствующие).

Иная связь между вершинами В, D и Е. Все они взаимодействуют на уровне R более 0,60. Но каждая из них связана с вершиной С очень слабо (от 0,02 до 0,14, в графе эти связи опущены). В является промежуточ­ной между А, с одной стороны, Е и D — с другой, так как связи ЕсА гораздо слабее, чем их связи с В, которая, в свою очередь, тесно связана с А

В корреляционном графе отображаются лишь те связи между вершинами, которые соединяют их крат­чайшим путем (т. е. являются наиболее тесными), и опускаются другие, менее тесные связи. На языке тео­рии графов [22] это означает, что мы разрываем замкну­тые дуги и оставляем только те ребра, которые свя­зывают вершины наиболее тесно.

Поиск скрытой (потентной) структуры взаимосвя­зей множества переменных. Эффективная процедура для достижения этой цели — факторный анализ9 [145,148, 151, 210]. Сначала устанавливаются парные

9 Приемы факторного анализа были разработаны психологами и первоначально использовались для выявления структуры интеллекта, а затем — для дифференцирования разнообразных психических свойств, корреляции всех изучаемых переменных, а затем отыс­киваются своего рода корреляционные плеяды или "узлы" связей. Иными словами, выделяют такие пере­менные, которые, будучи наиболее тесно взаимосвязаны в рамках своей плеяды, слабо связаны с другими корре­ляционными узлами. Выявленные "узлы" и есть факто­ры. Название фактора всегда условно и подбирается по ассоциации с теми переменными, которые наиболее сильно связаны с данным фактором — имеют наи­большие "факторные нагрузки".

Приведем пример (табл. 14) из нашего исследования от­ношения рабочих к труду (1976 г., Ленинград), в котором фак­торному анализу подвергнуты оценки удовлетворенности раз­личными элементами производственной ситуации (более 4 ты­сяч рабочих разного характера труда) [233. С. 146—147].

Из табл. 14 видно, что первый фактор до вращения воб­рал в себя с положительными значениями все изучаемые свя­зи, исчерпав почти четверть их вариации. Это показатель объяснительной "силы" фактора, равной в данном случае 23,4%. Наиболее значимы в данном факторе оценки органи­зации труда (0,707), состояния оборудования (0,609), отноше­ний с администрацией (0,647), техники безопасности (0,653), а наименьшие связи обнаруживают оценки содержательных ас­пектов работы: ее разнообразия (0,213), возможности проявить смекалку (0,272) и т. п. Так как в генеральном факторе все изучаемые признаки взаимосвязаны, его можно назвать факто­ром общей удовлетворенности, в котором лидируют оценки условий труда.

Второй фактор, объясняющая сила которого в два раза меньше (12,8%), — биполярный: одни оценки вошли в него с положительными значениями (содержательные аспекты рабо­ты, например разнообразие, возможность проявить смекалку), а другие (условия труда) — с отрицательными. Это указание на то, что имеются две подструктуры связей, которые могут быть прояснены операцией вращения факторов.

После вращения четко обозначились две структурные со­ставляющие: 1-й фактор (достаточно информативный — 21,4%) — фактор условий труда, так как в нем с высокими

фиксированных специальными тестами. Сегодня факторный анализ прочно вошел в арсенал методов социологических исследований.

 

Таблица 14

Факторная матрица оценок рабочими уровня удовлет­воренности различными элементами производственной ситуации (N=4121)

Оцениваемые элементы производственной ситуации

Факторные нагрузки

до вращения факторов

после вращения факторов

I

II

I

II

1. Разнообразив работы

0,213

0,610

—0,072

0,642

2. Важность продукции

0,352

0,482

0,109

0,587

3. Возможность проявить смекалку

0,272

0,096

—0,056

0,745

4. Возможности повышения квалификации

0.3SO

0,478

0,118

0,586

5. Физическая нагрузка

0,275

0,070

0,236

0,191

6. Сменность

0,336

0,134

0,245

0,260

7. Состояние оборудования

0,609

—0,302

0,680

—0,009

8. Организация труда

0,707

—0,311

0,771

0,026

9. Ритмичность работы

0,541

—0,249

0,595

0,009

10. Санитарно-гигиенические условия

0,597

—0,267

0,653

0,018

11. Техника безопасности

0,653

—0,189

0,670

0,112

12. Отношения с администрацией

0,647

—0,052

0,60.6

0,233

13. Заработок

0,415

0,019

0.366

0,196

14. Отношения с товарищами по работе

0,410

0,294

0,242

0,443

Общая информативность, "объяснительная сила" фактора (v)

23,4

12,8

21,4

14,8

 

 

36

2

36

2

 

положительными нагрузками присутствуют оценки удовлетво­ренности именно условиями труда, 2-й фактор (14,8%) — фак­тор удовлетворенности содержательными аспектами работы. При этом в рамках отношения к содержанию труда лидирует творческий аспект — возможность проявить смекалку (0,745), отношение к разнообразию работы (0,642), удовлетворенность тем, насколько важна выпускаемая продукция (0,587), каковы возможности повышения квалификации (0,586). Во втором факторе особо важны организация труда, состояние оборудова­ния, санитарно-гигиенические условия, ритмичность работы и некоторые другие (все с весами около 0,6).

Далее на основе обнаружения этих двух структур начнем разукрупнять факторную модель на более дроб­ные составляющие, каждому обследованному могут быть приписаны оценки по двум интегральным показате­лям (двум факторам): удовлетворенности условиями и содержанием труда. Таким образом, будут получены два обобщенных показателя на каждого обследуемого вместо 14 исходных.

Обратим внимание на то, что те же самые признаки, которые входят в первый фактор с одинаковыми по зна­ку весами, во второй фактор вошли с противоположны­ми по знаку. Иными словами, это значит, что, судя по первому фактору, чем выше удовлетворенность условия­ми труда, тем выше удовлетворенность его содержанием, судя же по второму фактору — ситуация иная: с рос­том удовлетворенности одним из этих аспектов удовлетворенность другим снижается. Такой результат совсем не случаен. В цикле специальных исследований В. С. Магун показал, что подобный дуализм типичен для взаимосвязей между разными парами социологи­ческих и социально-психологических переменных, на­пример, между продуктивностью работника и его удовлетворенностью своим трудом. Но, кроме того, было убедительно продемонстрировано, что в подобных ре­зультатах нет противоречия, ибо разные типы взаимо­связей характерны для разных подвыборок внутри рассматриваемого массива, и подвыборки эти могут быть выделены на основе полученных факторов [147; 148].10

10         См. также использование факторного анализа при исследования социальной идентификации личности [308], изучение латентной структуры страхов и тревог граждан России в 1996 г. [309].

 

Перекрестная группировка по двум и более призна­кам — прямой путь к обнаружению возможных взаи­мосвязей между переменными. Для этого нужно соста­вить таблицу определенным образом, например, подсчи­тать пропорции частот одного признака в зависимости от частот другого. Для неискушенного читателя при из­ложении результатов социологических обследований разумнее использовать процентные отношения группи­ровок. В научной публикации следует указывать стати­стические критерии взаимосвязей и их значимости.

Правила процентирования6 вовсе не так просты, как может показаться неопытному исследователю. Ос­новной вопрос: принимать ли за 100% данные по стро­ке или по столбцу?

6 Подробно эти правила излагает X. Хейман [339]

 

Это зависит от двух обстоятельств: от характера выборки обследованных и от логики ана­лиза. Выборка может быть либо репрезентативной (вы­борочная совокупность есть микромодель генеральной совокупности), либо нерепрезентативной. В последнем случае нам как минимум неизвестны пропорции суще­ственных характеристик в генеральной совокупности, или мы знаем, что эти пропорции в выборке не соблюда­ются. Возможна двоякая логика анализа "от причин к следствию" или "от следствий к причинам", что опреде­ляется гипотезой и содержанием данных.

Если выборка представительна и отражает пропор­ции изучаемых групп в генеральной совокупности (дан­ного завода, например), тогда можно вести двоякий ана­лиз данных: по логике "от причин к следствию" и "от следствия к причинам".

Рассмотрим пример. Предположим, что 1000 человек, ра­ботающих на акционерном предприятии, где акции принадлежат исключительно его сотрудникам, распределились в зависи­мости от того, участвуют или не участвуют они в технической и организационной модернизации производства, следующий образом (табл. 10).

 

Таблица 10

Исходная перекрестная группировка данных: статус и участие в инновациях (N= 1000 чел.)

Статус

Участие в инновациях (чел.)

Итого

 

 

участвуют

не участвуют

 

 

Рабочие                 

250

455

705

ИГР                   

140

120

260

Служащие                

10

25

35

Итого                  

400

600

1000

 

Проведем анализ по логике "от возможных причин — к следствию". Предпосылкой более или менее активного учас­тия в разработке нововведений может быть статус работника, тогда как вовлеченность в дела производства сама по себе не может быть причиной того или иного статуса, это — возмож­ное следствие первого фактора. При таком подходе за 100% следует брать данные по строке (табл. 10, а).

 

Вывод: наиболее активные инноваторы — ИГР, наименее активные — служащие. Статус инженерно-технических работ­ников способствует их модернизационной активности в боль­шей мере, чем положение служащих или рабочих данного предприятия.

Теперь проведем анализ по логике "от следствия к при­чинам": 100% суммируются в столбце (табл. 10, б).

 

С логической точки зрения здесь проверяется гипотеза о вкладе каждой категории работников в разработку нововведе­ния, а не гипотеза об их соотносительной активности. Вывод из табл. 10, б: вклад рабочих — наибольший, так как они преобла­дают в составе персонала предприятия. Об относительной же активности рабочих по этим расчетам мы судить не можем.7

7 Имеется в виду, конечно, не значимость, качество предложенных Идей, но их численность. Предложения специалистов-инженеров или администраторов-служащих могут быть более радикальными, чем предложения рабочих.

 

Итак, ретроспективный и проектирующий анализы предполагают различные по содержанию выводы.

 

В репрезентативных выборках возможно проценти-рование "по диагонали" таблицы. Например, для табл. 6

Таблица 10, а

Участие в инновациях как следствие статуса работников

 

Статус

Участие в инновациях (чел.)

Итого

 

участвуют

не участвуют

 

Рабочие                   

35

65                        

100

ИГР                      

64

46                      

100

Служащие                

29

71                    

100

 

Таблица 10, б

Активность персонала в зависимости от статуса работника

Статус

Участие в инновациях (чел.)

 

 

участвуют

не участвуют

Рабочие                         

60

76

ИГР                           

35

20

Служащие                        

5

4

Итого                          

100

100

 

(если данные представительны) можно подсчитать про­центные доли всех 47 выделенных в ней сочетаний возрастных характеристик мужей и жен, из чего, ска­жем, следует, что более всего в изученной совокупности представлены молодые пары в возрасте 20—24 лет, како­вые составляют около 55% от всех пар (504:1838/2= =0,55), среди 50-летних и старше супружеские пары од­ного возраста составляют лишь 5% и т. д.

Если выборка нерепрезентативна, процентирование можно вести только в рамках каждой подвыборки раз­дельно. Обычно такие подвыборки образуют по признакам, являющимся возможными причинами искомых связей: половозрастные, имущественные, этнической принадлеж­ности, шкалы по уровню образования, другим объектив­ным характеристикам социального статуса, места прожи­вания и т. д. Здесь несоответствие долей выборок реаль­ному распределению определенных групп в генеральной совокупности не исказит вывод (логика табл. 10, а). В противном же случае (по логике табл. 10, б) достоверность вывода будет прямо зависеть от представительности выборки.

 

Наконец, в случаях, когда представительность пере­крестной классификации в принципе нельзя установить (например, о ценностных ориентациях и политических взглядах, отношений к партиям, где распределение в ге­неральной совокупности заранее вообще неизвестно), расчет процентов допустим в обоих направлениях и по диагонали с условием, что установленные связи требуют дополнительной проверки, ориентировочны. Для такой проверки используют систему так называемых конт­рольных (опосредующих) переменных.

Анализ взаимосвязи двух переменных с помощью контрольного (опосредующего) фактора — прием, используемый для того, чтобы установить прямые и опосредованные, причинные и сопутствующие связи, а также уточнить их напряженность. Рассмотрим три вымышленных примера, в которых проиллюстрируем основные логические проблемы этого метода.8

8 Задачи этого класса применительно к социологии были впервые сформулированы в 40-е гг. П. Лааарсфел ьдом и П. Кен дал л и получи­ли в дальнейшем более полное логическое обоснование в работах X. Хеймана [339. С. 286—295].

 

Пример 1. Надо определить, имеется ли связь меж­ду интересом людей к познавательным программам телевидения (обозначим как фактор П) и к развлека­тельным программам (фактор Р). Для установления взаимосвязи между этими явлениями используем про­стейший показатель — коэффициент ассоциации двух качественных переменных по Юлу. Чтобы подсчитать коэффициент ассоциации Юла, достаточно фиксировать наличие (+) или отсутствие (-) каждого из двух сопос­тавляемых качеств А к В.

Построим двухмерную классификационную табли­цу (схема 27).

Коэффициент ассоциации Юла (Q) высчитывается по формуле; Q=(ad – cb)/(ad – сb), где (схема 25) частоты а, b, с, d обозначают наличие или отсутствие признака П или Р. Свойства коэффициента: 1>Q>-1; Q=0, если какая-либо из частот (а, b, с или d) равны 0. При значе­нии коэффициента существенно выше или ниже 0 при некотором доверительном интервале (допустимой ошибке) связь имеется.

Допустим, что в нашем примере наблюдается такое распределение (условные числа).

 

Схема 27

Модель перекрестной группировки двух дихотомичес­ких признаков ПиР для расчета коэффициента ассоциации Юла (Q)

 

Px +

Рx-

п +

а

И

п-

с

d

Между П и Р обнаружена весьма высокая связь.

 

Однако эта связь может быть лишь видимостью. Введем контрольную переменную — уровень образова­ния телезрителей (обозначим О) — и получим две двухмерные таблицы: для лиц с высоким (0+) и низ­ким (О~) уровнем образования (табл. 11, а). Подсчита­ем коэффициент Юла для таблиц 11, аи 11, б:

 

Таблица 11

Взаимосвязь интересов телезрителей к познаватель­ным (П) и развлекательным (Р) программам

 

рx+

Рx-

 

П+

410

130

540

П -

130

410

540

 

540

540

1080

 

Таблица 11, а

Взаимосвязь интересов телезрителей к познаватель­ным (П) и развлекательным (Р) программам раздельно для имеющих высокое образование (О+) и низкое образование (О~)

О+

О-

 

П+

 П -

 

 

 П +

П-

 

Г

400

 80

480

Р*        

 400

80

480

р-

50

 10

60

Р-         

 50

10

60

 

 

 

Таблица 11, б

Взаимосвязь между уровнем образования (О) и интере­сом к познавательным программам (П), между уровнем образования и интересом к развлекательным программам (Р)

 

 

П +

П -

 

 

П+

П -

 

О +

450

90

540

О +

480

60

640

О -

90

450

540

О -

во

480

540

 

540

540

1080

 

540

540

1080

Связи между признаками П и Р в производных таб­лицах, выравненных по образованию, не обнаружено. Между тем в исходной табл. 11 связь высокая. Остает­ся предположить, что П и Р зависят от уровня образова­ния, но независимы относительно друг друга. Проверим это предположение, сгруппировав данные так, чтобы выявить связи между контрольным фактором (О — об­разование) и каждым из первоначальных (П и Р) (табл. 11, б). Видно, что связь между образованием и интересом к программам познавательных передач такая же, как между образованием и интересом к развлека­тельным программам, высока.

 

Здесь действует следующее правило: если введение контрольной переменной уменьшает связь между двумя ис­ходными переменными, но связь между контрольной пере­менной и каждой из исходных достаточно высока, то конт­рольная переменная выступает либо в качестве интерпре­тирующей, либо в качестве объясняющей. Различие же меж­ду интерпретацией и объяснением состоит в следующем. Интерпретация — способ истолкования факторов, рассматри­ваемых как посредствующие переменные какого-то процесса, причины которого неясны. Объяснение суть истолкование ряда факторов, рассматриваемых в качестве причинных.

Чтобы иллюстрировать метод обнаружения интерпре­тирующей и объясняющей связи, рассмотрим другой пример, используя ту же логику рассуждения и те же цифровые дан­ные.

Пример 2. Обозначим Пр профессию телезрителей (Пр и Пр2 — это две группы профессий). И+ наличие, И~ отсут­ствие интереса к определенным программам. Для таблицы 11» используя те же данные, что в табл. 10, связь равняется 0,82 по коэффициенту ассоциации Юла (Qnp.K= 0,82).

Введем контрольную переменную О — образование. Перестроив таблицы, как в предыдущем случае, найдем, что в производных связь потерялась: при фиксированном уров­не образования не обнаруживается связи между профессией и интересом к передачам определенного типа. Иначе говоря, люди с высшим образованием — инженеры, врачи, учителя — примерно одинаково интересуются передачами данного класса. Рабочие, продавцы магазинов, служащие учреждений, не имеющие высшего образования, также обнаруживают большую схожесть в отношении к телепрограммам этого класса.

Как и в предыдущем случае, введение контрольной пе­ременной снизило (или в нашем условном примере свело к нулю) связь между исходными факторами. Однако заключе­ние во втором случае будет отличаться от вывода, который следует из первого примера.

В первом примере образование предшествует интересу телезрителей к развлекательным или образовательным программам и потому объясняет связи так: между интере­сом к развлекательным и образовательным программам существует связь сопутствия, ибо, не будучи прямо связанны­ми между собой, обе эти разновидности интересов связаны с третьим фактором — образованием, которое и является при­чинной переменной. Логика объяснений связей между П и Р через О:

Во втором примере контрольная переменная (образова­ние) не предшествует, но действует одновременно с одной из основных переменных (профессия). В этом случае она опос­редует связь между основными факторами и уточняет, интер­претирует ее: дело не столько в профессии, сколько в образо­вании. Логика объяснений связей между П и И через О:

Пр--- О --- И

Пример 3. Возможна ситуация, когда связь между дву­мя исходными переменными после введения контрольной не исчезает и не уменьшается, но она исчезает между одной из исходных переменных и контрольной. Рассмотрим этот вариант на условном примере с телезрителями.

А — интерес телезрителей к программам "Что, где, ког­да?"; В — их интерес к программам "В мире животных". Контрольная переменная (О) — образование.

Имеем серию из трех типов таблиц: исходная, промежуточная и итоговая. Первичная связь такова.

 

Таблица 12

Взаимосвязь между интересом телезрителей к двум типам программ А и В

 

 

В +

В -

 

А +

400

600

1000

А -

100

100

200

 

500

700

1200

 

 

Стратегия социологического иследования

Между интересом к передачам "Что, где, когда?" и "В мире животных" есть незначительная связь в пользу второй (Q=-0,20). Введем контрольную — образование (Табл. 12, а)

Связь усиливается: люди с высоким образованием проявляют больший интерес к передачам "Что, где, ког­да?", люди с низким образованием больше интересуются циклом "В мире животных". Перестроив таблицы, рас­смотрим теперь связи между образованием и интересом к двум типам передач последовательно (табл. 12, б).

Оказывается, что связи между образованием и ин­тересом к программам "Что, где, когда?" (фактор А) нет: люди смотрят или не смотрят эти программы неза­висимо от уровня образования.

Здесь действуют какие-то иные факторы помимо образования. Правда, есть не­значительная связь между уровнем образования и инте­ресом к передачам "В мире животных" (фактор В).

Этот тип анализа можно назвать спецификацией, или уточнением, в отличие от анализа по логике объяс­нения, или интерпретации.

Во всех рассмотренных примерах мы имели дело с тремя переменными. Однако их могло бы быть и боль­ше. Логика анализа при этом остается прежней, меняет­ся лишь численность промежуточных членов в порядке анализа вследствие добавления новых контрольных факторов. Аналогична стратегия поиска взаимосвязей между более чем тремя, притом не дихотомическими, а многочленными качественными или количественными переменными. Принципиальное отличие — в технике анализа.

Вместо измерения ассоциации двух переменных с помощью критерия Юла или Пирсона устанавливаются многофакторные функциональные связи (корреляции) и связи детерминации (регрессионный анализ). Приемы такого анализа рассматриваются в специальной литера­туре по статистике и математическим методам в социологии [см., напр., 79, 160, 199, 285, 266].

Анализ многомерных взаимосвязей и взаимозависимостей — типичная задача в социологии. Как правило, такие зависимости не удается "схватить" сразу каким-то единственным математическим мето­дом. Прибегают к различным средствам анализа в по­исках наиболее "наглядного", убедительного отображе­ния. Один из способов такого рода — метод отображе­ния взаимосвязей в корреляционном графе, предложен­ный эстонским математиком Л. Выханду [40].

Граф — это фигура, состоящая из точек (их называ­ют вершинами графа) и отрезков, соединяющих некоторые из этих точек (ребра графа). О графе мы уже упо­минали, рассматривая социометрические процедуры. Изображение связей в группе с помощью сопрограммы есть граф (рис. 12, с. 316). В социограмме указываются вершины графа (члены группы) и связи между ними (ребра графа).

Бели бы удалось измерить корреляции или тесноту связей между всеми членами группы (вершинами) и со­ответственно этому выделить наиболее близкие и наибо­лее отдаленные связи, такое изображение можно было бы назвать корреляционным графом.

Чтобы построить корреляционный граф, измеряют парные связи между всеми переменными, обозначенны­ми на графе как его вершины. Например, имея пять пе­ременных А, В, С, I) и Е, покажем, как связана каждая из них с каждой другой в матрице интеркорреляций (табл. 13).

 

Таблица 13

Матрица интеркорреляций пяти переменных (А, В, С, D, Е)

 

А

В

С

D

Е

А

1

0,96

0,90

0,01

0,06

В

0,96

1

0,15

0,85

0,95

С

0,90

0,15

1

0,02

0,14

D

0,01

0,85

0,02

1

0,60

Е

0,00

0,95

0,14

0,60

1

Связи между выделенными переменными можно описать графом, изображенном на рис. 16.

Между вершинами Л, В и С существуют взаимосвязи

Кл*=0'96» Клс=0>9°; квс=0'15* Связь RBC можно опус­тить, так как она намного слабее ("длиннее"), чем связь С и В через вершину А.

Рис. 16. Корреляционный граф по методу Выханду.

 

Иными словами, переменная А является для В и С либо объясняющей, либо интерпретирующей (В и С свя­заны как сопутствующие).

Иная связь между вершинами В, D и Е. Все они взаимодействуют на уровне R более 0,60. Но каждая из них связана с вершиной С очень слабо (от 0,02 до 0,14, в графе эти связи опущены). В является промежуточ­ной между А, с одной стороны, Е и D — с другой, так как связи ЕсА гораздо слабее, чем их связи с В, которая, в свою очередь, тесно связана с А

В корреляционном графе отображаются лишь те связи между вершинами, которые соединяют их крат­чайшим путем (т. е. являются наиболее тесными), и опускаются другие, менее тесные связи. На языке тео­рии графов [22] это означает, что мы разрываем замкну­тые дуги и оставляем только те ребра, которые свя­зывают вершины наиболее тесно.

Поиск скрытой (потентной) структуры взаимосвя­зей множества переменных. Эффективная процедура для достижения этой цели — факторный анализ9 [145,148, 151, 210]. Сначала устанавливаются парные

9 Приемы факторного анализа были разработаны психологами и первоначально использовались для выявления структуры интеллекта, а затем — для дифференцирования разнообразных психических свойств, корреляции всех изучаемых переменных, а затем отыс­киваются своего рода корреляционные плеяды или "узлы" связей. Иными словами, выделяют такие пере­менные, которые, будучи наиболее тесно взаимосвязаны в рамках своей плеяды, слабо связаны с другими корре­ляционными узлами. Выявленные "узлы" и есть факто­ры. Название фактора всегда условно и подбирается по ассоциации с теми переменными, которые наиболее сильно связаны с данным фактором — имеют наи­большие "факторные нагрузки".

Приведем пример (табл. 14) из нашего исследования от­ношения рабочих к труду (1976 г., Ленинград), в котором фак­торному анализу подвергнуты оценки удовлетворенности раз­личными элементами производственной ситуации (более 4 ты­сяч рабочих разного характера труда) [233. С. 146—147].

Из табл. 14 видно, что первый фактор до вращения воб­рал в себя с положительными значениями все изучаемые свя­зи, исчерпав почти четверть их вариации. Это показатель объяснительной "силы" фактора, равной в данном случае 23,4%. Наиболее значимы в данном факторе оценки органи­зации труда (0,707), состояния оборудования (0,609), отноше­ний с администрацией (0,647), техники безопасности (0,653), а наименьшие связи обнаруживают оценки содержательных ас­пектов работы: ее разнообразия (0,213), возможности проявить смекалку (0,272) и т. п. Так как в генеральном факторе все изучаемые признаки взаимосвязаны, его можно назвать факто­ром общей удовлетворенности, в котором лидируют оценки условий труда.

Второй фактор, объясняющая сила которого в два раза меньше (12,8%), — биполярный: одни оценки вошли в него с положительными значениями (содержательные аспекты рабо­ты, например разнообразие, возможность проявить смекалку), а другие (условия труда) — с отрицательными. Это указание на то, что имеются две подструктуры связей, которые могут быть прояснены операцией вращения факторов.

После вращения четко обозначились две структурные со­ставляющие: 1-й фактор (достаточно информативный — 21,4%) — фактор условий труда, так как в нем с высокими

фиксированных специальными тестами. Сегодня факторный анализ прочно вошел в арсенал методов социологических исследований.

 

Таблица 14

Факторная матрица оценок рабочими уровня удовлет­воренности различными элементами производственной ситуации (N=4121)

Оцениваемые элементы производственной ситуации

Факторные нагрузки

до вращения факторов

после вращения факторов

I

II

I

II

1. Разнообразив работы

0,213

0,610

—0,072

0,642

2. Важность продукции

0,352

0,482

0,109

0,587

3. Возможность проявить смекалку

0,272

0,096

—0,056

0,745

4. Возможности повышения квалификации

0.3SO

0,478

0,118

0,586

5. Физическая нагрузка

0,275

0,070

0,236

0,191

6. Сменность

0,336

0,134

0,245

0,260

7. Состояние оборудования

0,609

—0,302

0,680

—0,009

8. Организация труда

0,707

—0,311

0,771

0,026

9. Ритмичность работы

0,541

—0,249

0,595

0,009

10. Санитарно-гигиенические условия

0,597

—0,267

0,653

0,018

11. Техника безопасности

0,653

—0,189

0,670

0,112

12. Отношения с администрацией

0,647

—0,052

0,60.6

0,233

13. Заработок

0,415

0,019

0.366

0,196

14. Отношения с товарищами по работе

0,410

0,294

0,242

0,443

Общая информативность, "объяснительная сила" фактора (v)

23,4

12,8

21,4

14,8

 

 

36

2

36

2

 

положительными нагрузками присутствуют оценки удовлетво­ренности именно условиями труда, 2-й фактор (14,8%) — фак­тор удовлетворенности содержательными аспектами работы. При этом в рамках отношения к содержанию труда лидирует творческий аспект — возможность проявить смекалку (0,745), отношение к разнообразию работы (0,642), удовлетворенность тем, насколько важна выпускаемая продукция (0,587), каковы возможности повышения квалификации (0,586). Во втором факторе особо важны организация труда, состояние оборудова­ния, санитарно-гигиенические условия, ритмичность работы и некоторые другие (все с весами около 0,6).

Далее на основе обнаружения этих двух структур начнем разукрупнять факторную модель на более дроб­ные составляющие, каждому обследованному могут быть приписаны оценки по двум интегральным показате­лям (двум факторам): удовлетворенности условиями и содержанием труда. Таким образом, будут получены два обобщенных показателя на каждого обследуемого вместо 14 исходных.

Обратим внимание на то, что те же самые признаки, которые входят в первый фактор с одинаковыми по зна­ку весами, во второй фактор вошли с противоположны­ми по знаку. Иными словами, это значит, что, судя по первому фактору, чем выше удовлетворенность условия­ми труда, тем выше удовлетворенность его содержанием, судя же по второму фактору — ситуация иная: с рос­том удовлетворенности одним из этих аспектов удовлетворенность другим снижается. Такой результат совсем не случаен. В цикле специальных исследований В. С. Магун показал, что подобный дуализм типичен для взаимосвязей между разными парами социологи­ческих и социально-психологических переменных, на­пример, между продуктивностью работника и его удовлетворенностью своим трудом. Но, кроме того, было убедительно продемонстрировано, что в подобных ре­зультатах нет противоречия, ибо разные типы взаимо­связей характерны для разных подвыборок внутри рассматриваемого массива, и подвыборки эти могут быть выделены на основе полученных факторов [147; 148].10

10         См. также использование факторного анализа при исследования социальной идентификации личности [308], изучение латентной структуры страхов и тревог граждан России в 1996 г. [309].