Понятие и значение контент-анализа в политологических исследованиях.

Лекция № 2. Контент-анализ.

Химия ощущений ( запаха и вкуса) будет разобрана на семинаре.

Белки мышечной ткани – миозин, актин, тропомиозин.

Надо знать строение толстого( молекула миозина) и тонкого филамента ( актина) (структуру см. в учебнике «Химия» С.А.Пузаков стр. 608 - 609).

Понятие, основные термины, процедура и интерпретация результатов контент-анализа. История метода.

История метода. Понятие контент-анализа. Контент-анализ в политических исследованиях. Виды контент-анализа, основные категории и этапы исследования Интерпретация результатов. Компьютерные программы анализа текстов (TACT, BAAЛ, Wordtabulator и др.) Проведение контент-анализа при помощи текстового процессора MS Word.

В условиях меняющейся внутриполитической ситуации избирательный процесс играет немалую роль в становлении взаимоотношений между властью и обществом, между государственной властью и местным самоуправлением. Пожалуй, любой участник избирательного процесса претендует на обладание программой - определенным набором идей, проектов - по которой избиратели могут судить о его возможной дальнейшей деятельности, а также о том, стоит ли голосовать за данную кандидатуру. Вполне естественно, что каждый кандидат в ходе предвыборной кампании стремится привлечь на свою сторону как можно большее количество избирателей, а, соответственно, ориентируется на их ценности при составлении программы будущей партии. Однако можно предположить, что здесь мы можем столкнуться с завуалированностью информации, высказываниями «между строк». Добраться до истины в данном случае можно только тогда, когда вы тщательно исследуете документ, несущий в себе информацию. Одним из наиболее подходящих для такого рода исследования методов является метод контент-анализа.

Этим термином принято обозначать методику выявления частоты появления в тексте определенных, интересующих исследователя характеристик, с помощью которой появляется возможность сделать некоторые выводы относительно намерений создателя данного текста или возможных реакций адресата. Применение метода контент-анализа в политологических исследованиях позволяет более глубоко и всесторонне изучать пути формирования депутатского корпуса а, следовательно, влиять на подобное формирование.

Метод контент-анализа широко применяется в политологических исследованиях. Так как основным объектом контент-анализа являются документальные источники, политическая сфера жизни общества предоставляет исследователю огромное количество единиц анализа, которые удобно и нужно изучать, используя количественный подход. Среди таких документальных источников: протоколы заседаний органов власти (Государственной Думы, законодательных органов всех уровней), планы проведения заседаний, количество и содержательная сторона политических решений всех органов власти и многое другое.

Отдельный интерес у исследователей вызывает деятельность средств массовой информации и коммуникации, направленная на политическую сферу жизни общества. Это может быть количество и суть статей на политические темы, вопросы, обсуждаемые политическими обозревателями СМИ, исследование других проблем, направленных на выявление степени влияния СМИ на политическую жизнь.

Наконец, метод контент-анализа предоставляет исследователю возможность изучения такого аспекта политической жизни как функционирование избирательной системы. Исследование документов избирательных кампаний позволяет лучше понять механизм избирательного процесса, выявить его закономерности, объяснить и научиться повторять выигрышные ходы избирательных стратегий кандидатов на выборные посты.

Метод широко используется исследователями в случаях работы с документальной информацией, когда существует необходимость в сравнении с большой точностью однопорядковых данных. В политологии для использования контент-анализа открываются широкие возможности, которые демонстрируются на примере прикладного исследования индивидуальных избирательных стратегий кандидатов в депутаты, в которым главной единицей анализа является политическая листовка.

В нашей стране метод контент-анализа стал использоваться сравнительно недавно, где-то в середине XX века, но сейчас становится все более популярным. Его применяют в практике изучения писем, поступающих в различные организации и органы управления, в социальной психологии и педагогике, в криминологии, искусствоведении, этнографии, для анализа исторических текстов и установления авторства или подлинности того или иного текста.

Пионерами к-а считают Лассвелла Г. Ныне метод контент-анализа стал сильнейшим средством анализа различных документов. В политологических исследованиях контент-анализ позволяет анализировать различные текстовые документы, а, следовательно, создавать, например, образ той или иной партии. Под текстами в контент-анализе понимают книги, книжные главы, эссе, интервью, дискуссии, заголовки газетных статей и сами статьи, исторические документы, дневниковые записи, речи выступлений, рекламные тексты и т.д.

2. Виды контент-анализа, основные категории и этапы исследования Интерпретация результатов В современной науке наблюдается два полюса восприятия метода контент-анализа: Количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания. Качественный контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания. Различие двух подходов довольно легко проиллюстрировать примерами. В 50-е годы западные аналитики на основе количественного анализа статей газеты "Правда" обнаружили резкое снижение числа ссылок на Сталина. Отсюда они сделали закономерный вывод, что последователи Сталина стремятся дистанцироваться от него. С другой стороны, качественный аналитик мог бы сделать аналогичный вывод на основе единственного факта, что в публичной речи одного из партийных функционеров, посвященной победе СССР в Великой Отечественной войне, Сталин вообще не был упомянут. Прежде такое было бы немыслимо. Очевидно, что количественный контент-анализ легче поддается реализации в компьютерных программах. Именно по этой причине в дальнейшем мы будем вести речь исключительно о методах количественного контент-анализа. Следует обратить внимание на то, что когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит - личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и пр.

Первым можно назвать этап в развитии контент-анализа, когда внимание исследователей было направлено в основном просто на подсчет частот появления в текстах различных слов или тем. Г.Г. Почепцов условно относит появление контент-анализа к 18 веку, "когда в Швеции частота появления тем, связанных с Христом, использовалась для принятия решения о еретичности книги.

Однако, просто частота появления того или иного слова или темы мало что говорят. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр. В качестве реального примера такого анализа текстов можно привести анализ президентских посланий стране, с которыми обратился Б.Клинтон в 1994 и 1995 годах. Эти послания содержат от 7000 до 10000 слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и др. По изменению относительных частот в посланиях 1994 и 1995 гг. были сделаны выводы об изменении политики государства в различных областях. Т.е. все эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Например, в послании 1995 года больше внимания было уделено вопросам образования, семьи, но меньше внимания - преступности, международным делам, социальной помощи. Это дало основания для того, чтобы судить о приоритетах правительства США.

В приведенном выше примере было упомянуто понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Можно сказать, что посредством категорий в контент-анализе представлены определенные концептуальные образования. Так в случае с посланиями Б.Клинтона была образована категория ЭКОНОМИКА, в которую входили слова - экономика, безработица, инфляция. В категорию СЕМЬЯ входили слова – ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов, позволяет судить о внимании, уделенном в послании тем или иным вопросам. Очевидно, что от качества составления таких категорий во многом зависит качество результатов анализа. Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. Два основных типа задач, решаемых с его помощью: 1. Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, задача выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними. 2. Задача отслеживания динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа. Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.

Относительные частоты позволяют сравнивать два и более текстов, но иногда требуется сделать вывод на основе анализа лишь одного текста. Например, имеется текст выступления депутата Думы и требуется оценить, насколько оно агрессивно. Прежде всего для решения этой задачи должна быть составлена категория агрессивно окрашенной лексики. После этого мы можем сравнить текст выступления нашего депутата с выступлениями других и сказать, кто из них агрессивнее. Но от нас требуется не это, от нас требуется оценить степень агрессивности выступления. Очевидно, что для ответа на этот вопрос нам потребуется некоторая норма, своеобразная нулевая отметка агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка мы как раз и можем сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названиемz-score и вычисляемая по формуле (N-E)/(стандартное отклонение), где N - количество слов данной категории, реально встретившихся в тексте, а E- ожидаемое число вхождений слов данной категории в текст. Величина E вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте. Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного. Очевидно, что норма для него будет отличаться от нормы для среднего человека. Поэтому для оценки уровня агрессивности профессионального военного требуются другие нормы, которые могут быть получены путем дополнительной статистической обработки представительной выборки текстов, характерных для военной среды.

Дальнейшее развитие контент-анализа требовало более тонких методов анализа текстов. К середине 50-х годов исследователи стали все больше уделять внимания не простому наличию или отсутствию категорий в тексте, а связям между категориями. Для этого обращают внимание на совместную встречаемость (cooccurence) слов различных категорий. Например, для каждого предложения текста мы можем выяснить, слова каких категорий в нем встречаются. После этого легко подсчитать обычный коэффициент корреляции, который даст нам силу связи между категориями и знак этой связи. Может оказаться, что для некоторых категорий наблюдается тенденция их совместного употребления, а для других - наоборот. В качестве гипотетического примера можно привести газетную статью, в которой наблюдается совместное употребление категорий ПРАВИТЕЛЬСТВО и НЕГАТИВ. Интересно то, что в некоторых случаях это может быть отражением сознательной позиции автора статьи, а в некоторых - связью на уровне подсознания. Понятно, что изучение связей между категориями значительно расширяет круг задач, которые может решать контент-анализ.

Представим, что мы взяли статью натуралиста о змеях и решили ее проанализировать. Для этого мы отметили в тексте все предложения, в которые входит слово змея, и составили статистику слов из этих предложений. Можно предположить, что частотными в этих предложениях окажутся слова: яд, ядовитый, укус, ползать, длинный... т.е. те слова, которыми наиболее часто характеризуются змеи. Таким образом, наш формальный метод анализа текстов позволил выделить существенные признаки, характеризующие змей. В англоязычной литературе такие контексты употребления слов как раз и называют collocations, каликейшенс. Ценность описанного метода анализа текстов очевидна, так как позволяет на основе формальных методов извлекать из массивов текстов содержательную информацию.

Метод нахождения контекстов употребления слов (collocations) допускает дальнейшее развитие. Выбрав предложения, в которых встречается конкретное слово или категория, мы получили некоторую подвыборку текста, к которой в свою очередь применимы все методы контент-анализа. Т.е. контексты употребления слов и категорий в свою очередь могут быть подвергнуты контент-анализу - выяснению простых частот категорий, относительных частот, оценок категорий относительно нормы и т.д. Если выразиться образно, то контекстный анализ позволяет выделить в тексте несколько тематических нитей и анализировать их отдельно. Очевиден огромный потенциал контекстного анализа при мониторинге больших объемов информации, так как он позволяет полностью автоматизировать весь процесс сбора информации.

Использование при контент-анализе определенного набора категорий задает концептуальную сетку, в терминах которой и анализируется текст. От того, насколько удачен набор используемых категорий, зависит качество результатов анализа. Поэтому исследователей давно интересовала задача автоматической категоризации слов текста, т.е. выделение обсуждаемых в нем тем. Были предложены ряд подходов для решения этой задачи. Следует отметить, что автоматическая категоризация возможна лишь в том случае, если объем анализируемых текстов достаточно велик.

1) Для этого используется лингвистические и статистическиея методики, например кластерный анализ или анализ связей. В распоряжении текстологов находится ряд программ автоматизированного анализа для компьютеров IBM. Среди них назовем ARRAS, TACT, TextPack V, SYREX, SATO.[11]

Основные требования, предъявляемые к контент-анализу:

1) исчерпаемость

2) взаимоисключаемость

3) надежность

Исчерпаемость подразумевает использование всех смысловых единиц. Если вы исследуете соц-классовый состав города, то выбрав в качестве смысловой единицы –наименование сословия: мещан, уд. Крестьян, и т.д. нельзя не принимать во внимание и священников, солдат и т.п.

Взаимоисключаемость: смысловые единицы не должны пересекаться, например, если исследуя национально-религиозный состав города выделили католиков, то уже нельзя выделять поляков или литовцев и т.п.

Надежность: смысловые единицы должны быть постоянны и однозначны. Например такая единица как дворовый человек может включать в себя и крепостного у помещика и вольноотпущенного мещанина и т.д. следовательно эта единица нарушает принцип надежности.

Основные принципы контент-анализа: объективность, систематичность и обобщенность. Основная трудность контент анализа: перевод качественных признаков в количественную форму.

Итак контент-анализ оперирует четырьмя основными понятиями:

1) единица текста – единица содержания

2) смысловая единица – качественная единица, категория анализа

3) единица счета

4) индикатор – признак

Методы контент-анализа привлекались при исследованиях различных по времени и характеру источников. Ближе всего к социологическому фундаменту этого метода оказались исследования прессы. Именно для периодики контент-анализ был разработан, и благодаря интересу к процессам массовой коммуникации историки получили возможность формального анализа текстов.

Таким образом, как правило источником исследования являются газетные заметки, частные письма, записи в дневниках и т.д.

В этих случаях, одна заметка, письмо, запись принимается за единицу текста. Вопросы, ответы на которые вы хотите получить принимаются за смысловую единицу. Отношение «респондентов» к этим вопросам (полож,отр, нейтральное) – за индикатор. Частота употребления смысловых единиц принимается за единицу счета.

Отметим, что компьютерный анализ текстов вобрал в себя достижения нескольких научных подходов. Выяснилось, например, что при обработке и анализе текста для исследователей важное значение имеет показ частоты встречаемости различных классов лексики (concordances). Это позволяет точно определять значение конкретных слов и фраз в контексте. Совместная встречаемость частей речи впервые была использована на практике при изучении точного значения слов Бога и пророков в библейских текстах. Первое компьютеризированное исследование в данной гуманитарной области было проведено священником Бузой для составления частотного словаря работ Фомы Аквинского. В дальнейшем католические теологи, вставшие у истоков исторической количественной филологии, создали самостоятельную школу компьютеризированного анализа сакральной литературы с центром во французском католическом университете г. Лувен.

Так, интересна работа декана факультета журналистики Московского Международного Университета профессора Михальской А.К. о речевом поведении политиков. В своей работе она пишет о том, что настоящий современный политик - это вовсе не «Homo faciens» - человек действующий, а, скорее, «Homo eloquens» - человек ГОВОРЯЩИЙ, причем говорящий публично Михальская А.К. Метод анализа и описания речевого поведения политика в интервью. Михальская А.К. считает, что для того чтобы узнать что-нибудь о поведении того или иного политического деятеля, необходимо проанализировать его речь. «Обычно политология использует для этого метод контент-анализа текстов, но современная лингвистика обладает некоторыми концепциями и подходами, значительно расширяющими сферу и возможности такого познания. Особенно интересны в этой связи предлагаемые методология и методика дискурс-анализа - исследования не собственно текстов в обычном смысле этого слова, а текстов речевого поведения. К изучению политического дискурса эта методика применяется нечасто и непоследовательно, обширных системных и систематических исследований такого рода пока нет ни у нас, ни за рубежом. Тем не менее попытка такого исследования была предпринята и была разработана методика дискурс-анализа применительно именно к дискурсу политики, в сочетании с некоторыми методами сравнительно-исторической риторики. Фрагменты результатов данного исследования были представлены читателям Независимой газеты Михальская А.К. О речевом поведении политиков // НГ-сценарии. 1999..№ 6 (40). Для описания и сравнения особенностей речевого поведения героев нашего политического Олимпа В работе проводится анализ речевого поведения таких известных политических деятелей как Жириновский В.В., Зюганов Г.А., Лебедь А.И., Лужков Ю.М., Примаков Е.М., Явлинский Г.А. исследователи выбрали несколько параметров.

Численное выражение первого из них называется индексом многословия. (Можно брать и обратную величину и называть ее индексом лаконичности). Индекс многословия - это средний объем ответа политика на один вопрос интервьюера. Высчитывается, как и все прочие параметры, отдельно для каждого интервью, потом усредняется по всем интервью каждого политика. Измеряется в знаках (строках) текста.

Второй важнейший параметр речевого поведения политика в интервью - речевое лидерство. Индекс лидерства для текстов интервью в прессе получается простым суммированием величин двух второстепенных параметров - индекса тематической новизны и индекса оценки вопросов.

Исследования речевого поведения человека, выполненные учеными англо-американской лингвопрагматической традиции, показали, что важнейшие речевые черты социального лидера в беседе - это, во-первых, постоянное введение собственных новых тем (а не простое следование темам беседы, которые предлагаются другими участниками), во-вторых, постоянное стремление оценивать высказывания партнеров и словесно выражать свои оценки.

Третий важнейший параметр речевого поведения политиков - их способность к коммуникативному сотрудничеству, т.е. налаживанию и поддержанию продуктивного взаимодействия в процессе беседы.

Результаты исследования получились очень интересными, на основе проделанного анализа попытались выявить наиболее дипломатичного и тактичного политика (им оказался Примаков Е.М.)

5rik.ru

Материалы для учебы и работы

Понятие и значение контент-анализа в политологических исследованиях.