1. Методология работы с открытыми источниками информации
К оглавлению1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1618 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
51 52 53 54 55 56 57 58 59 60 62
При планировании работы по аналитической обработке прессы прежде всего надо определиться с ее целью, затем выяснить информационные потребности потребителей информации (в том числе и самой СБ) и только после этого приступать к подбору источников информации.
Совершенно очевидно, что для превращения опосредованной информации в проблемно-ориентированный информационный массив нужно использовать целенаправленный подход по активному восприятию постоянно поступающих информационных потоков. В отличие от широко распространенного мнения, совсем необязательно 24 часа в сутки проводить за чтением печатной продукции. Для этого вполне достаточно выделить полчаса своего рабочего времени. Самое важное в этой работе – правильно подобрать источники информации, обработать их с использованием принципа «ключевых слов» и, наконец, грамотно организовать сортировку, классификацию и хранение уже отобранной информации.
Очень часто данные в различных источниках многократно дублируют друг друга. Поэтому простое количественное увеличение обрабатываемых источников приводит только к перегрузке аналитика без видимых результатов улучшения качества его работы. Ситуация с избытком информационного шума в обрабатываемых информационных массивах намного более опасна, чем информационный голод. Так, например, специализированные организации для создания ежедневной сводки объемом в одну страницу с оценочным суждением по одной проблеме обрабатывают информационный массив объемом примерно в 7 млн. слов.
Работая с конкретной публикацией, необходимо из всех проблем, отраженных в ней, выбрать только то, что отвечает вашим информационным потребностям, и в дальнейшем обращать внимание только на это.
Для качественного анализа пригодности того или иного периодического издания достаточно взять несколько его номеров за определенный период, например за неделю, и составить по рубрикам список всех опубликованных там статей. Работа это довольно скучная и нудная, но зато с течением времени она себя окупит с лихвой. Это приводит к тому, что из всего широкого спектра, имеющегося на рынке средств массовой информации, выбирается именно тот его сегмент, который наиболее полно совпадает с вашими информационными потребностями.
Так, например, в период холодной войны для американской военной разведки наибольший интерес представляли 11 наиболее крупных советских военных журналов и газет, включая «Коммунист Вооруженных Сил», «Военно-исторический журнал», «Военный вестник». Кроме того, для детализации отдельных вопросов советского военного строительства аналитики РУМО внимательно изучали значительное число менее известных и более специализированных периодических изданий.
Кстати, необходимо отметить то, что с течением времени приоритеты в исследовании СМИ могут заметно измениться.
Так, в конце 80-х годов важнейшими источниками информации для американцев по военно-политическим проблемам были газеты «Красная звезда», на которую приходится 75% всех ссылок, и «Правда» (16%) (см. график 2).
В начале 90-х годов интерес к российским открытым источникам (в частности, газетам) стал более диверсифицированным.
В плане практического применения к обсуждению можно предложить два принципиально отличающихся, но, тем не менее, в равной мере имеющих право на жизнь организационных подхода к первичной обработке материалов СМИ.
2.1. Использование собственных возможностей по обработке СМИ
Все материалы СМИ, поступающие на хозяйствующий субъект, могут обрабатываться ответственным за это лицом и согласно разработанному классификатору соответствующим образом сортироваться и храниться, в том числе и СМИ, поступающие в электронном виде.
При невозможности выделения отдельной штатной единицы для работы с прессой сотрудники СБ должны начинать свой рабочий день с ее изучения.
За каждым из них закрепляется по две-три центральных и местных газеты, и на утренней оперативке у руководства помимо постановки задания на день каждый сотрудник должен делать краткий обзор наиболее интересных публикаций прессы в своей зоне ответственности. В процессе этой своеобразной «политинформации» происходит обмен мнениями, и расставляются акценты. На данных мероприятиях каждый оперативник выстраивает для себя приблизительную модель вопросов разведывательного плана, которые он должен будет отработать «в поле».
В течение дня на встречах с источниками, в полуофициальных или неофициальных беседах эта информация уточняется и перепроверяется, приобретая необходимую надежность.
Как уже говорилось ранее, материалы СМИ в обязательном порядке должны накапливаться в электронном виде. Районные и многотиражные газеты, как правило, не имеющие электронных версий, придется сканировать. Центральные и областные, имеющие собственные сайты, можно бесплатно скачивать из Интернета или за относительно невысокую плату приобретать в редакции издания (сегодня при газетах, службах новостей очень часто имеются подразделения, где можно получить досье на фирмы или людей именно по совокупности событий, публикаций о них).
Хранение материалов в электронном виде имеет некоторые нюансы. Их можно заносить в базу данных интегрированного банка данных, но это в связи с трудоемкостью и значительными временными затратами актуально только для особо значимых событий. В основном для работы с объемными неструктурированными информационными массивами применяются программы полнотекстового поиска. Более подробно анализ этого программного обеспечения дан в приложении 1 к этой главе.
Программы данного класса широко используются аналитическими подразделениями при работе с большими объемами текстовой и иной информации (ленты электронных новостей, архивы прессы, статей, рефератов, отчетов).
От себя лично в качестве хорошо зарекомендовавшего себя средства хочу порекомендовать разработку НПК «Кронос-Информ» «CROS». В ближайших планах НПК «Кронос-Информ» интеграция средств «CROS» в новую версию популярной профессиональной СУБД «Cronos Plus», что позволит объединять под общим управлением базы данных массив;ы текстовой и другой информации.
Демо-версию программы «CROS» и СУБД «Cronos Plus» можно найти на сайте НПК «Кронос-Информ» по адресу в Интернете: http://www.cronos.ru.
2.2. Использование сторонних возможностей по обработке СМИ
Информация может закупаться на стороне, чем должны заниматься специально выделенные люди. Иногда бывает так, что функции первичной обработки материалов СМИ дешевле передать сторонним лицам, нежели проводить ее силами собственных сотрудников. В первичной обработке прессы значительную помощь могут оказать работники библиотек, которые очень дешево и достаточно профессионально выполнят мониторинг требуемых изданий, в том числе и иностранных.
В недалеком прошлом дайджесты прессы в основном готовили надомники. Это значительно снижало нагрузку на оперативный состав, разгружая его от монотонной и малоквалифицированной работы.
Режим конспирации для того, чтобы исполнители не имели понятия, что именно, для кого и зачем они делают, обеспечивался весьма просто. В газету давалось объявление о надомной работе, связанной с обработкой корреспонденции. Диспетчеры на телефоне принимали заявки от желающих, встречались с ними, оценивая их профпригодность. Для закрепления интереса к работе новому работнику выплачивался аванс. С ним заключался договор о временной работе на месяц с возможностью его дальнейшего продления. В финансовом плане это было достаточно экономично, так как если исчезала необходимость в обработке некоторых изданий, то никаких единовременных выплат по сокращению не производилось.
Доставка материалов по обработчикам осуществлялась курьером, до которого диспетчером доводилось задание: взять газеты, разнести по адресам, разъяснить, что надо сделать, и через некоторое время вернуть готовые материалы диспетчеру.
Каждый диспетчер работал только с одним обработчиком и одним курьером. Уровень конспирации при данной форме организации работы был очень велик, так как даже при большом желании вряд ли кто сможет размотать всю причинно-следственную цепочку.
В настоящее время таким способом удобно и выгодно обрабатывать местную прессу, не представленную в электронном виде.
2.3. Аналитическая обработка
По своей направленности печатные материалы можно разделить на следующие категории: обзорные статьи, статьи дискредитирующего плана, заказные рекламные статьи и статьи, разглашающие коммерческую тайну.
Методология обработки печатных изданий выделяет следующие категории данных: базовая информация (для дальнейшей аналитической обработки); текущая информация о фактах; субъективно-оценочные категории, содержащие оценки и предупреждения.
Естественно, что огульно принимать на веру все, что сообщается в прессе, было бы весьма опрометчиво. Для подтверждения этого тезиса достаточно провести простейший эксперимент: прочтите статью по теме, которую вы знаете досконально. Вряд ли вы не обнаружите в ней несколько ошибок. Из этого стоит сделать вывод о том, что то же самое может происходить и с другими материалами СМИ.
Причину этого долго искать не надо. Так, например, по данным Ч. Ханта и В. Зартарьяна, только 4% французских журналистов, допускаемых в Центр информации журналистов, профессионально владеют экономической и финансовой проблематикой, в то время как этим вопросам посвящено более 20% размещенного в прессе материала.
Искажение реального состояния дел может происходить и по другой причине. Читая статью, необходимо проанализировать не только излагаемые в ней факты, но и понять и прочувствовать личное отношение автора к излагаемой проблеме.
Во многом этому помогает приблизительное знание принадлежности средств массовой информации конкретным финансово-промышленным группировкам, хотя ангажированная линия может проводиться достаточно тонко. Средства массовой информации всегда выражают интересы своих хозяев. Это аксиома и для нас, и для Запада. Но если западники вмешиваются в политику СМИ только в наиболее драматичные моменты, например во время войн и выборов, то у нас пресса контролируется даже по мелочам. Никогда не стоит преувеличивать «независимость» журналистов – то, что СМИ подстраиваются под «хозяина», известно всем. Материал, написанный журналистом и подвергнувшийся редакторской правке, может сильно отличаться от первоначального варианта. Но это не повод для отказа от информационной работы, когда много СМИ, много хозяев, то много и разных политических мнений.
Так, например, согласно данным, приведенным в книге Я.Ш. Паппэ «Олигархи», расклад связей крупнейших российских финансово-промышленных групп и контролируемых ими в той или иной степени СМИ выглядел по состоянию на конец 1999 года следующим образом:
РАО «ГАЗПРОМ» – газеты «РТ-Трибуна», «Труд»; журналы «Фактор», «Компания», «Нефтегазовая вертикаль»; телекомпании «Прометей», «НТВ».
«ЛУКОЙЛ» – газета «Известия», журнал «Нефть России», телекомпания «REN-TV».
«ИНТЕРРОС» – «ОНЭКСИМ» – газеты «Известия», «Комсомольская правда»; журнал «Эксперт».
Группа Березовского – Абрамовича – газеты «Независимая газета», «Новые Известия», «Российские вести»; журнал «Огонек»; Издательский дом «Коммерсант»; радиостанция «Наше радио»; телекомпании ОРТ и ТВ-6.
Группа «МОСТ» – газета «Сегодня»; журналы «Семь дней», «Итоги»; радиостанция «Эхо Москвы»; телекомпании «НТВ», «НТВ+», «ТНТ». В свете последних изменений часть этих изданий контролируется персоналиями, весьма близкими к главному российскому «приватизатору».
АФК «СИСТЕМА» – газеты «Вечерняя Москва», «Литературная газета», «Росая», «Культура»; радиостанции «Говорит Москва», «М-Радио», «Авторадио», «Спортивное радио»; телекомпания «ТВ-Столица».
Интернетовские новостные сайты по информации журнала «Власть» № 48 (399) от 5 декабря 2000 года:
Группа «МОСТ» – сайт «НТВ» (http://www.ntv.ru) (http://www.echo.msk.ru).
НК «ЮКОС» – (http://www.gazeta.ru).
Группа Plaza (Умар Джабраилов) – (http://www.obozrenie.ru).
Группа Березовского – Абрамовича – сайт «Независимой газеты» (http://www.ng.ru), совместный сайт ОТР, «Коммерсанта» и «Агентства политических новостей» (http://www.postfactum.ru).
Близкий к Кремлю политтехнолог Глеб Павловский – http://www.strana.ru.
Сложнее с государственными средствами массовой информации, так, например, рупор российского официоза новостная программа РТР «Вести» регулярно выдает в эфир антиправительственные «косухи» (заказные материалы).
Сравнительный анализ информации из различных источников может привести к любопытным выводам. В этом плане весьма интересен следующий пассаж А. Даллеса из его книги «Исскуство разведки»: «Любопытно, например, сравнить опубликованный в советской печати официальный текст выступления Хрущева с тем, что он сказал в действительности. Его ставшая знаменитой реплика, брошенная западным дипломатам на приеме в польском посольстве в Москве 18 ноября 1956 г., „Мы вас похороним", не была доподлинно процитирована в отчетах советской прессы, хотя многие ее слышали».
Из чего Даллес делает следующие выводы: «По-видимому, правительственная печать имеет право подвергать высказывания премьера Хрущева цензуре, вероятно, с его санкции. Позднее, когда до Хрущева дошел смысл сказанного им тогда, он дал своим словам пространное и смягчающее толкование. Следовательно, знать, как и почему содержание какой-либо истории искажается, зачастую так же интересно, как и ее фактическое содержание. Нередко случается, что существует одна версия для „внутреннего потребления", вторая – для других стран коммунистического блока и третья – для зарубежных стран. Бывают случаи, когда „сказки", которые коммунистические режимы рассказывают собственным народам, свидетельствуют о появлении у них новых слабых мест и возникновении новых опасностей».
Журналистика и вопросы экономической разведки и контрразведки, конкуренции, формирования имиджа, престижа и рейтинговых оценок чрезвычайно тесно связаны, на профессиональном жаргоне все это называется «активные мероприятия».
Конечно, очень многое в прессу не попадает или попадает в искаженном виде, также имеется вероятность сознательного дезинформирования в ходе ведущейся оперативной игры. Кстати, одной из самых эффективных методик дезинформирования является «белый шум». Эта методика состоит в том, что выдается огромное количество новостей, которое просто не поддается сортировке.
Также существуют методики по созданию и продвижению в массовое сознание специального информационного повода, отвлекающего внимание от действительно стоящей (или компрометирующей) информации. На оперативном жаргоне это называется «отвлечение внимания на негодный объект».
Так, например, самым известным примером применения этой методики является «историческая» фраза Чубайса о том, что рыночная стоимость «ваучера» – две автомашины «Волга», т.е. для массового сознания чековая приватизация должна была ассоциироваться с приличной по тем временам суммой. Что было дальше? Где они, две «Волги»? Имена владельцев заводов, газет, пароходов, я думаю, вам хорошо известны.
В дальнейшем теме «активных мероприятий» и технологиям дезинформации будет посвящена отдельная глава, а пока мы продолжим наш разговор об аналитической обработке материалов СМИ.
Прежде всего при анализе информационных материалов внимание должно концентрироваться на следующих ключевых моментах:
количество позитивных и негативных по отношению к хозяйствующему субъекту публикаций (контент-анализ); круг их авторов, а по возможности и заказчиков; степень монополизации данной темы;
имеющиеся взаимосвязи между рекламными объявлениями конкурентов и заказными статьями в отношении того или иного хозяйствующего субъекта; наличие в изучаемых материалах сбалансированной оценки происходящего.
Таким образом, анализ собранного информационного массива позволяет установить характер взаимосвязей между следующими основными элементами:
содержание и направленность сообщения;
источник сообщения;
личность журналиста, его связи и контакты в деловых и политических кругах.
Возвращаясь к методике оценки достоверности и верификации информации, получаемой из СМИ, следует заметить, что в ряде случаев бывает достаточно смыслового совпадения данных из объективно независимых источников. Как уже отмечалось выше, «независимость» источников оценивается по просачивающейся информации о принадлежности органа массовой информации к конкретной финансово-промышленной группе или коммерческому банку. Если информация подтверждается источниками, принадлежащими различным конкурирующим финансово-промышленным группировкам, то велика вероятность ее достоверности.
А теперь более подробно поговорим о применении технологии контент-анализа.
В специальной литературе дается различное толкование этого термина: статистическая семантика; техника для объективного количественного анализа содержания коммуникации; техника для получения выводов при помощи объективного и систематического установления характеристик сообщений.
Если же говорить простым языком, то контент-анализ – содержательный анализ на основе формализованных методик. Он состоит в выделении в тексте некоторых ключевых понятий или иных смысловых единиц и в последующем подсчете частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации. Так, анализ содержания проводится не интуитивно, не на «глазок», а с помощью методик, обеспечивающих получение достоверного и объективного результата.
В этом случае объективность контент-анализа определяется тем, что каждый шаг может быть произведен только на основе явно сформулированных правил и процедур. Поэтому в качестве верификации (проверки) необходимо повторение того же результата другим исследователем на том же материале. В гуманитарных науках достаточно сложно прийти к единому мнению, мы можем опросить 50 экспертов, и они дадут нам 50 различных результатов. В отличие от этого контент-анализ является довольно точной исследовательской техникой.
Для более полной характеристики метода необходимо добавить следующее. Первое: все данные статистики вербального материала используются для формулирования выводов о невербальных аспектах, например о тех или иных характеристиках адресата и адресанта. Поэтому текстовой материал здесь представляется промежуточным объектом. Нас интересует вовсе не текст. И второе: само по себе выяснение частоты употребления, например, журналистом X такого-то слова с такой-то частотой не является контент-анализом. Контент-анализ – это всегда сопоставление двух потоков. Например, сопоставление двух газет как двух вербальных потоков. Возможно сопоставление невербального и вербального потоков: данных о рождаемости и информации о детях-героях в литературных журналах. Возможно сопоставление данного вербального потока и нормы: частоты употребления определенного слова в статьях определенного журналиста и стандартной частоты употребления этого слова в языке нашего времени. Основные этапы контент-анализа следующие:
а) формулировка задачи, определение программы исследования;
б) определение выборки (той части текстов, которые достаточны для анализа всего массива публикаций и обеспечивают репрезентативность выборки);
в) определение единого семантического толкования ключевых понятий исследования;
г) составление кода, перечня характеристик текста, отвечающих задаче исследования (единиц анализа);
д) составление рабочего документа, кодированной карточки и инструкции кодировщику (человеку, который будет работать с текстом, фиксировать частоту употребления единиц текста);
е) составление сметы исследования;
ж) компьютерная обработка данных;
з) предъявление результатов исследования.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность).
Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует.
Контент-анализ используется в таких областях, как изучение социальных оценок тех или иных событий, анализ пропаганды, методов журналистики, изучение арсенала средств массовой коммуникации, психологические, психоаналитические исследования. Этот диапазон охватывает, по подсчетам исследователей, 60% всех работ.
Что можно подсчитывать в вербальном потоке, какие типичные исследовательские модели существуют? Можно подсчитывать:
а) частоту;
б) наличие/отсутствие каких-то тем;
в) связь между темами;
г) основные темы.
Алгоритм проведения контент-анализа.
1. Определиться с выбором смысловых единиц. Это могут быть оскорбления и угрозы, призывы и порывы благородного негодования, элементы личной позиции автора или что-то другое, т.е. все то, что необходимо выявить.
2. Составить перечень поисковых смысловых единиц, определить предметную область поиска (ПОП). ПОП – это все оперативные версии и гипотезы о соответствующих риск-факторах в деятельности предприятия.
Далее следует выявление в исследуемом тексте индикаторов – моделей оформления каждой смысловой единицы языковыми средствами. Теоретически их число может быть огромным, но с учетом тяготения людей к накатанным стереотипам в практической работе реальное число индикаторов не так уж и велико. Индикаторы вписываются рядом с каждой смысловой единицей. На этом же этапе нужно определиться с единицей счета: чем будет мерить? Обычно учитываются частота употребления смысловой единицы и такие ее количественные характеристики, как число строк, площадь газетной полосы или длительность вещания. Теперь мы имеем четкую систему правил для анализа материала.
3. Анализ может проводиться как вручную, так и с помощью компьютерных программ анализа текстовой информации. В компьютерном варианте инструментария достаточно отсканировать печатный лист, распознать отсканированное и обработать компьютерной программой анализа. На выходе вы получаете полную «картинку» материала с указанием его возможной направленности в ту или иную сторону и соответствующее обоснование – комментарии полученных выводов. Компьютерные программы хороши для обработки больших массивов информации и для отслеживания динамик и тенденции в сообщениях. Например, отдельный блок программы по мере поступления новой информации подшивает полученные выводы к общей композиции исследований данного объекта. Контент-анализ дополняется динамическими изменениями содержания информации. Специалисты выделяют в контент-анализе два направления.
1. Количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.
2. Качественный контент-анализ позволяет делать выводы даже на основе единичного присутствия или отсутствия определенной характеристики содержания.
Различие двух подходов можно проиллюстрировать на примере работы «советологов» в 50-е годы. Проводя количественный анализ статей газеты «Правда», западные аналитики обнаружили резкое снижение числа ссылок на Сталина. На основании этого был сделан вывод о том, что преемники Сталина стремятся дистанцироваться от него.
Качественный анализ подтвердил этот вывод тем, что в публичной речи одного из партийных деятелей КПСС, посвященной победе СССР в Великой Отечественной войне, Сталин вообще не был упомянут. Ранее такое было просто немыслимо.
Методика количественного контент-анализ более легко поддается реализации в виде специального программного обеспечения.
Следует обратить внимание на то, что когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, – личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и пр.
Однако просто частота появления того или иного слова или темы мало что говорит. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр.
В качестве реального примера такого анализа текстов можно привести анализ президентских посланий стране, с которыми обратился Б. Клинтон в 1994 и 1995 годах. Эти послания содержат от 7000 до 10 000 слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и др. По изменению относительных частот в посланиях 1994 и 1995 годов были сделаны выводы об изменении политики государства в различных областях. То есть все эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Например, в послании 1995 года больше внимания было уделено вопросам образования, семьи, но меньше внимания – преступности, международным делам, социальной помощи. Это дало основания для того, чтобы судить о приоритетах правительства США.
В приведенном выше примере было упомянуто понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Можно сказать, что посредством категорий в контент-анализе представлены определенные концептуальные образования. Так, в случае с посланиями Б. Клинтона была образована категория ЭКОНОМИКА, в которую входили слова экономика, безработица, инфляция. В категорию СЕМЬЯ входили слова ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов, позволяет судить о внимании, уделенном в послании тем или иным вопросам.
Очевидно, что от качества составления таких категорий во многом зависит качество результатов анализа. Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. Существует два основных типа задач, решаемых с его помощью.
Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними.
Вторая задача – отслеживание динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.
Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
Так, например, после того как в США был учрежден Консультативный комитет по урану, который стал наблюдать за ядерными исследованиями, была введена строгая цензура на все научные публикации в этой области. Последняя открытая работа американского ученого Макмиллана была напечатана в «Физикал ревью» 15 июня 1940 года.
На этот факт обратил внимание начальник научно-технической разведки СССР Леонид Романович Квасников. Вскоре этот факт подтвердил нью-йоркский резидент Г.Б. Овакимян. Предварительный вывод советской разведки был однозначен: американцы всерьез занялись созданием ядерного оружия, что впоследствии подтвердила агентурная информация.
Относительные частоты позволяют сравнивать два и более текстов, но иногда требуется сделать вывод на основе анализа лишь одного текста.
Например, имеется текст выступления депутата Думы, и требуется оценить, насколько оно агрессивно. Прежде всего для решения этой задачи должна быть составлена категория агрессивно окрашенной лексики. После этого мы можем сравнить текст выступления нашего депутата с выступлениями других и сказать, кто из них агрессивнее. Но от нас требуется не это, от нас требуется оценить степень агрессивности выступления. Очевидно, что для ответа на этот вопрос нам потребуется некоторая норма, своеобразная нулевая отметка агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка, мы как раз и можем сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названием z-score и вычисляемая по формуле
(N – Е)/(стандартное отклонение),
где N – количество слов данной категории, реально встретившихся в тексте, а Е – ожидаемое число вхождений слов данной категории в текст. Величина Е вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте.
При аналитической обработке прессы применяется и так называемый метод «окон фактов». Его во время Второй мировой войны активно использовала американская разведка для изучения немецкой промышленности по открытым публикациям. Смысл метода состоит в том, чтобы из каждой конкретной публикации извлечь только несомненные факты, часто совершенно неинтересные и тривиальные. Сопоставление подобных «атомарных» фактов способно дать совершенно неожиданные новые знания.
В нашей стране еще с советских времен любят и умеют читать между строк, поэтому в качестве курьезного примера применения метода сопоставления фактов можно привести старый анекдот про землетрясение, когда средства массовой информации сообщают, что жертв и разрушений нет. А некоторое время спустя в центральной прессе под заголовком «Очевидное – невероятное» появляется статья о вернувшейся домой собаке, которая пропала во время последнего землетрясения со стадом овец и пятью пастухами.
В 70-80-е годы этот метод был применен для анализа развития американской промышленности, в результате чего на свет появилась весьма интересная книга Дж. Нэсбитта (Naisbitt, J. Megatrends. Ten New Directions Transforming our Lives), описывающая десять главных тенденций в развитии США того времени, которые не были видны простым глазом, но стали совершенно очевидны при обработке исходной фактуры по данной методике.
А теперь в качестве примера давайте рассмотрим следующее сообщение в прессе: «Новый директор Apple Стив Джобс заявил, что компания стала возрождаться и в 1999 год перейдет с прибылью 100 млн. долларов». Из этой фразы можно извлечь только тот несомненный факт, что в 1998 году директором Apple был некто Джобе. Далее по газетным публикациям о Джобсе можно составить описание его жизненного пути, а заодно провести анализ прибыльности возглавляемых им компаний в зависимости от его прихода и ухода.
Поскольку факты, собираемые подобным образом, имеют простую структуру, то по ним достаточно легко построить причинно-следственную цепочку, например «К – продукт компании „А" 1997 г.», «Д – технический директор компании „А" с 1996 по 1998 годы», следовательно, можно создать новый факт: «Д руководил выпуском продукта К в компании „А"». Или при наличии факта «Н – сотрудник компании „А" с 1995 года» можно автоматически создать факт «Н и Д знакомы», имеющий определенную степень достоверности, и попробовать продлить цепочку знакомств дальше.
Системный подход (метод мозаики) к обработке прессы можно проиллюстрировать следующим примером. В 30-е годы в Лондоне вышла книга эмигрировавшего в Англию немецкого журналиста Бертольда Якоба. В ней он охарактеризовал 168 генералов и ведущих работников гитлеровского генерального штаба. По личному приказу Гитлера гестапо выкрало журналиста и доставило в Берлин с целью выяснения источников секретной информации Якоба. «Все, что опубликовано в моей книге, – заявил он на допросе, – я почерпнул из газет. Основание для утверждения, что генерал-майор Гаазе командует 17-й дивизией, расположенной в Нюрнберге, я извлек из некролога, помещенного в местной газете. В ней говорилось, что на похоронах присутствовал генерал Гаазе, командующий 17-й дивизией. В ульмской газете среди светских новостей я нашел данные о свадьбе дочери полковника Вирова с неким Штеммерманом. В заметке упоминалось, что Виров командует 30б-м полком 25-й дивизии. Майор Штеммерман был назван офицером службы связи этой дивизии. В газете сообщалось, что он приехал из Штутгарта, где расквартирована его дивизия…». На этом допрос закончился{Сергеев Ф.М. Тайное орудие агрессии: Подрывная деятельность США против СССР. – М.: Мысль, 1984.}.
Еще один интересный пример можно найти в книге Г.Р. Берндорфа «Шпионаж». Накануне Первой мировой войны военную разведку Германии очень сильно интересовали данные об изменениях в итальянских береговых укреплениях. Для решения этой задачи в июле 1914 года в Милане было открыто бюро объявлений, которое выписывало практически все выходящие в Италии газеты, вплоть до самых мелких деревенских листков. Хозяйкой бюро являлась весьма эффектная дама – Анна Мари Лессер, больше известная под псевдонимом «Мадемуазель Доктор». Не тратя время на сон, она в течение нескольких суток, днем и ночью наносила на крупномасштабную карту Италии сведения из газетных объявлений военных комендатур о наборе персонала на земляные и бетонные работы. Более детально масштабы строительства оценивались по месту проведения работ агентами-маршрутниками.
Сегодня горячей порой сбора различной открытой информации являются предвыборные кампании кандидатов в законодательные и исполнительные органы власти. Интересен анализ публикаций «за» и «против» различных кандидатов, фиксация факта поддержки того или иного кандидата. При квалифицированном сборе и компьютерной обработке информации в ИБД можно выстроить очень интересные схемы, особенно четко это можно отследить в регионах, где вопросам оперативного легендирования уделяют значительно меньше внимания, чем в центре. Так, установление взаимосвязей по предвыборным штабам и партийным спискам позволяет заранее выявить возможный расклад групп «поддержки» того или иного хозяйствующего субъекта в органах законодательной или исполнительной власти. Пример приведен в приложении 2.
При планировании работы по аналитической обработке прессы прежде всего надо определиться с ее целью, затем выяснить информационные потребности потребителей информации (в том числе и самой СБ) и только после этого приступать к подбору источников информации.
Совершенно очевидно, что для превращения опосредованной информации в проблемно-ориентированный информационный массив нужно использовать целенаправленный подход по активному восприятию постоянно поступающих информационных потоков. В отличие от широко распространенного мнения, совсем необязательно 24 часа в сутки проводить за чтением печатной продукции. Для этого вполне достаточно выделить полчаса своего рабочего времени. Самое важное в этой работе – правильно подобрать источники информации, обработать их с использованием принципа «ключевых слов» и, наконец, грамотно организовать сортировку, классификацию и хранение уже отобранной информации.
Очень часто данные в различных источниках многократно дублируют друг друга. Поэтому простое количественное увеличение обрабатываемых источников приводит только к перегрузке аналитика без видимых результатов улучшения качества его работы. Ситуация с избытком информационного шума в обрабатываемых информационных массивах намного более опасна, чем информационный голод. Так, например, специализированные организации для создания ежедневной сводки объемом в одну страницу с оценочным суждением по одной проблеме обрабатывают информационный массив объемом примерно в 7 млн. слов.
Работая с конкретной публикацией, необходимо из всех проблем, отраженных в ней, выбрать только то, что отвечает вашим информационным потребностям, и в дальнейшем обращать внимание только на это.
Для качественного анализа пригодности того или иного периодического издания достаточно взять несколько его номеров за определенный период, например за неделю, и составить по рубрикам список всех опубликованных там статей. Работа это довольно скучная и нудная, но зато с течением времени она себя окупит с лихвой. Это приводит к тому, что из всего широкого спектра, имеющегося на рынке средств массовой информации, выбирается именно тот его сегмент, который наиболее полно совпадает с вашими информационными потребностями.
Так, например, в период холодной войны для американской военной разведки наибольший интерес представляли 11 наиболее крупных советских военных журналов и газет, включая «Коммунист Вооруженных Сил», «Военно-исторический журнал», «Военный вестник». Кроме того, для детализации отдельных вопросов советского военного строительства аналитики РУМО внимательно изучали значительное число менее известных и более специализированных периодических изданий.
Кстати, необходимо отметить то, что с течением времени приоритеты в исследовании СМИ могут заметно измениться.
Так, в конце 80-х годов важнейшими источниками информации для американцев по военно-политическим проблемам были газеты «Красная звезда», на которую приходится 75% всех ссылок, и «Правда» (16%) (см. график 2).
В начале 90-х годов интерес к российским открытым источникам (в частности, газетам) стал более диверсифицированным.
В плане практического применения к обсуждению можно предложить два принципиально отличающихся, но, тем не менее, в равной мере имеющих право на жизнь организационных подхода к первичной обработке материалов СМИ.
2.1. Использование собственных возможностей по обработке СМИ
Все материалы СМИ, поступающие на хозяйствующий субъект, могут обрабатываться ответственным за это лицом и согласно разработанному классификатору соответствующим образом сортироваться и храниться, в том числе и СМИ, поступающие в электронном виде.
При невозможности выделения отдельной штатной единицы для работы с прессой сотрудники СБ должны начинать свой рабочий день с ее изучения.
За каждым из них закрепляется по две-три центральных и местных газеты, и на утренней оперативке у руководства помимо постановки задания на день каждый сотрудник должен делать краткий обзор наиболее интересных публикаций прессы в своей зоне ответственности. В процессе этой своеобразной «политинформации» происходит обмен мнениями, и расставляются акценты. На данных мероприятиях каждый оперативник выстраивает для себя приблизительную модель вопросов разведывательного плана, которые он должен будет отработать «в поле».
В течение дня на встречах с источниками, в полуофициальных или неофициальных беседах эта информация уточняется и перепроверяется, приобретая необходимую надежность.
Как уже говорилось ранее, материалы СМИ в обязательном порядке должны накапливаться в электронном виде. Районные и многотиражные газеты, как правило, не имеющие электронных версий, придется сканировать. Центральные и областные, имеющие собственные сайты, можно бесплатно скачивать из Интернета или за относительно невысокую плату приобретать в редакции издания (сегодня при газетах, службах новостей очень часто имеются подразделения, где можно получить досье на фирмы или людей именно по совокупности событий, публикаций о них).
Хранение материалов в электронном виде имеет некоторые нюансы. Их можно заносить в базу данных интегрированного банка данных, но это в связи с трудоемкостью и значительными временными затратами актуально только для особо значимых событий. В основном для работы с объемными неструктурированными информационными массивами применяются программы полнотекстового поиска. Более подробно анализ этого программного обеспечения дан в приложении 1 к этой главе.
Программы данного класса широко используются аналитическими подразделениями при работе с большими объемами текстовой и иной информации (ленты электронных новостей, архивы прессы, статей, рефератов, отчетов).
От себя лично в качестве хорошо зарекомендовавшего себя средства хочу порекомендовать разработку НПК «Кронос-Информ» «CROS». В ближайших планах НПК «Кронос-Информ» интеграция средств «CROS» в новую версию популярной профессиональной СУБД «Cronos Plus», что позволит объединять под общим управлением базы данных массив;ы текстовой и другой информации.
Демо-версию программы «CROS» и СУБД «Cronos Plus» можно найти на сайте НПК «Кронос-Информ» по адресу в Интернете: http://www.cronos.ru.
2.2. Использование сторонних возможностей по обработке СМИ
Информация может закупаться на стороне, чем должны заниматься специально выделенные люди. Иногда бывает так, что функции первичной обработки материалов СМИ дешевле передать сторонним лицам, нежели проводить ее силами собственных сотрудников. В первичной обработке прессы значительную помощь могут оказать работники библиотек, которые очень дешево и достаточно профессионально выполнят мониторинг требуемых изданий, в том числе и иностранных.
В недалеком прошлом дайджесты прессы в основном готовили надомники. Это значительно снижало нагрузку на оперативный состав, разгружая его от монотонной и малоквалифицированной работы.
Режим конспирации для того, чтобы исполнители не имели понятия, что именно, для кого и зачем они делают, обеспечивался весьма просто. В газету давалось объявление о надомной работе, связанной с обработкой корреспонденции. Диспетчеры на телефоне принимали заявки от желающих, встречались с ними, оценивая их профпригодность. Для закрепления интереса к работе новому работнику выплачивался аванс. С ним заключался договор о временной работе на месяц с возможностью его дальнейшего продления. В финансовом плане это было достаточно экономично, так как если исчезала необходимость в обработке некоторых изданий, то никаких единовременных выплат по сокращению не производилось.
Доставка материалов по обработчикам осуществлялась курьером, до которого диспетчером доводилось задание: взять газеты, разнести по адресам, разъяснить, что надо сделать, и через некоторое время вернуть готовые материалы диспетчеру.
Каждый диспетчер работал только с одним обработчиком и одним курьером. Уровень конспирации при данной форме организации работы был очень велик, так как даже при большом желании вряд ли кто сможет размотать всю причинно-следственную цепочку.
В настоящее время таким способом удобно и выгодно обрабатывать местную прессу, не представленную в электронном виде.
2.3. Аналитическая обработка
По своей направленности печатные материалы можно разделить на следующие категории: обзорные статьи, статьи дискредитирующего плана, заказные рекламные статьи и статьи, разглашающие коммерческую тайну.
Методология обработки печатных изданий выделяет следующие категории данных: базовая информация (для дальнейшей аналитической обработки); текущая информация о фактах; субъективно-оценочные категории, содержащие оценки и предупреждения.
Естественно, что огульно принимать на веру все, что сообщается в прессе, было бы весьма опрометчиво. Для подтверждения этого тезиса достаточно провести простейший эксперимент: прочтите статью по теме, которую вы знаете досконально. Вряд ли вы не обнаружите в ней несколько ошибок. Из этого стоит сделать вывод о том, что то же самое может происходить и с другими материалами СМИ.
Причину этого долго искать не надо. Так, например, по данным Ч. Ханта и В. Зартарьяна, только 4% французских журналистов, допускаемых в Центр информации журналистов, профессионально владеют экономической и финансовой проблематикой, в то время как этим вопросам посвящено более 20% размещенного в прессе материала.
Искажение реального состояния дел может происходить и по другой причине. Читая статью, необходимо проанализировать не только излагаемые в ней факты, но и понять и прочувствовать личное отношение автора к излагаемой проблеме.
Во многом этому помогает приблизительное знание принадлежности средств массовой информации конкретным финансово-промышленным группировкам, хотя ангажированная линия может проводиться достаточно тонко. Средства массовой информации всегда выражают интересы своих хозяев. Это аксиома и для нас, и для Запада. Но если западники вмешиваются в политику СМИ только в наиболее драматичные моменты, например во время войн и выборов, то у нас пресса контролируется даже по мелочам. Никогда не стоит преувеличивать «независимость» журналистов – то, что СМИ подстраиваются под «хозяина», известно всем. Материал, написанный журналистом и подвергнувшийся редакторской правке, может сильно отличаться от первоначального варианта. Но это не повод для отказа от информационной работы, когда много СМИ, много хозяев, то много и разных политических мнений.
Так, например, согласно данным, приведенным в книге Я.Ш. Паппэ «Олигархи», расклад связей крупнейших российских финансово-промышленных групп и контролируемых ими в той или иной степени СМИ выглядел по состоянию на конец 1999 года следующим образом:
РАО «ГАЗПРОМ» – газеты «РТ-Трибуна», «Труд»; журналы «Фактор», «Компания», «Нефтегазовая вертикаль»; телекомпании «Прометей», «НТВ».
«ЛУКОЙЛ» – газета «Известия», журнал «Нефть России», телекомпания «REN-TV».
«ИНТЕРРОС» – «ОНЭКСИМ» – газеты «Известия», «Комсомольская правда»; журнал «Эксперт».
Группа Березовского – Абрамовича – газеты «Независимая газета», «Новые Известия», «Российские вести»; журнал «Огонек»; Издательский дом «Коммерсант»; радиостанция «Наше радио»; телекомпании ОРТ и ТВ-6.
Группа «МОСТ» – газета «Сегодня»; журналы «Семь дней», «Итоги»; радиостанция «Эхо Москвы»; телекомпании «НТВ», «НТВ+», «ТНТ». В свете последних изменений часть этих изданий контролируется персоналиями, весьма близкими к главному российскому «приватизатору».
АФК «СИСТЕМА» – газеты «Вечерняя Москва», «Литературная газета», «Росая», «Культура»; радиостанции «Говорит Москва», «М-Радио», «Авторадио», «Спортивное радио»; телекомпания «ТВ-Столица».
Интернетовские новостные сайты по информации журнала «Власть» № 48 (399) от 5 декабря 2000 года:
Группа «МОСТ» – сайт «НТВ» (http://www.ntv.ru) (http://www.echo.msk.ru).
НК «ЮКОС» – (http://www.gazeta.ru).
Группа Plaza (Умар Джабраилов) – (http://www.obozrenie.ru).
Группа Березовского – Абрамовича – сайт «Независимой газеты» (http://www.ng.ru), совместный сайт ОТР, «Коммерсанта» и «Агентства политических новостей» (http://www.postfactum.ru).
Близкий к Кремлю политтехнолог Глеб Павловский – http://www.strana.ru.
Сложнее с государственными средствами массовой информации, так, например, рупор российского официоза новостная программа РТР «Вести» регулярно выдает в эфир антиправительственные «косухи» (заказные материалы).
Сравнительный анализ информации из различных источников может привести к любопытным выводам. В этом плане весьма интересен следующий пассаж А. Даллеса из его книги «Исскуство разведки»: «Любопытно, например, сравнить опубликованный в советской печати официальный текст выступления Хрущева с тем, что он сказал в действительности. Его ставшая знаменитой реплика, брошенная западным дипломатам на приеме в польском посольстве в Москве 18 ноября 1956 г., „Мы вас похороним", не была доподлинно процитирована в отчетах советской прессы, хотя многие ее слышали».
Из чего Даллес делает следующие выводы: «По-видимому, правительственная печать имеет право подвергать высказывания премьера Хрущева цензуре, вероятно, с его санкции. Позднее, когда до Хрущева дошел смысл сказанного им тогда, он дал своим словам пространное и смягчающее толкование. Следовательно, знать, как и почему содержание какой-либо истории искажается, зачастую так же интересно, как и ее фактическое содержание. Нередко случается, что существует одна версия для „внутреннего потребления", вторая – для других стран коммунистического блока и третья – для зарубежных стран. Бывают случаи, когда „сказки", которые коммунистические режимы рассказывают собственным народам, свидетельствуют о появлении у них новых слабых мест и возникновении новых опасностей».
Журналистика и вопросы экономической разведки и контрразведки, конкуренции, формирования имиджа, престижа и рейтинговых оценок чрезвычайно тесно связаны, на профессиональном жаргоне все это называется «активные мероприятия».
Конечно, очень многое в прессу не попадает или попадает в искаженном виде, также имеется вероятность сознательного дезинформирования в ходе ведущейся оперативной игры. Кстати, одной из самых эффективных методик дезинформирования является «белый шум». Эта методика состоит в том, что выдается огромное количество новостей, которое просто не поддается сортировке.
Также существуют методики по созданию и продвижению в массовое сознание специального информационного повода, отвлекающего внимание от действительно стоящей (или компрометирующей) информации. На оперативном жаргоне это называется «отвлечение внимания на негодный объект».
Так, например, самым известным примером применения этой методики является «историческая» фраза Чубайса о том, что рыночная стоимость «ваучера» – две автомашины «Волга», т.е. для массового сознания чековая приватизация должна была ассоциироваться с приличной по тем временам суммой. Что было дальше? Где они, две «Волги»? Имена владельцев заводов, газет, пароходов, я думаю, вам хорошо известны.
В дальнейшем теме «активных мероприятий» и технологиям дезинформации будет посвящена отдельная глава, а пока мы продолжим наш разговор об аналитической обработке материалов СМИ.
Прежде всего при анализе информационных материалов внимание должно концентрироваться на следующих ключевых моментах:
количество позитивных и негативных по отношению к хозяйствующему субъекту публикаций (контент-анализ); круг их авторов, а по возможности и заказчиков; степень монополизации данной темы;
имеющиеся взаимосвязи между рекламными объявлениями конкурентов и заказными статьями в отношении того или иного хозяйствующего субъекта; наличие в изучаемых материалах сбалансированной оценки происходящего.
Таким образом, анализ собранного информационного массива позволяет установить характер взаимосвязей между следующими основными элементами:
содержание и направленность сообщения;
источник сообщения;
личность журналиста, его связи и контакты в деловых и политических кругах.
Возвращаясь к методике оценки достоверности и верификации информации, получаемой из СМИ, следует заметить, что в ряде случаев бывает достаточно смыслового совпадения данных из объективно независимых источников. Как уже отмечалось выше, «независимость» источников оценивается по просачивающейся информации о принадлежности органа массовой информации к конкретной финансово-промышленной группе или коммерческому банку. Если информация подтверждается источниками, принадлежащими различным конкурирующим финансово-промышленным группировкам, то велика вероятность ее достоверности.
А теперь более подробно поговорим о применении технологии контент-анализа.
В специальной литературе дается различное толкование этого термина: статистическая семантика; техника для объективного количественного анализа содержания коммуникации; техника для получения выводов при помощи объективного и систематического установления характеристик сообщений.
Если же говорить простым языком, то контент-анализ – содержательный анализ на основе формализованных методик. Он состоит в выделении в тексте некоторых ключевых понятий или иных смысловых единиц и в последующем подсчете частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации. Так, анализ содержания проводится не интуитивно, не на «глазок», а с помощью методик, обеспечивающих получение достоверного и объективного результата.
В этом случае объективность контент-анализа определяется тем, что каждый шаг может быть произведен только на основе явно сформулированных правил и процедур. Поэтому в качестве верификации (проверки) необходимо повторение того же результата другим исследователем на том же материале. В гуманитарных науках достаточно сложно прийти к единому мнению, мы можем опросить 50 экспертов, и они дадут нам 50 различных результатов. В отличие от этого контент-анализ является довольно точной исследовательской техникой.
Для более полной характеристики метода необходимо добавить следующее. Первое: все данные статистики вербального материала используются для формулирования выводов о невербальных аспектах, например о тех или иных характеристиках адресата и адресанта. Поэтому текстовой материал здесь представляется промежуточным объектом. Нас интересует вовсе не текст. И второе: само по себе выяснение частоты употребления, например, журналистом X такого-то слова с такой-то частотой не является контент-анализом. Контент-анализ – это всегда сопоставление двух потоков. Например, сопоставление двух газет как двух вербальных потоков. Возможно сопоставление невербального и вербального потоков: данных о рождаемости и информации о детях-героях в литературных журналах. Возможно сопоставление данного вербального потока и нормы: частоты употребления определенного слова в статьях определенного журналиста и стандартной частоты употребления этого слова в языке нашего времени. Основные этапы контент-анализа следующие:
а) формулировка задачи, определение программы исследования;
б) определение выборки (той части текстов, которые достаточны для анализа всего массива публикаций и обеспечивают репрезентативность выборки);
в) определение единого семантического толкования ключевых понятий исследования;
г) составление кода, перечня характеристик текста, отвечающих задаче исследования (единиц анализа);
д) составление рабочего документа, кодированной карточки и инструкции кодировщику (человеку, который будет работать с текстом, фиксировать частоту употребления единиц текста);
е) составление сметы исследования;
ж) компьютерная обработка данных;
з) предъявление результатов исследования.
Контент-анализ прессы требует сравнительно больших затрат времени и средств, поэтому может использоваться и метод экспресс-анализа. В его основе лежит количественный подсчет содержательных элементов текста (факт, конфликт, аргумент, тема, обобщение), а также учет качественных характеристик публикаций (соответствие цели, информативность, актуальность, доказательность, конструктивность).
Как и при контент-анализе, эти характеристики текста кодируются, обозначаются определенной цифрой, и затем при чтении текста исследователь их фиксирует.
Контент-анализ используется в таких областях, как изучение социальных оценок тех или иных событий, анализ пропаганды, методов журналистики, изучение арсенала средств массовой коммуникации, психологические, психоаналитические исследования. Этот диапазон охватывает, по подсчетам исследователей, 60% всех работ.
Что можно подсчитывать в вербальном потоке, какие типичные исследовательские модели существуют? Можно подсчитывать:
а) частоту;
б) наличие/отсутствие каких-то тем;
в) связь между темами;
г) основные темы.
Алгоритм проведения контент-анализа.
1. Определиться с выбором смысловых единиц. Это могут быть оскорбления и угрозы, призывы и порывы благородного негодования, элементы личной позиции автора или что-то другое, т.е. все то, что необходимо выявить.
2. Составить перечень поисковых смысловых единиц, определить предметную область поиска (ПОП). ПОП – это все оперативные версии и гипотезы о соответствующих риск-факторах в деятельности предприятия.
Далее следует выявление в исследуемом тексте индикаторов – моделей оформления каждой смысловой единицы языковыми средствами. Теоретически их число может быть огромным, но с учетом тяготения людей к накатанным стереотипам в практической работе реальное число индикаторов не так уж и велико. Индикаторы вписываются рядом с каждой смысловой единицей. На этом же этапе нужно определиться с единицей счета: чем будет мерить? Обычно учитываются частота употребления смысловой единицы и такие ее количественные характеристики, как число строк, площадь газетной полосы или длительность вещания. Теперь мы имеем четкую систему правил для анализа материала.
3. Анализ может проводиться как вручную, так и с помощью компьютерных программ анализа текстовой информации. В компьютерном варианте инструментария достаточно отсканировать печатный лист, распознать отсканированное и обработать компьютерной программой анализа. На выходе вы получаете полную «картинку» материала с указанием его возможной направленности в ту или иную сторону и соответствующее обоснование – комментарии полученных выводов. Компьютерные программы хороши для обработки больших массивов информации и для отслеживания динамик и тенденции в сообщениях. Например, отдельный блок программы по мере поступления новой информации подшивает полученные выводы к общей композиции исследований данного объекта. Контент-анализ дополняется динамическими изменениями содержания информации. Специалисты выделяют в контент-анализе два направления.
1. Количественный контент-анализ в первую очередь интересуется частотой появления в тексте определенных характеристик (переменных) содержания.
2. Качественный контент-анализ позволяет делать выводы даже на основе единичного присутствия или отсутствия определенной характеристики содержания.
Различие двух подходов можно проиллюстрировать на примере работы «советологов» в 50-е годы. Проводя количественный анализ статей газеты «Правда», западные аналитики обнаружили резкое снижение числа ссылок на Сталина. На основании этого был сделан вывод о том, что преемники Сталина стремятся дистанцироваться от него.
Качественный анализ подтвердил этот вывод тем, что в публичной речи одного из партийных деятелей КПСС, посвященной победе СССР в Великой Отечественной войне, Сталин вообще не был упомянут. Ранее такое было просто немыслимо.
Методика количественного контент-анализ более легко поддается реализации в виде специального программного обеспечения.
Следует обратить внимание на то, что когда говорят о контент-анализе текстов, то главный интерес всегда заключается не в самих характеристиках содержания, а во внеязыковой реальности, которая за ними стоит, – личных характеристиках автора текста, преследуемых им целях, характеристиках адресата текста, различных событиях общественной жизни и пр.
Однако просто частота появления того или иного слова или темы мало что говорит. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр.
В качестве реального примера такого анализа текстов можно привести анализ президентских посланий стране, с которыми обратился Б. Клинтон в 1994 и 1995 годах. Эти послания содержат от 7000 до 10 000 слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и др. По изменению относительных частот в посланиях 1994 и 1995 годов были сделаны выводы об изменении политики государства в различных областях. То есть все эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, а в другом меньше. Например, в послании 1995 года больше внимания было уделено вопросам образования, семьи, но меньше внимания – преступности, международным делам, социальной помощи. Это дало основания для того, чтобы судить о приоритетах правительства США.
В приведенном выше примере было упомянуто понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Можно сказать, что посредством категорий в контент-анализе представлены определенные концептуальные образования. Так, в случае с посланиями Б. Клинтона была образована категория ЭКОНОМИКА, в которую входили слова экономика, безработица, инфляция. В категорию СЕМЬЯ входили слова ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов, позволяет судить о внимании, уделенном в послании тем или иным вопросам.
Очевидно, что от качества составления таких категорий во многом зависит качество результатов анализа. Контент-анализ текстов с использованием категорий иногда называют концептуальным анализом. Сфера его применения довольно широка. Существует два основных типа задач, решаемых с его помощью.
Есть два или более текстов, которые необходимо сравнить в отношении нагрузки на определенные категории. Например, выяснить, какое внимание уделяют две разные газеты определенным темам. Если эти газеты рассчитаны на одну аудиторию, то существенное различие в частотах позволит судить о различиях в политике, проводимой людьми, стоящими за ними.
Вторая задача – отслеживание динамики изменения нагрузки на определенные категории. Например, выяснить частоту упоминания темы внешнего долга России в фиксированном наборе центральных газет на протяжении какого-то времени и соотнести ее с колебаниями курса доллара путем простого корреляционного анализа.
Из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
Так, например, после того как в США был учрежден Консультативный комитет по урану, который стал наблюдать за ядерными исследованиями, была введена строгая цензура на все научные публикации в этой области. Последняя открытая работа американского ученого Макмиллана была напечатана в «Физикал ревью» 15 июня 1940 года.
На этот факт обратил внимание начальник научно-технической разведки СССР Леонид Романович Квасников. Вскоре этот факт подтвердил нью-йоркский резидент Г.Б. Овакимян. Предварительный вывод советской разведки был однозначен: американцы всерьез занялись созданием ядерного оружия, что впоследствии подтвердила агентурная информация.
Относительные частоты позволяют сравнивать два и более текстов, но иногда требуется сделать вывод на основе анализа лишь одного текста.
Например, имеется текст выступления депутата Думы, и требуется оценить, насколько оно агрессивно. Прежде всего для решения этой задачи должна быть составлена категория агрессивно окрашенной лексики. После этого мы можем сравнить текст выступления нашего депутата с выступлениями других и сказать, кто из них агрессивнее. Но от нас требуется не это, от нас требуется оценить степень агрессивности выступления. Очевидно, что для ответа на этот вопрос нам потребуется некоторая норма, своеобразная нулевая отметка агрессивности. Мы получим ее, если выясним относительную частоту употребления агрессивно окрашенных слов средним носителем русского языка. Помощь в этом могут оказать частотные словари. Сравнивая относительную частоту употребления агрессивно окрашенной лексики в выступлении депутата с частотой ее употребления средним носителем русского языка, мы как раз и можем сделать вывод о степени агрессивности. Но и это еще не все. Небольшие отклонения частот в большую или меньшую сторону могут быть следствием случайных колебаний. На вопрос о значимости отклонения частот позволяет ответить статистическая оценка, известная под названием z-score и вычисляемая по формуле
(N – Е)/(стандартное отклонение),
где N – количество слов данной категории, реально встретившихся в тексте, а Е – ожидаемое число вхождений слов данной категории в текст. Величина Е вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте.
При аналитической обработке прессы применяется и так называемый метод «окон фактов». Его во время Второй мировой войны активно использовала американская разведка для изучения немецкой промышленности по открытым публикациям. Смысл метода состоит в том, чтобы из каждой конкретной публикации извлечь только несомненные факты, часто совершенно неинтересные и тривиальные. Сопоставление подобных «атомарных» фактов способно дать совершенно неожиданные новые знания.
В нашей стране еще с советских времен любят и умеют читать между строк, поэтому в качестве курьезного примера применения метода сопоставления фактов можно привести старый анекдот про землетрясение, когда средства массовой информации сообщают, что жертв и разрушений нет. А некоторое время спустя в центральной прессе под заголовком «Очевидное – невероятное» появляется статья о вернувшейся домой собаке, которая пропала во время последнего землетрясения со стадом овец и пятью пастухами.
В 70-80-е годы этот метод был применен для анализа развития американской промышленности, в результате чего на свет появилась весьма интересная книга Дж. Нэсбитта (Naisbitt, J. Megatrends. Ten New Directions Transforming our Lives), описывающая десять главных тенденций в развитии США того времени, которые не были видны простым глазом, но стали совершенно очевидны при обработке исходной фактуры по данной методике.
А теперь в качестве примера давайте рассмотрим следующее сообщение в прессе: «Новый директор Apple Стив Джобс заявил, что компания стала возрождаться и в 1999 год перейдет с прибылью 100 млн. долларов». Из этой фразы можно извлечь только тот несомненный факт, что в 1998 году директором Apple был некто Джобе. Далее по газетным публикациям о Джобсе можно составить описание его жизненного пути, а заодно провести анализ прибыльности возглавляемых им компаний в зависимости от его прихода и ухода.
Поскольку факты, собираемые подобным образом, имеют простую структуру, то по ним достаточно легко построить причинно-следственную цепочку, например «К – продукт компании „А" 1997 г.», «Д – технический директор компании „А" с 1996 по 1998 годы», следовательно, можно создать новый факт: «Д руководил выпуском продукта К в компании „А"». Или при наличии факта «Н – сотрудник компании „А" с 1995 года» можно автоматически создать факт «Н и Д знакомы», имеющий определенную степень достоверности, и попробовать продлить цепочку знакомств дальше.
Системный подход (метод мозаики) к обработке прессы можно проиллюстрировать следующим примером. В 30-е годы в Лондоне вышла книга эмигрировавшего в Англию немецкого журналиста Бертольда Якоба. В ней он охарактеризовал 168 генералов и ведущих работников гитлеровского генерального штаба. По личному приказу Гитлера гестапо выкрало журналиста и доставило в Берлин с целью выяснения источников секретной информации Якоба. «Все, что опубликовано в моей книге, – заявил он на допросе, – я почерпнул из газет. Основание для утверждения, что генерал-майор Гаазе командует 17-й дивизией, расположенной в Нюрнберге, я извлек из некролога, помещенного в местной газете. В ней говорилось, что на похоронах присутствовал генерал Гаазе, командующий 17-й дивизией. В ульмской газете среди светских новостей я нашел данные о свадьбе дочери полковника Вирова с неким Штеммерманом. В заметке упоминалось, что Виров командует 30б-м полком 25-й дивизии. Майор Штеммерман был назван офицером службы связи этой дивизии. В газете сообщалось, что он приехал из Штутгарта, где расквартирована его дивизия…». На этом допрос закончился{Сергеев Ф.М. Тайное орудие агрессии: Подрывная деятельность США против СССР. – М.: Мысль, 1984.}.
Еще один интересный пример можно найти в книге Г.Р. Берндорфа «Шпионаж». Накануне Первой мировой войны военную разведку Германии очень сильно интересовали данные об изменениях в итальянских береговых укреплениях. Для решения этой задачи в июле 1914 года в Милане было открыто бюро объявлений, которое выписывало практически все выходящие в Италии газеты, вплоть до самых мелких деревенских листков. Хозяйкой бюро являлась весьма эффектная дама – Анна Мари Лессер, больше известная под псевдонимом «Мадемуазель Доктор». Не тратя время на сон, она в течение нескольких суток, днем и ночью наносила на крупномасштабную карту Италии сведения из газетных объявлений военных комендатур о наборе персонала на земляные и бетонные работы. Более детально масштабы строительства оценивались по месту проведения работ агентами-маршрутниками.
Сегодня горячей порой сбора различной открытой информации являются предвыборные кампании кандидатов в законодательные и исполнительные органы власти. Интересен анализ публикаций «за» и «против» различных кандидатов, фиксация факта поддержки того или иного кандидата. При квалифицированном сборе и компьютерной обработке информации в ИБД можно выстроить очень интересные схемы, особенно четко это можно отследить в регионах, где вопросам оперативного легендирования уделяют значительно меньше внимания, чем в центре. Так, установление взаимосвязей по предвыборным штабам и партийным спискам позволяет заранее выявить возможный расклад групп «поддержки» того или иного хозяйствующего субъекта в органах законодательной или исполнительной власти. Пример приведен в приложении 2.