Сбор информации


С помощью различных источников необходимо найти информацию, для проникновения на чужую территорию. Например, можно использовать Интернет, обратившись к сайту организации, в сеть которой необходимо вторг­нуться, или рекламные буклеты этой организации, в которых можно найти но­мера телефонов корпорации, имена сотрудников и адреса их электронной почты и так далее. Далее выполняется сканирование сети организации для выявления ее структуры, инвентаризации общих ресурсов, используемых опе­рационных систем, запущенных программ и систем защиты. Для этого сущест­вуют целые наборы программных инструментов.

 

Существуют следующие методы поиска информации:

· непосредственное наблюдение;

· консультации специалистов;

· анализ публикаций;

· анализ информации теле- и радиосообщений;

· работа в библиотеках, архивах;

· запрос к информационным системам, базам и банкам компьютерных данных;

· другие методы;

 

Открытая печать традиционно является самым емким и наиболее используемым каналом получения информации.

Контент-анализ - содержательный анализ на основе формализованных методик. Он состоит в выделе­нии в тексте некоторых ключевых понятий или иных смысло­вых единиц и в последующем подсчете частоты употребления этих единиц, соотношения различных элементов текста друг с другом, а также с общим объемом информации.

Основные этапы контент-анализа следующие:

· а) формулировка задачи, определение программы ис­следования;

· б) определение выборки (той части текстов, которые достаточны для анализа всего массива публикаций и обеспечивают репрезентативность выборки);

· в) определение единого семантического толкования ключевых понятий исследования;

· г) составление кода, перечня характеристик текста, отвечающих задаче исследования (единиц анализа);

· д) составление рабочего документа, кодированной карточки и инструкции кодировщику (человеку, который будет работать с текстом, фиксировать частоту употребления единиц текста);

· е) составление сметы исследования;

· ж) компьютерная обработка данных;

· з) предъявление результатов исследования.

 

Сущность компьютерной разведки заключается в поиске и передаче информации из компьютерных систем и сетей с последующей верификацией и аналитической обработкой.

Для глобальных исследований в ИНТЕРНЕТ используются специальные «процессоры сбора данных» (также имеющие название «текстово-аналитические системы»). В данном контексте термин «процессор», это часть программы, которая определяет, каким образом сама программа управляет и манипулирует данными. Процессор сбора данных использует программное обеспечение, получившие название «робот»: «робот» извлекает нужную информацию, используя целый арсенал средств лингвистического, семантического и статистического анализа. Действуя автономно, процессоры сбора данных перехватывают любую запрашиваемую информацию, как только она появится в ИНТЕРНЕТ.

Методика ведения компьютерной разведки с помощью данного программного обеспечения следующая: обрабатывая материалы открытого доступа, имеющиеся в ИНТЕРНЕТ, программа статистического анализа составляет, так называемые карты работы в различных отраслях науки. В свою очередь, это позволяет аналитикам устанавливать наиболее перспективные научные разработки в областях, где конкуренция пока что сравнительно невелика. Результаты количественного и качественного анализа результатов работы научных лабораторий позволяют оценить степень творческой атмосферы исследовательских коллективов. Это так же может быть весьма полезным при выявлении «перспективных летунов», то есть исследователей, которые за сравнительно короткий срок успевают поменять ряд представляющих интерес научных центров, а тем самым знакомы со многими результатами их работы.

 

В информационно-поисковой работе средствами ИНТЕРНЕТ можно использовать материалы каталогов, собирающих и классифицирующих различные сайты.

В качестве примера можно привести следующие каталоги:

«Mail.Ru», «List.Ru», «Рамблер», «Omen.Ru» и т.д.

При работе с классификаторами следует учитывать, что сайты классифицируются разными каталогами по-разному, это и понятно, так как ИНТЕРНЕТ не может быть упорядочен линейно, он имеет более сложную геометрию.

Например, каталог «Omen.Ru» уже на первом уровне структуризации своей коллекции оперирует более чем с 200 рубриками. «Рамблер» в качестве стартовой процедуры поиска информации предлагает 50 рубрик, одна из которых – «Классификаторы» – объединяет более 200 каталогов.

Помимо хранилищ общего назначения существует множество специализированных каталогов, помогающих пользователям ориентироваться в достаточно узких предметных областях.

Еще один очень информационно-поисковой работы в ИНТЕРНЕТ – это использование услуг бесплатных поисковых систем. На сегодняшний день самыми эффективными русскоязычными поисковыми системами являются: Яндекс, Апорт, Rambler. Поиск нужной информации в данном случае осуществляется по следующему алгоритму. Задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу в базе данных автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.

Следуют отметить, результативность поиска в данном случае зависит от двух составляющих:

Во-первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т.е. релевантности информационного запроса.

Во-вторых, у каждой поисковой системы свой алгоритм поиска и перечень сайтов входящих в базу данный поиска, поэтому при одном и том же запросе результаты поиска в различных поисковых системах могут значительно отличаться. Поэтому, наиболее целесообразным является последовательный просмотр информационное пространство Интернет при помощи нескольких поисковых систем. При поиске информации о конкретных хозяйствующих субъектах или о целых экономических регионах особое внимание стоит уделить поиску как официальных сайтов субъектов федерации и муниципальных образований, где расположены объекты оперативного интереса.

Больная часть информации, полученной в результате компьютерной разведки, носит неявный характер и нуждается в аналитической обработке. Порядка 10-15 % первичной информации имеется в ИНТЕРНЕТ уже в готовом виде (необходима только верификация). А остальные 85-90 % получаются в результате сравнения, анализа и синтеза, разрозненных и разбросанных по разным источникам фактов, по которым вполне можно составить хотя бы фрагментарную картину настоящего. Естественно, что информация, полученная таким образом, нуждается в уточнениях и верификации (проверке).

В настоящее время в русском секторе ИНТЕРНЕТ также можно найти не только электронные версии практически всех российских периодических изданий, а также многочисленные банки данных с различной бизнес-информацией. Все это значительно облегчает доступ к открытой информации, получаемой в электронном виде и последующую автоматизированную обработку полученных информационных массивов.

Грамотно формулируя и формируя запросы, осуществляя поиск в базах данных, пользователь может решать практически любые информационные задачи - от оперативного анализа новостей до детального изучения происходящих событий и их предыстории, создания досье на известные и малоизвестные персоналии, политические структуры и организации. Естественно, что доступ к базам данных с помощью ИНТЕРНЕТ возможен круглосуточно.

Существует еще один весьма эффективный способ сбора информации в ИНТЕРНЕТ, в частности для создания собственной электронной библиотеки. Это можно сделать, подписавшись на рассылки, предлагаемые некоторыми мощными каталогами.

 

Вопрос 3.Способы вторжения в компьютерную систему.