Компьютерное представление информации

Виды и формы представления информации

Известно, что информация может быть представлена в следующем виде: букв, символов, цифр; слов; текста; рисунков; схем; формул; графиков; таблиц; планов; чертежей; карт географических, топографических, технологических карт; алгоритмов, видеозаписей, аудиозаписей и т. д., которые, в свою очередь, могут быть представлены в виде: постоянной или переменной информации; команд; сообщений; справок; решений; приказов; распоряжений; заданий; отчетов; ведомостей; инструкций; комментариев; писем и записок; телеграмм; чеков; массивов; файлов; WEB-сайтов, порталов; электронных библиотек, видеотек, фонотек, блогов и т. д.

Информация, воплощенная и зафиксированная в некоторой материальной форме, называется сообщением. Сообщения могут быть непрерывными идискретными (цифровыми).

Непрерывное сообщение представляется некоторой физической величиной (электрическим напряжением, током и т. д.), изменения которой отображают протекание рассматриваемого процесса. Физическая величина, передающая непрерывное сообщение, может принимать любые значения и изменяться в произвольные моменты времени. Таким образом, в непрерывном сообщении конечной длины может содержаться большое количество информации.

Для дискретных сообщений характерно наличие фиксированного набора отдельных элементов, из которых в дискретные моменты времени формируются различные последовательности элементов. Важным является не физическая природа элементов, а то обстоятельство, что набор элементов конечен и потому любое дискретное сообщение конечной длины передает конечное число значений некоторой величины, а следовательно, количество информации в таком сообщении конечно.

При дискретной форме представления информации отдельным элементам ее могут быть присвоены числовые (цифровые) значения. В таких случаях говорят о цифровой информации, а компьютерные машины и системы, использующие цифровую форму представления информации, называются также цифровыми.

Элементы, из которых состоит дискретное сообщение, называют буквами или символами. Набор этих букв (символов) образует алфавит. Здесь под буквами в отличие от обычного представления понимаются любые знаки (обычные буквы, цифры, знаки препинания, математические и прочие знаки, цвета сигнальных ламп и др.). Число символов в алфавите называется объемом алфавита. Объем алфавита определяет количество информации, доставляемой одним символом сообщения. Если алфавит имеет объем А и в любом месте в сообщении равновероятно появление любого символа, то доставляемое символом количество информации можно определить как:

 

Дискретное сообщение можно разбить на группы символов и назвать эти группы словами. Длина слова определяется количеством содержащихся в нем символов.

В компьютерной технике широко используется однородное представление информации, при котором в компьютерной системе или отдельных ее частях все слова имеют определенную длину. Однородное представление информации упрощает обмен ею и конструкцию устройств компьютерной системы.

В алфавите объемом Аможно представить N различных слов длиной S, где по:

 

Тогда количество информации, содержащейся в слове, равно:

 

Выражение (3) справедливо, если вероятности появления в сообщении любого слова (и символа) равны и не зависят от предшествующих слов (и символов).

Неравномерность появления символов, наличие взаимной зависимости символов в сообщении, как это имеет место, например, при передаче смысловых сообщений (текста), является причиной того, что количество информации в одном символе уменьшается.

Связь между символами сообщения создает избыточность информации. В языке избыточность носит естественный характер. Однако в вычислительных системах широко применяется искусственная избыточность при кодировании сообщений, которая позволяет контролировать и устранять ошибки при передаче информации по линиям связи, а также между отдельными устройствами цифровой вычислительной системы.

В цифровых вычислительных машинах и системах широко употребляется двоичный алфавит, имеющий лишь два символа — 0 и 1. Его применение упрощает техническую реализацию устройств компьютерной техники. Любое дискретное сообщение, выраженное в некотором алфавите, переводимо в двоичный алфавит, если длина двоичного слова отвечает формуле

 

(4)

Современные компьютерные системы обрабатывают не только числовую, но и текстовую, иначе говоря, алфавитно-цифровую информацию, содержащую цифры, буквы, знаки препинания, математические и другие символы. Именно такой характер имеет экономическая, финансовая, учетная, бухгалтерская, статистическая и другая информация, содержащая наименование предметов, фамилии людей, числа и т. д.

Характер этой информации таков, что для ее представления требуются слова переменной длины. Применение для записи алгоритмов и автоматизация программирования алгоритмических языков делают необходимым ввод в машину и вывод наряду с общеупотребительными еще и некоторых специальных символов.

Деловая информация в среднем содержит вдвое больше цифр, чем букв. Поэтому наряду с общей системой кодирования алфавитно-цифровых символов в компьютерах сохраняют также отдельную систему кодирования для десятичных цифровых информации.

При развитии технологий цифрового видео и звука понадобилось еще более увеличить разрядность оцифровки аналоговых сигналов и особенно при получении видео и звука высокого качества.

Наибольшее распространение получило представление информации посредством восьмиразрядного слога, называемого байтом.

При помощи восьмиразрядного слога можно кодировать 256 различных символов (28). Несколько байтов образуют слова.

Компьютер производит обработку информации, состоящую в ее запоминании, передаче из одних устройств в другие, выполнении над информацией арифметических и логических преобразований. Процесс обработки информации автоматизирован при помощи программного управления. Программа представляет собой алгоритм переработки информации, записанной в виде последовательности команд, которые должны быть выполнены машиной для получения искомого результата.

Используемые человеком при научно-технических расчетах, обработке экономической, финансовой и другой информации, при программировании задач натуральные формы представления и натуральные единицы информации существенно отличаются от форм представления и единиц информации в машине.

Поле группа символов, имеющих определенное значение и подвергающихся обработке за одну и ту же арифметическую или логическую операцию.

Этому определению соответствуют: многоразрядное число, команда, группа символов, обозначающих определенный признак-реквизит какого-либо объекта (например, фамилия или год рождения некоторого лица, наименование детали, вес ее и т. д.).

Запись представляет собой группу полей, описывающих признаки (свойства, характеристики, параметры) некоторого объекта. Например, строка экзаменационной ведомости, приведенная на рис. 3.

Каждый из реквизитов (признаков) — фамилия, номер зачетной книжки и т. д. — является полем. Поля объединены тем, что относятся к определенному студенту.

Фамилия № зачетной книжки Дисциплина Оценка
Васильков Информационные технологии отлично

Рис. 3.Экзаменационная ведомость

Массив — объединение записей, описывающее некоторое множество объектов (например, экзаменационная ведомость или их совокупность).

Словом называют группу символов (разрядов) в памяти компьютера, соответствующую некоторому полю. Обычно термин "машинное слово" относят к коду определенной длины, который считывается из оперативной памяти или записывается в оперативную память за одно обращение. Машинное слово может представлять собой двоичное число с плавающей или фиксированной запятой, команду, несколько слогов (байтов). Машинное слово может также содержать дополнительные разряды (разряд контроля по четности, разряды защиты памяти и др.). Обычно машинное слово, в частности команда, содержит целое число байтов.

Машинная единица информации, соответствующая натуральной единице — записи, называется фразой (или также записью). Она может занимать несколько машинных слов.

Блоком называют группу фраз (записей), расположенных компактно (без промежутков) на носителе внешнего запоминающего устройства и записываемых на носитель из оперативной памяти, а также считываемых с носителя в запоминающее устройство одной командой. Среди натуральных единиц информации нет единицы, соответствующей блоку. Место в запоминающем устройстве на магнитном или оптическом носителе, в котором хранится группа слов, составляющих блок, называется зоной или сектором

Информационному массиву соответствует машинная единица информации — файл. Файл состоит в общем случае из нескольких блоков.

Томом называется машинная единица информации, соответствующая пакету дисков (часто томом называют логическую часть внешнего носителя, винчестера например).

Физическое представление информации и процессы ее обработки

Как было показано выше, в вычислительных системах информация представляется в двоичном алфавите. Физическими аналогами знаков этого алфавита служат физические сигналы, способные принимать два хорошо различимых значения, например электрическое напряжение (потенциал) высокого и низкого уровня, отсутствие и наличие импульса тока, противоположные по знаку значения напряженности магнитного поля и т. п.

Непременным требованием к физическим аналогам двоичного алфавита является возможность надежного распознавания двух различных значений сигнала, которые при описании законов функционирования схем обозначаются символами 0 (нуль) и 1 (единица).

В схемах цифровых устройств переменные и соответствующие им сигналы изменяются и воспринимаются не непрерывно, а лишь в дискретные моменты времени — по тактовым импульсам.

В цифровых устройствах применяют три способа физического представления информации: потенциальный, импульсный и динамический. Слово может быть представлено последовательным или параллельным способом (кодом). Устройства последовательного действия работают медленнее, чем параллельного. Однако устройство параллельного действия требует большего объема аппаратуры. В вычислительной технике применяются оба способа в зависимости от требований, предъявляемых к конкретному изделию.

Информация в вычислительной системе подвергается различным процессам: вводу, хранению, обработке и выводу.

Ввод информации в компьютерную систему осуществляется с устройств ввода имеющих большое разнообразие, начиная с клавиатуры, манипулятора мышь и заканчивая современными цифровыми фото и видеокамерами, а также с различных дисков, флэш-карт и т.д.

Хранение информации производится на запоминающих устройствах: кратковременное — в оперативной памяти и в различных регистрах памяти, выполненных на полупроводниковых приборах, магнитных и оптических элементах; долговременное — во внешних запоминающих устройствах, выполненных на магнитных лентах (стримеры), дисках (жестких типа "винчестер", мягких — (практически уже не применяемых с появлением стандарта USB)), и триумфально шествующих разнообразных лазерных и флэш – технологий.

Обработка информации в вычислительной системе производится в соответствии с принятой в данной системе системой команд, алгоритмами, определяемыми программным обеспечением и командами, поступающими с внешних устройств управления.

Вывод информации производится на внешние устройства связи и регистрации информации без ее визуального отображения (на указанные выше запоминающие устройства) и устройства с отображением: печатающие устройства, индикаторы, табло и другие устройства индивидуального и коллективного отображения. Выбор метода обработки информации определяется характером решаемых задач, особенностями используемой информации, а также параметрами технических средств автоматизации и возможностями программного и аппаратного обеспечения компьютерных систем.

Информационные процессы в системах обработки информации условно разделяют на три группы:

  • информационно-справочное обеспечение должностных лиц органов управления;
  • информационное обеспечение расчетных задач;
  • обслуживание информационной базы автоматизированной системы управления.

Эти процессы реализуют должностные лица органов управления и обслуживающий персонал информационной системы с помощью аппаратных средств автоматизации и связи, программного обеспечения и информационной базы системы.

По степени стабильности информацию делят на условно-постоянную и переменную. К условно-постоянной информации относятся данные, которые в течение длительного времени не меняются. По использованию в процессах управления вся информация делится на нормативную, справочную, плановую, оперативно-производственную, отчетную и аналитическую.

Обработанная информация выдается должностным лицам непосредственно на их автоматизированные средства управления и контроля (на устройства печати и отображения индивидуального пользования) либо на устройства выдачи коллективного пользования (автоматизированные устройства управления, устройства регистрации графической информации, устройства наглядного отображения коллективного пользования и т.п.).

На объектах автоматизированных систем обработки информации и управления накапливаются и хранятся большие объемы информации, как документальной (в виде обычных документов), так и на электронных, магнитных и лазерных носителях.

Документированная информациясодержит:

  • ведомость учета хранимых документов;
  • табуляграммы учета информации, хранимой на машинных носителях;
  • документы, прошедшие обработку на объекте информационной системы;
  • ведомость регистрации запросов должностных лиц и обслуживающего персонала на получение справок из базы документов и решение задач;
  • ведомость регистрации выдаваемой информации и другие документы.

На информационных носителях хранятся:

  • информационные массивы общего информационного поля;
  • архивные данные;
  • программные блоки, файлы, тома.

Информационные массивы общего информационного поля используются для выдачи различных справок по запросам, а также для информационного обеспечения расчетных задач.

В состав архивных информации входит информация, которая в данный момент в работе системы не участвует, но может понадобиться для восстановления или замены массивов, документирования работы системы и т. д.

Информационное единство в автоматизированной системе управления обеспечивается следующим путем:

  • создания системы классификации и кодирования информации;
  • разработки и внедрения унифицированных систем документации;
  • унификации принципов построения нормативов и их обновления;
  • унификации системы показателей для обеспечения сопоставимости во времени и по различным качественным и количественным признакам;
  • регламентации потоков информации по направленности, объему, периодичности, достоверности и срочности;
  • унификации порядка формирования и обработки информации.

Примером классификации и унификации информации может служить приведенный на рисунке 3 состав информационной базы информационной системы и системы управления.

 

Рис. 3.Структура информационной базы информационной системы и системы управления: ИС – информационная система

Физическое представление информации и процессы ее обработки говорят о том, что реализация системы защиты информации должна быть направлена также на защиту содержащих ее аппаратных и программных средств, составляющих автоматизированную систему обработки информации. Из этого не следует, что предметом защиты являются только ресурсы вычислительной системы, как иногда считают многие специалисты.

Понятие "ресурсы" в широком смысле этого слова подразумевает "запасы чего-либо, возможности и т. д.". В этом смысле в вычислительных системах под "ресурсами" понимают программные и аппаратные средства обработки, хранения и передачи информации, которых может хватить или не хватить вообще или в данный момент времени. Поэтому понятие "ресурсы" не может иметь описанные выше свойства информации и некоторые свойства средств ее обработки. Как можно заметить, предмет защиты в этом случае выходит за рамки этого понятия. Некоторые специалисты это почувствовали и ввели понятие "информационные ресурсы", еще более усугубив положение.

В буквальном смысле это понятие с учетом сказанного выше приобретает значение "информационных запасов". Информация не материальна и не может быть расходным материалом (исключение составляют "запасы знаний" — но это совсем другое понятие). Некорректность применения такого понятия очевидна.

Кроме того, информация может быть защищена без аппаратных и программных средств защиты с помощью криптографического преобразования. При этом нарушитель имеет доступ к аппаратным и программным средствам, а к информации доступа не имеет.

Информация — это предмет собственности. Она может быть собственностью владельца информационной системы; собственностью государства; той или иной организации, фирмы, частной или общественной; личной собственностью человека, доверившего ее владельцу информационной системы. А там, где наступает и кончается право собственности, должны быть четкость, ясность и определенность. Соблюдение гарантий этих прав и обеспечивает безопасность информации.

 

Глава 2. Объекты информационной безопасности

Классификация объектов информационной безопасности

Автоматизированные системы обработки информации (АСОИ) или автоматизированные системы обработки информации и управления (АСОИУ), в настоящее время интегрировано называемые просто информационными системами (ИС) в настоящее время получили различное воплощение. Для цельности изложения материала в данном учебном пособии примем за основу классификацию АСОИУ по видам со структурой, представленной на рисунке 1.

Столь широкий диапазон рассматриваемых систем выбран не только по причине общей проблемы информационной безопасности, но и потому, что все перечисленные виды АСОИУ могут входить в состав одной и той же региональной или глобальной информационной сети или автоматизированной системы управления.

 

Очевидно, что концепция безопасности информации, теория и основные принципы построения ее защиты в них должны быть едиными.

Рис. 1.Классификация автоматизированных систем обработки информации и управления по способу построения

Такому подходу способствует также и то, что ввод-вывод, хранение, обработка и передача информации во всех видах систем строятся на базе типовых методов и средств. Поиск подобных методов и средств в обеспечении безопасности информации также является основной задачей при проектировании информационной системы.

Для детального исследования и представления указанных систем с позиций возможного несанкционированного доступа к информации и постановки задачи рассмотрим элементы их построения, начиная с компьютера как основного базового элемента. Ниже рассмотрены структурные схемы и основные принципы построения перечисленных выше автоматизированных систем обработки информации и управления.