Кодирование данных двоичным кодом
Представление информации в вычислительных системах
Особенности информации
Слово информация(латинское informatio) означает разъяснение, осведомление, изложение.
Под информацией понимаются все те сведения, которые уменьшают степень неопределенности нашего знания о конкретном объекте. Информация есть отражение реального мира; это сведения, которые один реальный объект содержит о другом.
Ряд ее особенностей приближает ее к материальным объектам. Так, информацию можно получить, записать, удалить, передать; информация не может возникнуть из ничего. Однако при распространении информации проявляется такое ее свойство, которое не присуще материальным объектам: при передаче информации из одной системы в другую количество информации в передающей системе не уменьшится, хотя в принимающей системе оно обычно увеличивается.
Носителем информации может быть как непосредственно наблюдаемый физический объект, так и энергетический субстрат.
Свойства информации:
• достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Информация достоверна, если она отражает истинное положение дел. Недостоверная информация может привести к неправильному пониманию или принятию неправильных решений;
• устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации обусловлена методикой ее отбора и формирования;
• полнота. Информация полна, если её достаточно для понимания и принятия решений. Как неполная, так и избыточная информация сдерживает принятие решений или может повлечь ошибки;
• своевременность. Только своевременно полученная информация может принести ожидаемую пользу. Одинаково нежелательны как преждевременная подача информации (когда она ещё не может быть усвоена), так и её задержка;
• понятность. Информация становится понятной, если она выражена языком, на котором говорят те, кому предназначена эта информация;
• доступность. Информация должна преподноситься в доступной (по уровню восприятия) форме. Поэтому одни и те же вопросы по разному излагаются в школьных учебниках и научных изданиях;
• краткость. Информацию по одному и тому же вопросу можно изложить кратко (сжато, без несущественных деталей) или пространно (подробно, многословно). Краткость информации необходима в справочниках, энциклопедиях, учебниках, всевозможных инструкциях.
Для организации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов).
История знает интересные, хотя и безуспешные попытки создания «универсальных» языков и азбук. По-видимому, безуспешность попыток их внедрения связана с тем, что национальные и социальные образования естественным образом понимают, что изменение системы кодирования общественных данных непременно приводит к изменению общественных методов (то есть норм права и морали), а это может быть связано с социальными потрясениями.
Проблема универсального средства кодирования достаточно успешно peaлизуется в отдельных отраслях техники, науки и культуры. В качестве примеров ложно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое (рис. 1).
Рис. 1. Примеры, различных систем кодирования
Своя система существует и в вычислительной технике – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски – binary digit, или, сокращенно, bit (бит).
Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:
00 01 10 11
Тремя битами можно закодировать восемь различных значений:
000 001 010 011 100 101 110 111
Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе.
Бит - слишком мелкая единица измерения. На практике чаще применяется более крупная единица - байт, равная восьми битам.
1 байт = 23 = 8 =бит
Восемь битов объединяются в байт: 00101011, 11111111 и т. д.
Байт - основная единица представления информации в компьютере. В итоге вся информация в компьютере представляется как набор огромного (сотни тысяч и миллионы) числа нулей и единиц, разбитых на отдельные байты. Обработка двоичных данных выполняется с помощью специальных правил, определяемых двоичной арифметикой (правила двоичной арифметики рассмотрим ниже).
Для хранения больших объемов данных используются более крупные производные единицы информации:
• 1 Килобайт (Кбайт) = 1024 байт = 210 байт,
• 1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,
• 1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.
Если для наглядности считать, что один байт – это один печатный символ (буква, цифра), то 1Кбайт занимает на компьютере примерно половина машинописной страницы текста формата А4 (размер шрифта 14). Объем 1Мбайт занимает примерно 500 машинописных страниц с текстом или книжка средних размеров объемом в 300 страниц.
В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:
• 1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,
• 1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.
В зависимости от решаемой задачи байт может содержать закодированное представление различных типов данных.