Кодирование информации.
Виды информации
Информация может существовать в виде:
- текстов, рисунков, чертежей, фотографий;
- световых или звуковых сигналов;
- радиоволн;
- электрических и нервных импульсов;
- магнитных записей;
- жестов и мимики;
- запахов и вкусовых ощущений;
- хромосом, посредством которых передаются по наследству признаки и свойства организмов и т.д.
В принципе информацию может переносить любая материальная структура или поток энергии.
Информация передаётся в форме сообщений от некоторого источника информации к её приёмнику посредством канала связи между ними. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приёмнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.
канал связи | ||
ИСТОЧНИК | -----------> | ПРИЁМНИК |
Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.
Одну и ту же информацию можно представить и передавать по разному. Для того чтобы сообщение могло быть передано от источника к потребителю, оно должно быть каким-либо образом отражено, зафиксировано. Такое отображение осуществляется с помощью некоторых символов (знаков).
Конечный, упорядоченный набор знаков, используемых для передачи сообщений, называют алфавитом. Последовательность символов алфавита – словом. Сообщение – это последовательность слов. Простой и всем понятный пример такого представления сообщения – его запись словами, составленными из букв русского алфавита. В канале связи способ представления сообщения может изменяться: один алфавит заменяется другим.
Правило отображения одного алфавита в другой называется кодом, а сама процедура - кодированием.
Например, азбука Морзе, язык глухонемых (жестов). В азбуке Морзе каждой букве алфавита ставится в соответствие определенная последовательность точек и тире:
А ∙ − O − − −
О − − − W × - -
С ∙ ∙ ∙ S ∙ ∙ ∙
В современной вычислительной технике информация чаще всего кодируется с помощью последовательностей сигналов всего двух видов: намагничено или не намагничено, включено или выключено, высокое или низкое напряжение и т.д. Принято обозначать одно состояние цифрой 0, а другое – цифрой 1. Такое кодирование называется двоичным кодированием, а цифры 0 и 1 называются битами (от англ. bit – binary digit – двоичная цифра).
Любая информация представляется в ЭВМ последовательностью этих двух цифр 0 и 1. Такие последовательности называются двоичными кодами.
Например: А - 01000001; В – 01000010; С – 01000011; М - 01001101
Итак, для измерения количества информации используется единица измерения бит.
Один бит – это количество информации, содержащееся в сообщении типа «да – нет» (0 или 1 в двоичном коде).
Восемь бит образуют более крупную единицу информации – байт.
8 бит = 1 байт
В основном используются более крупные единицы измерения количества информации:
1 килобайт (кб) = 1024 байт = 210 байт
1 Мегабайт (Мб) = 1024 ´ 1024 байт = 220 байт
1 Гигабайт (Гб) = 1024´ 1024´ 1024 байт = 230 байт
1 Терабайт (Тб) = 1024 ´1024 ´1024´1024 байт = 240 байт
1 Петабайт (Пб) = 1024´1024 ´1024´1024 ´1024 байт = 250 байт
Число символов, составляющих кодовую комбинацию, называется длиной кода или разрядностью кода. Если разрядность двоичного кода обозначить через n, то полное число кодовых комбинаций будет равно 2n . Например для КОИ-8 (код обмена информацией) n=8, а полное число кодовых комбинаций составляет 256, что позволяет кодировать все необходимые символы.
Биты и байты используются также для измерения «емкости» памяти и для измерения скорости передачи двоичных сообщений. Скорость передачи измеряется количеством передаваемых бит в секунду (бит/с).
Примеры:
1) Слово мама кодируется последовательностью из 32 цифр
01001101 01000001 01001101 01000001
2) Каков информационный объем такого сообщения: «люблю грозу в начале мая»?
В сообщении 24 символа, считая пробелы. Следовательно, 24 байта или 24*8=192 бита.