Кодирование информации.

Виды информации

Информация может существовать в виде:

  • текстов, рисунков, чертежей, фотографий;
  • световых или звуковых сигналов;
  • радиоволн;
  • электрических и нервных импульсов;
  • магнитных записей;
  • жестов и мимики;
  • запахов и вкусовых ощущений;
  • хромосом, посредством которых передаются по наследству признаки и свойства организмов и т.д.

В принципе информацию может переносить любая материальная структура или поток энергии.

Информация передаётся в форме сообщений от некоторого источника информации к её приёмнику посредством канала связи между ними. Источник посылает передаваемое сообщение, которое кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи. В результате в приёмнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением.

  канал связи  
ИСТОЧНИК -----------> ПРИЁМНИК

Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.

 

 

Одну и ту же информацию можно представить и передавать по разному. Для того чтобы сообщение могло быть передано от источника к потребителю, оно должно быть каким-либо образом отражено, зафиксировано. Такое отображение осуществляется с помощью некоторых символов (знаков).

Конечный, упорядоченный набор знаков, используемых для передачи сообщений, называют алфавитом. Последовательность символов алфавита – словом. Сообщение – это последовательность слов. Простой и всем понятный пример такого представления сообщения – его запись словами, составленными из букв русского алфавита. В канале связи способ представления сообщения может изменяться: один алфавит заменяется другим.

Правило отображения одного алфавита в другой называется кодом, а сама процедура - кодированием.

Например, азбука Морзе, язык глухонемых (жестов). В азбуке Морзе каждой букве алфавита ставится в соответствие определенная последовательность точек и тире:

А ∙ − O − − −

О − − − W × - -

С ∙ ∙ ∙ S ∙ ∙ ∙

В современной вычислительной технике информация чаще всего кодируется с помощью последовательностей сигналов всего двух видов: намагничено или не намагничено, включено или выключено, высокое или низкое напряжение и т.д. Принято обозначать одно состояние цифрой 0, а другое – цифрой 1. Такое кодирование называется двоичным кодированием, а цифры 0 и 1 называются битами (от англ. bit – binary digit – двоичная цифра).

Любая информация представляется в ЭВМ последовательностью этих двух цифр 0 и 1. Такие последовательности называются двоичными кодами.

 

Например: А - 01000001; В – 01000010; С – 01000011; М - 01001101

Итак, для измерения количества информации используется единица измерения бит.

Один бит – это количество информации, содержащееся в сообщении типа «да – нет» (0 или 1 в двоичном коде).

Восемь бит образуют более крупную единицу информации – байт.

8 бит = 1 байт

В основном используются более крупные единицы измерения количества информации:

1 килобайт (кб) = 1024 байт = 210 байт

1 Мегабайт (Мб) = 1024 ´ 1024 байт = 220 байт

1 Гигабайт (Гб) = 1024´ 1024´ 1024 байт = 230 байт

1 Терабайт (Тб) = 1024 ´1024 ´1024´1024 байт = 240 байт

1 Петабайт (Пб) = 1024´1024 ´1024´1024 ´1024 байт = 250 байт

Число символов, составляющих кодовую комбинацию, называется длиной кода или разрядностью кода. Если разрядность двоичного кода обозначить через n, то полное число кодовых комбинаций будет равно 2n . Например для КОИ-8 (код обмена информацией) n=8, а полное число кодовых комбинаций составляет 256, что позволяет кодировать все необходимые символы.

Биты и байты используются также для измерения «емкости» памяти и для измерения скорости передачи двоичных сообщений. Скорость передачи измеряется количеством передаваемых бит в секунду (бит/с).

Примеры:

1) Слово мама кодируется последовательностью из 32 цифр

01001101 01000001 01001101 01000001

2) Каков информационный объем такого сообщения: «люблю грозу в начале мая»?

В сообщении 24 символа, считая пробелы. Следовательно, 24 байта или 24*8=192 бита.