Кодирование информации

 

Одну и ту же информацию можно выразить разными способами: проговорить, написать, выразить жестами и т.д. Для автоматизации работы с информацией, представленной в различных видах, очень важно унифицировать форму ее представления, то есть выражать данные одного типа через данные другого типа. Для этого используют кодирование информации (данных). Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки (системы кодирования компонентов языка с помощью графических символов). История знает интересные попытки создания универсальных языков и азбук. Подобная проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры. В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и т.д.

При кодировании могут ставиться разные цели и, соответственно, применяться разные методы. Наиболее распространенными целями кодирования являются следующие:

– экономность, то есть уменьшение избыточности сообщения;

– повышение скорости передачи или обработки;

– надежность, то есть защита от случайных искажений;

– сохранность, то есть защита от нежелательного доступа к информации;

– удобство физической реализации (например, двоичное кодирование информации в ЭВМ);

– удобство восприятия.

Эти цели часто противоречат друг другу. Экономные сообщения могут оказаться ненадежными, так как они не содержат лишних символов, искажение любого символа может изменить смысл сообщения. Подробно исследует проблемы разумного сочетания экономности и надежности при передаче информации теория кодирования. В настоящее время немаловажным становится и защита информации от нежелательного доступа. Защита требует специальных способов обеспечения секретности (паролей, ключей и т.п.), что увеличивает объем хранимой информации и замедляет работу с ней.

На разных этапах сложного информационного процесса достигаются разные цели, поэтому информация неоднократно перекодируется, т.е. изменяет свое представление. Например, такая перекодировка происходит при передаче телеграмм. При решении задачи с помощью ЭВМ происходит превращение алгоритма решения задачи, написанного на естественном языке, в программу, записанную на языке программирования, далее происходят последовательно ввод, трансляция, работа программы и вывод результатов. На каждом из этапов происходит перекодирование информации.

Для того чтобы сообщение было передано отисточника к потребителю, оно должно быть каким-либо образом отображено, зафиксировано. Такое отображение осуществляется с помощью некоторых символов (знаков). Знак – это элемент конечного множества отличных друг от друга элементов. Знак вместе с его смыслом называют символом. Набор знаков, в котором определен их порядок, называется алфавитом. Алфавит, состоящий из двух знаков, называется двоичным алфавитом.Кодированиемназывается процесс преобразования одного набора знаков в другой набор знаков. Кодирование – способ хранения и передачи информации, форма представления ее на носителе. Шифрование – это тоже кодирование сообщения отправителем, но такое, чтобы оно было непонятно несанкционированному пользователю. Последовательность символов алфавита называется словом. Сообщение фиксируется как последовательность слов. Простой и всем понятный пример такого представления сообщения – его запись словами, составленными из букв русского алфавита. В канале связи способ представления сообщения может изменяться: один алфавит заменяться другим. Для того чтобы закодировать информацию, необходимо выбрать код. Кодомназывается правило для преобразования одного набора знаков в другой набор знаков. Длиной кода называется такое количество знаков, которое используется при кодировании.

Количество символов в алфавите кодирования и длина кода – совершенно разные вещи. Например, в русском алфавите 33 буквы, а слова могут быть длиной в 1, 2, 3 и т.д. буквы. Код может быть постоянной и непостоянной длины. В технике коды различной длины встречаются довольно редко. Исключением является лишь код Морзе. Азбука Морзе – это троичный код с набором знаков: точка, тире, пауза. Пауза используется в качестве разделителя между буквами и словами, так как длина кода непостоянна.

Применение кодов с постоянной длиной позволяет использовать для кодирования двоичный алфавит, как наиболее простой. Чем меньше букв в алфавите, которым кодируется информация, тем проще должно быть устройство для распознавания (дешифровки) информационного сообщения. Однако чем меньше букв в этом алфавите, тем большее количество их (большая длина кода) может потребоваться для записи одной и той же информации.