Кодирование информации.

ЭВМ обрабатывает числовую и алфавитно-цифровую информацию представленными машинными кодами. Совокупность элементарных символов с помощью которых на языке записываются программы. Составляет алфавит входного языка. Входной алфавит ЭВМ содержит графические символы(цифры , буквы, знаки препинания, математические операции) и управляющие символы. К Каждому символу входного языка ставится в соответствие двоичный код. Если количество символов входного языка равно N,то количество двоичных символов необходимых для кодирования считается по формуле:

 

N>=log2N

 

P

 

 

P

 

 

P

A B C D E F

 

K=2I 28=256

I=1байт= 8бит

 

Для того чтобы закодировать один символ используется количество информации равное одному байте.

Связывает между собой количество событий Kи количество информации.

Для кодировки текста информации используется алфавит с мощностью 256 символов.

 

В соответствии символов входного и двоичного кода задаётся с помощью кодовой таблицы.

Двоичный код Десятичный код Kou8 Cp1251 Cp866,mac,ISO…
б В  

 

Тексты закодированные в одной таблица не будет правильно отображаться в другой кодировке.

 

 

Начиная с 1997 года, вводится новая кодировка Unicode, которая на каждый символ отводит по 2 байта.

К=2^16=65536

Задача №1

Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени Нагури, алфавит которого состоит из 16 символов. Чей язык несёт больше информации? Ответ(1,5)

Задача №2

Объём сообщения, содержащего 2048 чисел, составил 1/512 мегабайта. Найти мощность алфавита? Ответ(256)