Кодирование информации.
ЭВМ обрабатывает числовую и алфавитно-цифровую информацию представленными машинными кодами. Совокупность элементарных символов с помощью которых на языке записываются программы. Составляет алфавит входного языка. Входной алфавит ЭВМ содержит графические символы(цифры , буквы, знаки препинания, математические операции) и управляющие символы. К Каждому символу входного языка ставится в соответствие двоичный код. Если количество символов входного языка равно N,то количество двоичных символов необходимых для кодирования считается по формуле:
N>=log2N
P
P
P
A | B | C | D | E | F |
K=2I 28=256
I=1байт= 8бит
Для того чтобы закодировать один символ используется количество информации равное одному байте.
Связывает между собой количество событий Kи количество информации.
Для кодировки текста информации используется алфавит с мощностью 256 символов.
В соответствии символов входного и двоичного кода задаётся с помощью кодовой таблицы.
Двоичный код | Десятичный код | Kou8 | Cp1251 | Cp866,mac,ISO… |
б | В |
Тексты закодированные в одной таблица не будет правильно отображаться в другой кодировке.
Начиная с 1997 года, вводится новая кодировка Unicode, которая на каждый символ отводит по 2 байта.
К=2^16=65536
Задача №1
Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени Нагури, алфавит которого состоит из 16 символов. Чей язык несёт больше информации? Ответ(1,5)
Задача №2
Объём сообщения, содержащего 2048 чисел, составил 1/512 мегабайта. Найти мощность алфавита? Ответ(256)