Кодирование информации.

ЭВМ обрабатывает числовую и алфавитно-цифровую информацию представленными машинными кодами. Совокупность элементарных символов с помощью которых на языке записываются программы. Составляет алфавит входного языка. Входной алфавит ЭВМ содержит графические символы(цифры , буквы, знаки препинания, математические операции) и управляющие символы. К Каждому символу входного языка ставится в соответствие двоичный код. Если количество символов входного языка равно N,то количество двоичных символов необходимых для кодирования считается по формуле:

N>=log₂N

K=2^I 2⁸=256

I=1байт= 8бит

Для того чтобы закодировать один символ используется количество информации равное одному байте.

Связывает между собой количество событий Kи количество информации.

Для кодировки текста информации используется алфавит с мощностью 256 символов.

В соответствии символов входного и двоичного кода задаётся с помощью кодовой таблицы.

Двоичный код	Десятичный код	Kou8	Cp1251	Cp866,mac,ISO…
		б	В

Тексты закодированные в одной таблица не будет правильно отображаться в другой кодировке.

Начиная с 1997 года, вводится новая кодировка Unicode, которая на каждый символ отводит по 2 байта.

К=2^16=65536

Задача №1

Два текста содержат одинаковое количество символов. Первый текст записан на русском языке, а второй на языке племени Нагури, алфавит которого состоит из 16 символов. Чей язык несёт больше информации? Ответ(1,5)

Задача №2

Объём сообщения, содержащего 2048 чисел, составил 1/512 мегабайта. Найти мощность алфавита? Ответ(256)

5rik.ru

Материалы для учебы и работы

Кодирование информации.