Кодирование информации в ЭВМ

 

Для представления символьной информации в двоичной форме используются таблицы кодировки. Код (от лат. codex) – система условных знаков (символов, обозначений) для представления различной информации.

При длине кода один байт (8 бит) можно закодировать 256 (т.е. 28) различных символов. Этого достаточно для кодирования символов любого национального алфавита, но недостаточно, чтобы представить в одной таблице символы всех алфавитов.

Уровня международного стандарта достигла система ASCII (American Standard Code for Information Interchange – Американский стандартный код для обмена информацией). Эта система устанавливает две таблицы кодирования: базовую и расширенную. В базовой таблице (табл. 5) закреплены значения кодов от 0 до 127. Первые 32 кода являются управляющими, они предназначены для управления устройствами вывода данных и определяются производителями. Большинство значений кодов базовой таблицы ASCII представлено в таблице 5.

Таблица 5

Базовая таблица кодировки ASCII

7 beep (звуковой сигнал) % C R a p
& D S b q
8 backspace (удаление предыдущего символа) ' E T c r
( F U d s
) G V e t
9 tab (табуляция) * H W f u
10 linefeed (перевод строки) + : I X g v
, ; J Y h w
13 carriage return (возврат каретки) - < K Z i x
. = L [ j y
32 space (пробел) / > M \ k z
! ? N ] l {
« @ O ^ m |
# A P _ n }
$ B Q ` o ~

 

Расширенная таблица определяет значения кодов с 128 по 255 и используется национальными системами кодирования. Например, в России наибольшее распространение получили три разных системы: альтернативная (на компьютерах, работающих в операционной системе MS-DOS); UTF-8; КОИ-8 (код обмена информации, восьмизначный).

В настоящее время всё большее распространение получает универсальная система кодирования Юникод (англ. Unicode). В ней используется шестнадцатиразрядный код, позволяющий представить 65 536 (то есть 216) символов. Этого достаточно для кодирования символов большинства языков планеты. Однако текст в Юникоде занимает вдвое больший объём в памяти ЭВМ или на машинном носителе информации, по сравнению с этим же текстом в кодировке ASCII или любой другой восьмиразрядной системе кодирования.

Существует множество способов представления графики, звука, видео, других видов данных и их совокупностей, и оно постоянно расширяется.

Растровая графика использует RGB, CMY, HSВ модели глубиной до 32 бит на пиксель. Векторная графика не имеет проблем с масштабированием, но неудобна для фотоизображений. Среди методов кодирования звуковой информации можно выделить два основных подхода: частотной модуляции (FM – Frequency Modulation), использующего АЦП и ЦАП, и таблично-волнового синтеза (Wave Table), использующего образцы звуков музыкальных инструментов.

Таким образом, многообразие систем кодирования ставит одну из важнейших задач информатики – задачу межсистемного преобразования данных.