Методы эффективного кодирования коррелированной последовательности знаков.

Декорреляция исходной последовательности может быть осуществлена путем укрупнения алфавита знаков. Подлежащие передаче сообщения разбиваются на двух-, трех- или n-знаковые сочетания, вероятности которых известны:

Каждому сочетанию ставится в соответствии кодовая комбинация по методике Шеннона-Фано или Хаффмена.

Недостатки такого метода заключается в том, что не учитываются корреляционные связи между знаками, входящими в состав следующих друг за другом сочетаний. Естественно, он проявляется тем меньше, чем больше знаков входит в каждое сочетание.

Указанный недостаток метода заключается при кодировании по диаграмм, триграмм или l-грамм. Условимся называть l-граммой сочетание из l смежных знаков сообщения. Сочетания из двух смежных знаков называют диаграммой, из трех – триграммой и т.д. Теперь в процессе кодирования l-грамма непрерывно перемещается по тексту сообщения:

Кодовое обозначение каждого очередного знака зависит от l-1 предшествовавших ей знаков и определяется по вероятностям различных l-грамм на основании методики Шеннона-Фано или Хаффмена.