Методы эффективного кодирования коррелированной последовательности знаков.
Декорреляция исходной последовательности может быть осуществлена путем укрупнения алфавита знаков. Подлежащие передаче сообщения разбиваются на двух-, трех- или n-знаковые сочетания, вероятности которых известны:
Каждому сочетанию ставится в соответствии кодовая комбинация по методике Шеннона-Фано или Хаффмена.
Недостатки такого метода заключается в том, что не учитываются корреляционные связи между знаками, входящими в состав следующих друг за другом сочетаний. Естественно, он проявляется тем меньше, чем больше знаков входит в каждое сочетание.
Указанный недостаток метода заключается при кодировании по диаграмм, триграмм или l-грамм. Условимся называть l-граммой сочетание из l смежных знаков сообщения. Сочетания из двух смежных знаков называют диаграммой, из трех – триграммой и т.д. Теперь в процессе кодирования l-грамма непрерывно перемещается по тексту сообщения:
Кодовое обозначение каждого очередного знака зависит от l-1 предшествовавших ей знаков и определяется по вероятностям различных l-грамм на основании методики Шеннона-Фано или Хаффмена.