Подавление повторяющихся символов

 

Во многих данных часто присутствуют повторяющиеся подряд символы: в числовых – повторяющиеся старшие или младшие нули, в символьных – пробелы и т.п. Избыточность таких данных можно уменьшить, если вместо последовательности повторяющихся символов вида кодировать эквивалентную последовательность символов вида pka , в которой р – признак повторения (специальный символ или слово), k – число повторений символа a.

Очевидно, что эффективность такого метода определяется значением величины Е:

Здесь n – размерность алфавита А ( );

R(p) – фиксированное число битов для кодирования признака повторения;

R(k) – фиксированное число битов для кодирования числа повторений символа a.

В случае, когда величина Е принимает отрицательное или нулевое значение, от использования данного метода вообще следует отказаться.