Основные понятия технологии сжатия данных

Основные свойства алгоритмов сжатия

Сжатие без потери информации

Эти методы сжатия применяют при передаче текстовых документов и программ, при выдаче выполненной работы заказчику или при создании резервных копий информации, хранящейся на компьютере.

Методы сжатия этого класса не могут допустить утрату информации.

 

Несмотря на то, что существует немало различных методов сжатия, есть некоторые принципы и правила, которые являются общими для всех методов сжатия. Их надо знать и правильно использовать.

1. У всякого сжатия есть предел. На первый взгляд этот принцип самоочевиден, но из него вытекает неочевидное следствие: уплотнение ранее уплотненного файла в лучшем случае не дает выигрыша, а в худшем случае может привести и к проигрышу в размере результирующего файла. Поэтому прежде чем уплотнять информацию, неплохо знать, не была ли она до этого уплотнена другими средствами.

 

2. Для всякого метода сжатия можно подобрать файл, применительно к которому данный метод является наилучшим. Справедливо и обратное: для всякого метода сжатия можно подобрать файл, который в результате сжатия не уменьшится, а наоборот увеличится.

 

Отсюда вывод: все дискуссии о том, что один метод сжатия лучше, чем другой, несостоятельны, поскольку их эффективность зависит от конкретных условий.

 

3. Из первого и второго принципов вытекает, что наилучшие программы-упаковщики до начала работы должны выполнять предварительный просмотр обрабатываемых файлов и выбирать тот метод упаковки, который в данной случае дает наилучший результат, то есть реализуют принципы искусственного интеллекта.

 

 

Исходный файл. Файл, подвергаемый сжатию.

Архивный файл. Результирующий файл, полученный в результате сжатия исходного.

Степень сжатия.Показывает, во сколько раз уменьшился объем исходного файла. Может выражаться в процентах от исходного размера или в виде отношения (например, 1:2,7).

Архивный том.При создании архивной копии на носителях малой емкости, например на дискетах, архивный файл может «нарезаться» на фрагменты, равные емкости отдельных носителей. Каждый из таких фрагментов называется архивным томом. Все тома одного архивного файла обычно имеют одинаковые имена и могут различаться (а в некоторых программах и не различаться) расширением имени.

Сплошной (solid) файл. Архивный файл непрерывной структуры.

При упаковке группы исходных файлов создается один большой файл, который может иметь как сплошную, так и не сплошную структуру. Если сжатие применяется к каждому исходному файлу отдельно, то полученный архив является не сплошным. Если сжатие применяется ко всей группе файлов как к единому целому, полученный архивный файл является сплошным. В первом случае размер архивного файла больше, чем во втором. С другой стороны, при сбое в не сплошном архиве повреждается и может быть утрачен только один исходный файл, в области размещения которого произошел сбой, а при сбое в сплошном архиве есть угроза утраты всех файлов или, по крайней мере, тех файлов, которые расположены после места сбоя. Это особенно важно в тех случаях, когда архивный файл «разрезан» на отдельные тома.

 

Самораспаковывающийся архив. Многие программы, выполняющие сжатие файлов, позволяют создавать так называемые самораспаковывающиеся архивы, имеющие расширение имени .ЕХЕ. К архиву данных они приписывают небольшой программный блок. Это позволяет пользователю выполнить распаковку без использования специальных программ. Достаточно запустить исполнение файла .ЕХЕ, и архив автоматически распакуется в той папке, в которой данный файл находится. Если распаковку надо провести в какую-то конкретную папку, в нее и надо предварительно переместить самораспаковывающийся архив. После распаковки архивный файл можно удалить, если потребность в нем не предполагается.

 

Основные форматы упаковки данных

Существует несколько десятков различных форматов упаковки. Каждая программа, выполняющая сжатие данных, использует свой формат, но наиболее часто встречаются форматы .ZIP, .ARJ, .RAR.

Формат .ARJ. Это самый популярный формат первой половины 90-х годов. И упаковка, и распаковка производятся одной программой ARJ.EXE.

Формат Win.ZIP.Это один из наиболее древних форматов. Из названия видно, что она рассчитана на работу в операционной системе Windows 9х. Несмотря на свою «древность», этот формат сегодня используется чрезвычайно широко. Это связано с тем, что это основной формат, в котором поставляются программы и драйверы из Интернета. Программа поддерживает форматы ZIP, .ARJ и некоторые другие DOSовские форматы.

Формат .RAR. Формат, весьма популярный и в России, и в мире.. У программы WinRAR российский автор – Евгений Рошаль. По потребительским свойствам она превосходит зарубежные аналоги. В международном секторе Интернета этот формат используют профессионалы, а в России он давно является потребительским. Архиватор WinRAR позволяет работать с архивами в форматах .ZIP, .ARJ и некоторых других, он в общем-то удовлетворяет большинство потребностей пользователя в средствах сжатия и разуплотнения информации.

 

Контрольные вопросы:

 

  1. Для чего предназначены программы-архиваторы?
  2. Назовите основные понятия, связанные с архивированием.
  3. Какие существуют виды программ упаковки файлов?
  4. Что такое самораспаковывающийся архив?
  5. Какие существуют виды программ-архиваторов?