Программы архивирования данных

Дефрагментация диска

Служебные программы

Для дефрагментации диска необходимо выполнить команду Пуск/Программы/Стандартные/Служебные и выбрать Дефрагментация диска, откроется окно диалога (рис.5.14). В окне необходимо выбрать том для осуществления дефрагментации и щелкнуть на пиктограмме Анализ.

По результатам анализа состояния диска операционная система выдаст оценку использования диска до дефрагментации и заключение о целесообразности проведения дефрагментации.

 

Рис.5.14. .окно «Дефрагментация диска»

Для продолжения выполнения дефрагментации необходимо щелкнуть на кнопке Дефрагментация. По завершении дефрагментации можно вывести отчет на экран.

Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.

Архивация проводится в следующих случаях:

· Когда необходимо создать резервные копии наиболее ценных файлов

· Когда необходимо освободить место на диске

· Когда необходимо передать файлы по E-mail

Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.

Эффективность сжатия информации оценивается коэффициентом сжатия,который определяется как отношение размера исходных данных к размеру сжатых. Соответственно, чем больше данный коэффициент, тем меньше избыточность сжатых данных.

Возможность сжатия данных обусловлена их содержательной избыточностью при представлении для хранения на внешних носителях. Степень избыточности данных зависит от типа данных. Наибольшей степенью избыточности обладают видеоданные, а наименьшей — текстовые.

В основе всех алгоритмов сжатия данных лежат три теоретических алгоритма:

• алгоритм RLE (Run Length Encoding);

• алгоритмы группы KWE (KeyWord Encoding);

• алгоритм Хаффмана.

Алгоритм RLEоснован на подсчете последовательности подряд идущих одинаковых чисел и записи вместо таких последовательностей двух чисел: значение числа повторений и значение повторяющегося числа. Например, последовательность чисел

кодируется следующей последовательностью

71 48 35 53 69.

Если для кодирования одного числа используется четыре бита, то размер исходной последовательности составляет 100 бит (12,5 байт), а сжатой — 40 бит (5 байт). Соответственно коэффициент сжатия равен 2,5.

Алгоритм KWE основан на сжатии данных по ключевым словам. В основу алгоритма положен принцип кодирования лексических единиц (часто повторяющиеся последовательности символов, отдельные слова или фразы) группами байт фиксированной длины.

Как правило, лексическими единицами являются повторяющиеся последовательности символов, которые кодируются цепочкой символов (кодом) меньшей длины. В результате кодирования формируется словарь.

Алгоритмы LZ(Лемпеля-Зива) и LZW (Лемпеля-Зива-Велча), по сути, являются модификациями KWE -алгоритма.

В алгоритме LZ словарь лексических единиц формируется каждый раз при сжатии новых данных. В алгоритме LZWдля сжатия данных используется составленная таблица фраз (словарь).

Алгоритмы сжатия этой группы наиболее эффективны для текстовых данных больших объемов и малоэффективны для файлов ма­леньких размеров (за счет необходимости сохранения словаря).

Алгоритм Хаффманаиспользует частотный анализ входной последовательности данных, то есть устанавливает частоту повторения каждого символа. После этого символы сортируются по уменьшению частоты вхождения. Сжатие происходит за счет кодирования часто встречающихся символов битовыми группами меньшей длины. Алгоритм Хоффмана универсальный, его можно применять для сжатия данных любых типов, но он так же, как и алгоритм KWE, малоэффективен для файлов маленьких размеров (из-за необходимости сохранения словаря).

Алгоритмы сжатия широко применяются для более компактного хранения изображений. В этом случае сжатие данных (устранение избыточности) реализуется автоматически при сохранении графического файла в выбранном формате. Разные форматы графических файлов реализуют различные алгоритмы. Так, графические форматы ВМР и РСХ реализуют RLE-алгоритм, а форматы GIF и TIFFLZW-алгоритм. Формат JPEG использует одноименный алгоритм сжатия.

Для хранения звука и видео в цифровом виде требуется гораздо больше памяти, чем для хранения текста и графики, поэтому без использования алгоритмов сжатия работа с этими типами данных была невозможной.

Для представления и хранения звука используются алгоритмы МР (МРЗ, МР4), а для видео — МРЕG, AVIи др.

По характеру воздействия данные алгоритмы сжатия делятся на:

  • необратимые;
  • обратимые.

При использовании необратимых алгоритмов,которые также называются алгоритмами сжатия с регулированными потерями информации,изменяется содержимое данных так, что при восстановлении (разархивировании) данных из архива не происходит их полного восстановления. Такие алгоритмы можно применять только для таких типов данных, для которых потеря части содержимого не приводит к существенному искажению информации, например, видео- и аудиоданные, а также графические данные. Методы сжатия с регулированными потерями информации обеспечивают большую степень сжатия, но они не применимы к текстовым данным, т.к. могут привести к изменению или потере смысловой информации в текстовых файлах. Частичная потеря информации при сжатии предусмотрена форматом JPEGдля графических данных, форматом MPG — для видеоданных и МРЗ — для аудиоданных.

Обратимые алгоритмы сжатия изменяют структуру данных, но не содержание, поэтому при разархивировании данные восстанавливаются полностью. Обратимые методы сжатия применяются для сжатия любых типов данных, но они обеспечивают меньший коэффициент сжатия. Форматы файлов, поддерживающие обратимые алгоритмы сжатия: GIF, TIFF— для графических данных, AVI — для видеоданных и ZIP, ARJ, RAR — для произвольных типов данных.

Программные средства сжатия данных (архиваторы), как правило, используют сочетание всех трех алгоритмов, при этом перед архивацией данных выполняется анализ содержимого файлов для последующего выбора наиболее оптимального алгоритма сжатия

Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003, WinRAR 3.70 и др).