Загальні поняття про архівацію та стиснення файлів.

Теоретичний матеріал

Зміст лекції:

 

Характерною особливістю більшості «класичних» типів даних, з якими традиційно працюють люди, є певна надмірність. Ступінь надмірності залежить від типу даних. Наприклад, у відеоданих ступінь надмірності зазвичай у декілька разів більше, ніж у графічних даних, а ступінь надмірності графічних даних у декілька разів більше, ніж текстових. Крім того, ступінь надмірності даних залежить від прийнятої системи кодування. Так, наприклад, можна сказати, що кодування текстової інформації засобами російської мови (з використанням російської азбуки) дає в середньому надмірність на 20-30% більше, ніж кодування адекватної інформації засобами англійської мови.

Для людини надмірність інформації нерідко пов'язана з уявленням про її якість, оскільки надмірність, як правило, покращує сприйняття, особливо в несприятливих умовах (проглядання телепередач за наявності перешкод, відновлення пошкодженого графічного матеріалу, читання текстів в умовах недостатньої освітленості і т. п.).

Із розвитком інформаційних технологій гостро повстало питання про способи зберігання даних. Починаючі з сорокових років 20 ст., вчені зайнялись розробкою методів представлення даних, при яких простір на носіях інформації кодувався б найбільш економічно. Результатом цих робіт стали технології стиснення та архівації даних (від англ. .backup).

Архівація даних представляє собою злиття декількох файлів та навіть каталогів в єдиний файл – архів.

Стиснення даних представляє собою скорочення об'єму вихідних файлів шляхом усунення зайвої інформації.

Для рішення цих задач служать програми-архіватори, які забезпечують як архівацію, так і стиснення даних. За допомогою спеціальних алгоритмів архіватори видаляють із файлів всю зайву інформацію,а в зворотніх операціях розпакування вони відновлюють інформацію в первісний вигляд. При цьому стиснення та відновлення інформації відбувається без втрат. Стиснення без втрат актуально при роботі з текстовими та програмними файлами, в задачах криптографії.

Існують також методи стиснення із втратами. Вони видаляють з потоку даних інформацію, яка незначним чином впливає на дані або взагалі не сприймається людиною. Такі методи стиснення застосовуються для файлів аудіо та відео, деякий форматів графічних файлів.