Основи роботи з дисками. Стиснення даних


Зовнішня пам'ять комп'ютера призначена для довготривалого зберігання програм та даних. Організовується на дисках та магнітних стрічках. Магнітні диски бувають гнучкі та жорсткі, гнучкі називають ще флоппі-дисками (дискетами). Зараз використовують дискети розміром 3,5 І (89 мм), ємність яких складає 1,44 Мб.

Перед використанням кожна дискета форматується: обидві її поверхні розбиваються на магнітному рівні на доріжки (треки), які мають вигляд концентричних кіл, кожна доріжка радіальними лініями розбивається на сектори. Дискета розміром 3,5 І містить на кожній стороні пластини 80 доріжок по 18 секторів на кожній доріжці, в кожний сектор поміщається по 512 байт інформації. Сектори нумеруються числами, починаючи з нуля, тому можна уявити, що дискова пам'ять - це лінійна послідовність секторів. Вздовж кожного сектора виділяються елементарні ділянки, які можуть знаходитися в стані намагнічено або розмагнічено, що відповідає збереженню двійкових значень 1 або 0 відповідно.

Жорсткі диски (вінчестера) - це декілька твердих круглих пластин, які кріпляться на одному стержні та знаходяться в герметичному корпусі. Для кожної сторони пластини є своя зчитуюча головка. Принцип форматування вінчестерів такий самий, як і в дискет.

На кожному комп'ютері можуть виникнути фізичні дефекти та логічні помилки. Дефекти - це порушення поверхні диска. Логічні помилки - це порушення файлової структури. Для виявлення помилок і дефектів призначена програма "Проверка диска". Для її запуску потрібно скористатися послідовністю команд: "Пуск "- "ПрограммьІ" - "Стандартньїе" - "Служебньїе программьі" - "Проверка диска". При цьому відкривається вікно програми ScanDisk.

Області, які займають файли на диску, не обов'язково є зв'язні, це трапляється тому, що при записі інформації операційна система спочатку шукає перше вільне місце, а потім наступне і так далі, у результаті файл на диску може бути фрагментованим, тобто розбитим на частини.
За наявності на диску багатьох фрагментованим файлів робота операційної системи суттєво сповільнюється, тому використовують дефрагментацію диску - перерозподіл файлів, які розташовані в неправильних областях.

Програма дефрагментації Defrag запускається аналогічно до програми сканування Звичайно програма не вимагає дефрагментації, поки вміст фрагментованим файлів не досягк г 20%, але доцільним є використання дефрагментації і при 6-8 %.

Вірусом називається невелика за обсягом програма, призначена для руйнування програмної та апаратної частини ПК. Для боротьби з ними існують антивірусні програм. Для забезпечення нормальної роботи ПК на ньому повинен бути встановлений антивірусний пакет, яким буде перевірятись кожна дискета, що принесена з чужого комп'ютера. Також важливо перевіряти всю інформацію, отриману із мережі Internet. Для забезпечення нормальної роботи комп'ютера бажано перевіряти його жорсткий диск на наявність вірусів хоча б 1 раз на місяць.

Характерною особливістю більшості типів даних є їх надлишковість. Ступінь надлишковості даних залежить від типу даних. Наприклад, для відеоданих ступінь надлишковості в декілька разів більша ніж для графічних даних, а ступінь надлишковості графічних даних, у свою чергу, більша за ступінь надлишковості текстових даних. Іншим фактором, що впливає на ступінь надлишковості є прийнята система кодування. Прикладом систем кодування можуть бути звичайні мови спілкування, які є ні чим іншим, як системами кодування понять та ідей для висловлення думок. Так, встановлено, що кодування текстових даних за допомогою засобів української мови дає в середньому надлишковість на 20-25% більшу ніж кодування аналогічних даних засобами англійської мови.

Для людини надлишковість даних часто пов'язана з якістю інформації, оскільки надлишковість, як правило, покращує зрозумілість та сприйняття інформації. Однак, коли мова йде про зберігання та передачу інформації засобами комп'ютерної техніки, то надлишковість відіграє негативну роль, оскільки вона приводить до зростання вартості зберігання та передачі інформації. Особливо актуальною є ця проблема у випадку необхідності обробки величезних обсягів інформації при незначних об'ємах носіїв даних. У зв'язку з цим постійно виникає проблема позбавлення надлишковості або стиснення даних. Коли методи стиснення даних застосовуються до готових файлів, то часто замість терміну "стиснення даних" вживають термін "архівування даних", стиснений варіант даних називають архівом, а програмні засоби, що реалізують методи стиснення називаються архіваторами.

В залежності від того, в якому об'єкті розміщені дані, що підлягають стисненню розрізняють:

1. Стиснення (архівування) файлів: використовується для зменшення розмірів файлів при підготовці їх до передавання каналами зв'язку або до транспортування на зовнішніх носіях малої ємності;

2. Стиснення (архівування) папок: використовується як засіб зменшення обсягу папок перед довготерміновим зберіганням, наприклад, при резервному копіюванні;

3. Стиснення (ущільнення) дисків: використовується для підвищення ефективності використання дискового простору шляхом стиснення даних при записі їх на носії інформації (як правило, засобами операційної системи).

Існує багато практичних алгоритмів стиснення даних, але всі вони базуються на трьох теоретичних способах зменшення надлишковості даних. Перший спосіб полягає в зміні вмісту даних, другий - у зміні структури даних, а третій - в одночасній зміні як структури, так і вмісту даних.

Якщо при стисненні даних відбувається зміна їх вмісту, то метод стиснення є незворотнім, тобто при відновленні (розархівуванні) даних з архіву не відбувається повне відновлення інформації. Такі методи часто називаються методами стиснення з регульованими втратами інформації. Зрозуміло, що ці методи можна застосовувати тільки для таких типів даних, для яких втрата частини вмісту не приводить до суттєвого спотворення інформації. До таких типів даних відносяться відео- та аудіодані, а також графічні дані. Методи стиснення з регульованими втратами інформації забезпечують значно більший ступінь стиснення, але їх не можна застосовувати до текстових даних. Прикладами форматів стиснення з втратами інформації можуть бути: JPEG (Joint Photographic Experts Group) для графічних даних; MPG - для для відеоданих; MP3 - для аудіоданих.

Якщо при стисненні даних відбувається тільки зміна структури даних, то метод стиснення є зворотнім. У цьому випадкові з архіву можна відновити інформацію повністю. Зворотні методи стиснення можна застосовувати до будь-яких типів даних, але вони дають менший ступінь стиснення у порівнянні з незворотними методами стиснення. Приклади форматів стиснення без втрати інформації: GIF (Graphics Interchange Format), TIFF (Tagged Image File Format) - для графічних даних; AVI - для відеоданих; ZIP, ARJ, RAR, CAB, LH - для довільних типів даних. Існує багато різних практичних методів стиснення без втрати інформації, які, як правило, мають різну ефективність для різних типів даних та різних обсягів. Однак, в основі цих методів лежать три теоретичних алгоритми:

· алгоритм RLE (Run Length Encoding);

· алгоритми групи KWE(KeyWord Encoding);

· алгоритм Хафмана.