Системи класифікації та кодування інформації


Класифікація — поділ множини об'єктів на частини за їх по­дібністю або відмінністю згідно з прийнятими методами.

У процесі класифікації використовуються такі поняття:

Система класифікації сукупність методів і правил класи­фікації та їхній результат.

Об'єкт класифікації— елемент класифікованої множини.

Ознака класифікації— властивість або характеристика об'єк­та, за якою виконується класифікація.

Значення ознаки — якісний або кількісний вираз ознаки класифікації.

Класифікаційне угруповання — частина об'єктів, яка виділена під час класифікації. Найпоширенішими є такі назви класифіка­ційних угруповань: клас, підклас, група, підгрупа, вид, підвид, тип.

Розрізняють два методи класифікації — ієрархічний і фа­сетний.

Ієрархічний метод класифікації— це послідовний поділ мно­жини об'єктів на підлеглі класифікаційні угруповання.

Переваги: логічність побудови, чіткість визначення ознак, ве­ликий обсяг інформації, зручність використання.

Недоліки: жорстка структура, брак резервного обсягу.

Фасетний метод класифікації — паралельний поділ множини об’єктів на незалежні класифікаційні угруповання.

Фасет — набір значень однієї ознаки класифікації. Фасети взаємно незалежні. Кожний об'єкт може одночасно входити в різні класифікаційні угруповання.

Переваги: гнучкість структури (пристосування до змін у зада­чах), дає можливість вводити нові фасети чи видаляти старі.

Недоліки: недостатньо повне використання обсягу.

Засобом вираження результатів класифікації є кодування.

Кодування — створення і присвоєння коду класифікаційному угрупованню та об'єкту класифікації (або процес присвоєння об'єкту певного коду).

Код — знак або сукупність знаків, узятих для позначення кла­сифікаційного угруповання і об'єкта класифікації.

Алфавіт (абетка) коду — система знаків, узятих для створен­ня коду.

Основа коду — число (кількість) знаків у алфавіті коду.

Методи кодування економічної інформації, які вико­ристовуються в процесі створення класифікаторів, безпосередньо пов'я­зані з методами класифікації.

Кодування призначене для формалізованого опису семантики (назв) різноманітних аспектів даних, які використовуються в управлінні економікою, найчастіше у вигляді циф­рових кодів. Таке подання найприйнятніше для підвищення ефек­тивності автоматизованої обробки економічної інформації.

Під кодуванням загалом розуміють процес позначення пер­винної множини об'єктів або повідомлень набором символів за­даного алфавіту на основі сукупності певних правил. В залежності від використовуваних символів розрізняють цифрові, буквено-цифрові та буквені коди. Кількість символів у алфавіті називають основою коду. В залежності від основи коду вони бувають двійкові, десяткові. шістнадцяткові і т. ін. В залежності від використовуваних правил коду­вання коди можуть бути змінної чи постійної довжини.

Для кодування інформації в інформаційних системах застосо­вують порядковий, серійно-порядковий, послідовний та паралель­ний методи кодування.

Порядковий метод кодування — найпростіший і найпошире­ніший. Побудова кодів виконується в міру зростання або спадан­ня ознак без пропуску номерів.

Серійно-порядковий метод кодування на кожну групу ознак має серію порядкових номерів із резервом номерів.

Послідовний метод кодування передбачає виокремлення пев­них розрядів коду під певні ознаки.

Паралельний метод кодування теж передбачає виокремлення розрядів, але значення ознаки, записаної на будь-якому розряді коду, не залежить від значення ознак, записаних на інших роз­рядах.

Серед значної кількості перелічених методів існує і метод штрихового кодування. Він являє собою послідовність темних і світлих смуг різної ширини. Інформацію несуть відносні розміри ширини світлих і темних смуг та їх сполучення, причому відносна шири­на смуг строго обумовлена. Темні смуги називаються штрихами, а світлі – проміжками (пропусками). Ширина штрихів та пропу­сків визначається кратною одиницею ширини штриха коду (мо­дулем); так само визначається і висота штрихів і пропусків. Пев­на сукупність штрихів і пропусків називається знаком і відоб­ражає законодавче позначення визначеного символу будь-якого алфавіту. Сполучення знаків, включаючи і допоміжні, відобра­жають інформаційний код. Зчитування штрихового коду здійс­нюється спеціальними пристроями (сканерами) різних типів. Ко­жному виду товару присвоюється номер, який складається з 13 цифр. Перші дві цифри (зчитування виконується зліва направо) визначають державу, де вироблений даний товар; наступні 5 цифр – фірму (підприємство) – виробника; ще 5 розрядів ви­значають назву товару та його окремі споживчі властивості; остання цифра коду контрольна і використовується для перевірки правильності зчитування коду сканером.

Вибір методів класифікації та кодування об'єктів передбачає:

─ можливість розширення кодової множини об'єктів і вне­сення відповідних змін;

─ однозначність ідентифікованих об'єктів;

─ мінімальну довжину коду;

─ можливість оброблення інформації за допомогою ПК;

─ простоту методу кодування;

─ застосування загальноприйнятих позначень.

Класифікатори і коди призначені для формування на персональних комп'ютерах зведених даних, які ви­користовуються для прийняття управлінських рішень. Передбачається ведення різноманітних класифікаторів в пам'яті комп'ютера, які використовуються для авто­матичного заповнення первинних документів і отри­мання зведених підсумків.

Об'єктами класифікації і кодування є економічні показники або значення окремих реквізитів цих показників.

Мета класифікації і кодування — впорядкування і взаємне узгодження різних предметів, понять, властивостей та інших елементів інформації.

Класифікація і кодування — обов'язковий етап створення комп'ютерної моделі інформаційної бази, основа створення БД, основний засіб формалізованого опису інформації, який є обов'язковим у створенні та ефективному використанні ІС.