Системи класифікації та кодування інформації

Класифікація — поділ множини об'єктів на частини за їх подібністю або відмінністю згідно з прийнятими методами.

У процесі класифікації використовуються такі поняття:

Система класифікації — сукупність методів і правил класифікації та їхній результат.

Об'єкт класифікації— елемент класифікованої множини.

Ознака класифікації— властивість або характеристика об'єкта, за якою виконується класифікація.

Значення ознаки — якісний або кількісний вираз ознаки класифікації.

Класифікаційне угруповання — частина об'єктів, яка виділена під час класифікації. Найпоширенішими є такі назви класифікаційних угруповань: клас, підклас, група, підгрупа, вид, підвид, тип.

Розрізняють два методи класифікації — ієрархічний і фасетний.

Ієрархічний метод класифікації— це послідовний поділ множини об'єктів на підлеглі класифікаційні угруповання.

Переваги: логічність побудови, чіткість визначення ознак, великий обсяг інформації, зручність використання.

Недоліки: жорстка структура, брак резервного обсягу.

Фасетний метод класифікації — паралельний поділ множини об’єктів на незалежні класифікаційні угруповання.

Фасет — набір значень однієї ознаки класифікації. Фасети взаємно незалежні. Кожний об'єкт може одночасно входити в різні класифікаційні угруповання.

Переваги: гнучкість структури (пристосування до змін у задачах), дає можливість вводити нові фасети чи видаляти старі.

Недоліки: недостатньо повне використання обсягу.

Засобом вираження результатів класифікації є кодування.

Кодування — створення і присвоєння коду класифікаційному угрупованню та об'єкту класифікації (або процес присвоєння об'єкту певного коду).

Код — знак або сукупність знаків, узятих для позначення класифікаційного угруповання і об'єкта класифікації.

Алфавіт (абетка) коду — система знаків, узятих для створення коду.

Основа коду — число (кількість) знаків у алфавіті коду.

Методи кодування економічної інформації, які використовуються в процесі створення класифікаторів, безпосередньо пов'язані з методами класифікації.

Кодування призначене для формалізованого опису семантики (назв) різноманітних аспектів даних, які використовуються в управлінні економікою, найчастіше у вигляді цифрових кодів. Таке подання найприйнятніше для підвищення ефективності автоматизованої обробки економічної інформації.

Під кодуванням загалом розуміють процес позначення первинної множини об'єктів або повідомлень набором символів заданого алфавіту на основі сукупності певних правил. В залежності від використовуваних символів розрізняють цифрові, буквено-цифрові та буквені коди. Кількість символів у алфавіті називають основою коду. В залежності від основи коду вони бувають двійкові, десяткові. шістнадцяткові і т. ін. В залежності від використовуваних правил кодування коди можуть бути змінної чи постійної довжини.

Для кодування інформації в інформаційних системах застосовують порядковий, серійно-порядковий, послідовний та паралельний методи кодування.

Порядковий метод кодування — найпростіший і найпоширеніший. Побудова кодів виконується в міру зростання або спадання ознак без пропуску номерів.

Серійно-порядковий метод кодування на кожну групу ознак має серію порядкових номерів із резервом номерів.

Послідовний метод кодування передбачає виокремлення певних розрядів коду під певні ознаки.

Паралельний метод кодування теж передбачає виокремлення розрядів, але значення ознаки, записаної на будь-якому розряді коду, не залежить від значення ознак, записаних на інших розрядах.

Серед значної кількості перелічених методів існує і метод штрихового кодування. Він являє собою послідовність темних і світлих смуг різної ширини. Інформацію несуть відносні розміри ширини світлих і темних смуг та їх сполучення, причому відносна ширина смуг строго обумовлена. Темні смуги називаються штрихами, а світлі – проміжками (пропусками). Ширина штрихів та пропусків визначається кратною одиницею ширини штриха коду (модулем); так само визначається і висота штрихів і пропусків. Певна сукупність штрихів і пропусків називається знаком і відображає законодавче позначення визначеного символу будь-якого алфавіту. Сполучення знаків, включаючи і допоміжні, відображають інформаційний код. Зчитування штрихового коду здійснюється спеціальними пристроями (сканерами) різних типів. Кожному виду товару присвоюється номер, який складається з 13 цифр. Перші дві цифри (зчитування виконується зліва направо) визначають державу, де вироблений даний товар; наступні 5 цифр – фірму (підприємство) – виробника; ще 5 розрядів визначають назву товару та його окремі споживчі властивості; остання цифра коду контрольна і використовується для перевірки правильності зчитування коду сканером.

Вибір методів класифікації та кодування об'єктів передбачає:

─ можливість розширення кодової множини об'єктів і внесення відповідних змін;

─ однозначність ідентифікованих об'єктів;

─ мінімальну довжину коду;

─ можливість оброблення інформації за допомогою ПК;

─ простоту методу кодування;

─ застосування загальноприйнятих позначень.

Класифікатори і коди призначені для формування на персональних комп'ютерах зведених даних, які використовуються для прийняття управлінських рішень. Передбачається ведення різноманітних класифікаторів в пам'яті комп'ютера, які використовуються для автоматичного заповнення первинних документів і отримання зведених підсумків.

Об'єктами класифікації і кодування є економічні показники або значення окремих реквізитів цих показників.

Мета класифікації і кодування — впорядкування і взаємне узгодження різних предметів, понять, властивостей та інших елементів інформації.

Класифікація і кодування — обов'язковий етап створення комп'ютерної моделі інформаційної бази, основа створення БД, основний засіб формалізованого опису інформації, який є обов'язковим у створенні та ефективному використанні ІС.

5rik.ru

Материалы для учебы и работы

Системи класифікації та кодування інформації