Класифікація та кодування економічної інформації
Методи класифікації економічної інформації
Для забезпечення організації та формалізованого подання економічної інформації, її пошуку і опрацювання, а також для скорочення обсягів опрацьованих даних потрібна її попередня класифікація та кодування.
Класифікація — це поділ множини об'єктів на підмножини за їх схожістю або згідно певному методу чи правилу. Сукупність методів і правил класифікації та її результат становлять систему класифікації.
Об'єкт класифікації — це елемент класифікаційної множини, що має ті чи інші властивості, ознаки класифікації, за якими класифікуються об'єкти.
До основних систем класифікації економічної інформації належать:
ієрархічна,
фасетна,
змішана.
Ієрархічна система класифікації — це система, в якій поділ множини об'єктів на підмножини виконується послідовно згідно заданим ознакам. Тобто первинна множина об'єктів спочатку ділиться на підмножини, утворені за однією ознакою, яка може набувати різних значень. Далі кожна одержана підмножина ділиться на групи за значеннями наступної ознаки. Ці групи, в свою чергу, діляться на підгрупи за наступними ознаками і т. д. Отже, між виділеними групами об'єктів встановлюється певна ієрархія. При цьому кожна підмножина, а отже, і об'єкт належить лише одній вищій множині.
При використанні ієрархічного методу класифікації для віднесення конкретного об'єкта класифікації лише до одного класифікаційного угрупування необхідно дотримуватись таких правил:
Ø поділ кожного угрупування виконується лише за однією основною ознакою;
Ø одержані на кожному рівні класифікації угрупування не повинні повторюватися;
Ø класифікація виконується так, аби сума частин утворювала множину, яка ділиться.
Ієрархічна система класифікації характеризується глибиною, тобто кількістю ступенів поділу первинної множини, або, що те саме, кількістю заданих ознак класифікації. Ієрархічній системі класифікації притаманні простота, наочність, логічність побудови, пристосованість до ручного опрацювання.
Проте ця система не позбавлена недоліків. Насамперед це:
Ø жорсткість структури, зв'язана з фіксованістю ознак і порядком їх розміщення,
Ø складністю включення нових ознак,
Ø необхідністю великого резерву для розміщення нових об'єктів.
Фасетна класифікація полягає в паралельному поділі множини об'єктів на незалежні підмножини (класифікаційні угрупування). Кожна ознака фасетної класифікації відповідає фасеті, яка є списком значень певної ознаки класифікації. Отже, система класифікації може бути поданою переліком незалежних фасет (списків), які містять значення ознак класифікації. Множинний опис об'єктів техніко-економічної інформації виконується формулою, яка утворюється з послідовності ознак класифікації, що використовуються в задачі. Кількість фасетних формул визначається можливим поєднанням ознак. Для кожної фасетної формули можна утворити ієрархічну класифікацію, в якій на кожному рівні поділу використовується одна ознака, що відповідає окремій фасеті, а послідовність ознак визначається фасетною формулою.
Переваги фасетної системи класифікації полягають у гнучкості її структури, можливості включення нових фасет і виключення старих.
До недоліків такої системи можна віднести нетрадиційність і складність її використання в разі ручного опрацювання інформації і недостатньо повне використання місткості з огляду на те, що багато можливих комбінацій фасет не мають практичного застосування.
Змішана система класифікації передбачає використання обох щойно згаданих систем.
Зауважимо, що в ієрархічній системі класифікації на будь-якому рівні підмножини елементів не повинні перетинатися, а сума елементів усіх множин кожного рівня дорівнює кількості елементів первинної (початкової) множини. Для фасетної класифікації це не є обов'язковим, а отже, сума елементів підмножин може бути більшою за кількість елементів початкової множини. Для фасетної системи обов'язковим є не повторюваність ознак.
Вибраний метод класифікації має задовольняти такі вимоги:
Ø бути достатньо містким і повним;
Ø характеризуватися достатньою та економічно обґрунтованою глибиною (кількість ознак має бути виправданою);
Ø гнучкістю та надмірністю (можливість подальшого розширення номенклатури);
Ø забезпечувати розв'язування всіх задач;
Ø характеризуватися лаконічністю, чіткістю та ясністю класифікаційних ознак.