Лекція № 6

Вступ

Системи класифікації і кодування економічної інформації.

Питання:

1. Методи класифікації.

2. Методи кодування економічної інформації.

3. Розробка кодів і створення класифікаторів.

 

Важлива складова інформаційного забезпечення — система класифікації та кодування.

Класифікація — обов’язковий етап попередньої підготовки економічних даних до автоматизованого оброблення, а також передумова раціональної організації інформаційної бази та моделювання інформаційних процесів.

Її можна визначити як складову інформаційного забезпечення будь-якої інформаційної системи, що належить до мовних засобів управління. Тому класифікація є основою для кодування інформації та наступного її пошуку.

Система класифікації — це сукупність методів і правил розподілу множини об’єктів (М) на підмножину(Мij) відповідно до ознак схожості або несхожості.

Об’єкт класифікації — елемент класифікаційної множини.

Класифікаційне групування — підмножина об’єктів, отриманих у результаті класифікації.

Ознака класифікації — це властивість чи характеристика об'єкта, по якому виконується класифікація.

Розрізняють два методи класифікації — ієрархічний і фасетний.

Ієрархічний метод це послідовний поділ множини об’єктів на підлеглі класифікаційні угруповання. Полягає в тому, що початкова безліч об'єктів послідовно поділяється на групи першого рівня розподілу, далі — другого і т.д., з послідовною деталізацією властивостей: клас, підклас, група, підгрупа, вид, підвид.

Сукупність угруповань утворює при цьому ієрархічну деревоподібну структуру, що часто зображують у виді розгалуженого графа; як це показано на малюнку (Рис.4.1).

На цьому рисунку початкова множина С поділяється на першо­му рівні (ступені) на m угруповань першого рівня (С1, С 2, ... Сm).

Потім кожне угруповання поділяється на угруповання наступного рівня і т.д. Так, угруповання С1 поділяється на n угруповань другого рівня (С11, С12, ... С1n), а угруповання С11 на р угруповань третього рівня (С111, С112, ... С11р) і т. п. Кількість рівнів ступенів класифікації визначає глибину класифікації. Загалом кожне угруповання може поділятися на угруповання нижчого рів­ня з використанням своєї ознаки; глибина класифікації у кожній гілці ієрархічної структури може бути різною.

Рис. 4.1. Схема угруповань ієрархічного методу класифікації

Ієрархічна класифікація характеризується тим, що між угрупованнями установлюється відносини підпорядкування, кожен об'єкт попадає тільки в одне класифікаційне угруповання. На будь-якому рівні розподілу може бути використана одна ознака класифікації. Це означає, що об'єкти початкової безлічі характеризуються однаковим набором ознак.

Застосування ієрархічного методу класифікації порозумівається його гарною пристосованістю до обробки, великою інформативністю кодів. Проте, цей метод класифікації має ряд недоліків, що іноді утрудняють його використання. Це, насамперед твердість структури, що обумовлена фіксованістю ознак і їхньої послідовності. Зміна хоча б однієї ознаки приводить до перерозподілу класифікаційних угруповань. Ієрархічний метод класифікації не дає можливості поєднувати об'єкти по кожним, раніше не передбаченим, довільним об'єднанням ознак.

Перераховані недоліки ієрархічного методу класифікації компенсуються фасетним методом. При фасетної класифікації безліч об'єктів поділяється на групи у відповідності зі значеннями обраного фасета. Фасетний метод класифікації — паралельний поділ множини об’єктів на незалежні класифікаційні угруповання.

Фасет – це набір значень однієї ознаки класифікації. Фасети взаємно незалежні, що дозволяє групувати об'єкти по будь-якому сполученню ознак. Кожен об'єкт може одночасно входити в різні класифікаційні угруповання. Наприклад, фасет «колір» може містити такий список значень: червоний, білий, блакитний, зелений; фасет — «професія»: апаратник, автослюсар, токар.

По кожнім фасетам може бути утворена ієрархічна класифікація, у якій при розподілі на групи використовується одна ознака, що відповідає окремому фасету.

Розглянемо, приклад фасетної класифікації одягу у випадку використання трьох ознак (фасетів): вид тканини, сезонність, призначення.

Для цього прикладу одержаної ієрархічної класифікації три угруповання нижчого рівня містять відповідно такий одяг:

1) чоловічий, зимовий, вовняний;

2) жіночий, зимовий, вовняний;

3) дитячий, зимовий, вовняний.

 

Рис. 4.2. Можливий варіант ієрархічної класифікації для заданої послідовності фасетів

З використанням цих трьох ознак шляхом перестановки їхньої послідовності можна побудувати шістьох різних ієрархічних класифікацій (із трьома рівнями розподілу).

Методи кодування економічної інформації

Економічна інформація відбивається в первинних документах у буквено-цифровому виді. Реквізити - підстави (кількість, ціна) мають цифрове вираження, а реквізити – ознаки - буквене, часто досить довге, що не зручно при введенні таких даних. Тому необхідно реквізити – ознаки представити в цифровому виді, тобто закодувати.

Кодування — процес присвоєння коду класифікаційному угрупованню й об'єкту класифікації. Використанням кодів можна значно скоротити обсяги інформації і трудомісткість її обробки на всіх етапах технологічного процесу автоматизованої обробки даних.

Код - умовна позначка об'єкта знаком чи групою знаків складене за визначеними правилами, установленим системою кодування. Система кодування характеризується ємністю кодів, що розрізняються між собою, використовуваним алфавітом (символами) і правилами утворення кодових позначень.

Кодове позначення характеризується довжиною і структурою. Структура коду відбиває склад і послідовність розміщення знаків у коді.

Графічне представлення коду:

ХХ Х Х Х Х 9999 ДО : А

найменування

контрольний розряд

ідентифікатор

вид

підгрупа

група

підклас

клас

Розділи ідентифікуються однозначним цифровим кодом. Код підрозділу складається з коду розділу й однозначного коду підрозділу.

Код класу складається з коду підрозділу й однозначного коду класу і т.д.

Наприклад, нафтопродукти можуть бути закодовані так:

02 1 1 2 76

марка

автомобільні

бензини

світлі

нафтопродукти

Код об'єкта містить класифікаційну частину, що розкриває ознаки об'єкта, і ідентифікаційну частину, що забезпечує однозначну ідентифікацію об'єкта.

Кодове позначення може бути постачено контрольним чи розрядом розрядами для перевірки вірогідності запису коду.

Система кодування повинна:

1. Забезпечувати зміст у кодах необхідну інформацію про об'єкти;

2. Здійснювати однозначне визначення (ідентифікацію) кожного об'єкта;

3. Забезпечувати достатній резерв незайнятих кодів для можливості кодування нових об'єктів без порушення структури класифікатора.

4. Враховувати специфіку програмних і технічних засобів обробки даних.

5. Забезпечувати надійність, тобто перешкодозахищеність коду.

Розрізняють наступні основні види кодів:

¨ порядковий - записується повна номенклатура (список), а далі кожному елементу привласнюється номер один по одному;

¨ серійний метод кодування використовується для об'єктів, що мають дві ознаки. Виробляється поділ усієї безлічі об'єктів на групи (серії), відповідно до деякої ознаки, а далі кожному елементу цієї серії привласнюється порядковий номер. Наприклад, кодування основних фондів – будинки з 01 до 100, спорудження від 101 до 200, передатні пристрої від 201 до 300. У коді бухгалтерських рахунків: перші дві цифри – номер рахунка, що випливають – субрахунок;

¨ позиційний- попередньо при класифікації виявляються деякі ознаки, яким приділяється відповідне кількість розрядів і місце у коді, що залежить від загального числа об'єктів підлягаючих класифікації. Наприклад, Г1050 – гвинт діаметром 10, довжиною – 50 мм. Г5010 – гвинт діаметром 50, довжиною – 10 мм.

¨ комбінований – з'єднують у собі елементи різних видів кодів. Наприклад, номер групи ЗБУ-3 - тут присутня і позиційний і порядковий код; шаховий - використовується тільки для 2-х призначених номенклатур. Складається таблиці (шахматки) і на перетинанні рядка і стовпця встановлюється код;

¨ штриховий –це послідовність темних і світлих смуг різної ширини. Інформацію несе співвідношення світлих і темних смуг.

Використовується кілька типів штрихових кодів, але основний принцип їхньої побудови однаковий. Найбільш розповсюджений код Європейської системи кодування товарів складається з 13 – ти знаків. Штрихові коди використовуються, як у виробництві продукції, так і в оптовій і роздрібній торгівлі. Торгові зали магазинів обладнають вузлами розрахунку зі скануючими пристроями, що автоматично зчитують і передають інформацію про товар у пам'ять комп'ютера для наступної обробки.

Використання штрихових кодів забезпечує в обліку і контролі товарів швидкість, надійність, інформативність. Надійність штрихового коду складає одну помилку на 10 тис. лічених символів. Швидкість зчитування кодів значно більше, ніж при введенні їхнім оператором за допомогою клавіатури.

Повний список кодованої номенклатури і їхніх кодів називається кодифікатором,а якщо зроблена класифікація об'єктів, токласифікатором.

Класифікатор інформації — офіційний документ, що являє собою систематизований перелік назв і кодів класифікаційних угруповань чи об'єктів класифікації.

При рішенні економічних задач варто забезпечити порівнянність їхніх результатів у різних сферах управлінської діяльності і на різних рівнях керування народним господарством, а також можливість використання цих результатів для рішення інших задач. Ці проблеми зважуються створенням Єдиної системи класифікації і кодування техніко-економічної інформації (ЄСКК ТЕИ).

ЄСКК являє собою комплекс взаємозалежних класифікаторів техніко-економічної інформації, систем їхнього ведення, науково-методичних і нормативно-технічних документів з розробки, а також організації служб, що виконують роботи з класифікації і кодуванню.

Перелік об'єктів ТЕИ, що підлягають класифікації охоплює продукцію, що випускається у країні, структурні й адміністративні одиниці народного господарства (області, міністерства, відомства, об'єднання, підприємства, установи), адміністративно-територіальні одиниці, трудові ресурси і види діяльності, документацію і т.д. Особливим видом об'єктів у цьому переліку є техніко-економічні показники, що відображають стан економіки.

Класифікатори мають різні сфери дії: у межах підприємства, галузі, держави.

Класифікатори, розроблені на підприємстві, містять інформацію, достатню для діяльності лише даного підприємства. Позитивним тут є те, що коди компактні, мають невелику довжину. Такі класифікатори характеризуються і щодо легкою розробкою, простотою використання і внесення змін і доповнень. До їхніх недоліків відноситься необхідність перекодування інформації при передачі на вищі рівні керування.

Класифікатори, розроблені по системному способі (на рівні міністерства, відомства і т.п.), містять повну інформацію, можуть використовуватися на різних рівнях керування. Недоліком системного способу розробки класифікаторів полягає в тому, що він робить структуру класифікатора дуже громіздкої, а код багатозначним. Наприклад, код промислової продукції в загальнодержавному класифікаторі містить 11 знаків.

Тому при виборі способу класифікації варто враховувати економічні фактори, зв'язані з кодуванням, збереженням, передачею й обробкою інформації.

Галузеві класифікатори – дійсні для всіх ІС однієї галузі народного господарства. Регіональні (міські, обласні) класифікатори – для всіх ІС одного регіону.

Прикладами класифікаторів, використовуваних на загальнодержавному рівні, є:

¨ класифікатор промислової і сільськогосподарської продукції,

¨ класифікатор підприємств і організацій,

¨ класифікатор спеціальностей і професій і т.д.

Міжнародна організація по стандартизації (ICO) розробила коди для кожної країни. Код України – UA. Статистичне бюро Організації Об'єднаних Націй привласнило Україні код 482.

Наведемоперелік основних загальнодержавних та галузевих класифікаторів:

СПАТО —система позначень автономій, територій, областей;

УКФВ —український класифікатор форм власності;

КОПФГ —класифікатор організаційно-правових форм господарювання;

ЄДРПОУ —єдиний державний реєстр підприємств, організацій України;

ЗКГНГ —загальний класифікатор галузей народного господарства;

СПОДУ —система позначень органів державного управління;

УКВ —український класифікатор валют;

УКП —український класифікатор продукції;

КОВ —класифікатор одиниць виміру;

УСГК —українська стандартна галузева класифікація ;

УБК —українська бюджетна класифікація;

КВПП —класифікатор видів платників податків;

КБУ —класифікатор банківських установ;

УКОЗ —український класифікатор основних засобів;

Наведемо приклад кодових позначень:

УКУД —український класифікатор управлінських документів.

Код уніфікованої форми документа складається з 7 цифрових десяткових знаків і контрольного числа. Структура коду форми документа за УКУД:

ХХ — клас форм;

ХХ— підклас форм;

ХХХ— реєстраційний номер;

Х— контрольне число.

УКВЕД —український класифікатор видів економічної діяль­ності.

Загальне кодове позначення об’єктів КВЕД виглядає так:

ХХ —розділ;

ХХ. Х — група;

ХХ. ХХ — клас;

ХХ. ХХ. ХХ — підклас.

 

Розробка кодів і створення класифікаторів.

Підготовку системи класифікації і кодування можна розбити на етапи:

1.Вибирається метод класифікації і кодування.

2. Встановлюються ознаки, по яких буде проведена класифікація. При цьому необхідно розглянути можливість використання існуючих класифікаторів (довідник ЄСКК).

3.Складається повний перелік номенклатури.

4.Кожної позиції номенклатури привласнюється код.

У процесі розробки системи кодування повинні бути описані способи формування кодових позначень об'єктів, описана структура кодів. Структура коду повинна бути мінімальної, але і достатньої з урахуванням можливих розширень безлічі об'єктів кодування.

Приклад.Розробити класифікатор якщо підприємство складається з 4 – х підрозділів, у яких числяться працюючі:

1.Відділи заводоуправління – 4 шт. працює 90 чіл.

2.Цеху основного виробництва – 12 шт. працює 1100 чіл.

3.Цеху допоміжного виробництва – 8 шт. працює 450 чіл.

4.Склади – 4 шт. працює 50 чіл.

При побудові кодів варто врахувати відношення працюючого до підрозділу, тому виділяється 3 групи ознак:

1-ий (старший) - підрозділ;

2-ий номер відділу і цеху в підрозділі;

3-ій – номер працюючого.

По максимальній кількості всіх елементів визначається значність коду. Тому що на підприємстві 4 підрозділи, те старша ознака буде мати значність - 1. Тому що всього на підприємстві працюють 1690 чоловік, те значність по молодшій ознаці коду можна вибрати рівної - 4.

 

Підрозділ Порядковий Серійний Позиційний
Відділи заводоуправління С 1- 200 - серія для відділів
 
     
С 201 - 3000
Цеха основного виробництво    
     
 
С 3001 - 5000
Цеха допоміжного виробництво    
     
С 5001 - 5100
Склади    
     
   

Отже, 1031001 – код першого робітника з 3-го відділу заводоуправління.

3070027 – 27-ий робітник з 7-го цеху допоміжного виробництва.

Запитання для самоконтролю

 

1. Перелічити методи класифікації.

2. Наведіть приклад фасетної класифікації.

3. Перелічити види кодів.

4. Що таке ЄСКК ?

 

Література

 

1. В.П. Завгородний. Автоматизация бухгалтерского учета, контроля и аудита. - К: А.С.К, 1998.

2. Івахненков С.В. Інформаційні технології в організації бухгалтерського обліку та аудиту: Навч. посіб. – К.: Знання - Прес, 2003.

3. Інформаційні системи і технології в економіці: Посібник для студентів вищих навчальних закладів/ За редакцією В.С. Пономаренка.-К.: видавничий центр “Академія”, 2002.

4. Ситник В.Ф. та ін. Основи інформаційних систем, К.:КНЕУ, 2001 р.

5. В.Д. Шквір та ін.. Інформаційні системи і технології в обліку: Навч. посібник -Львів, 2003.-268с.