Лекция №4 от 28.02.13 г. М. Родионова
Тема. Проектирование классификаторов технико-экономической информации.
Состав и содержание работ на стадиях внедрения, эксплуатации и сопровождения проекта.
1. Понятие классификатора экономической информации. Виды классификаторов.
2. Понятия и основные системы классификации экономической информации.
3. Понятия и основные системы кодирования экономической информации.
4. Состав и содержание операция проектирования классификаторов.
5. Понятие единой системы классификации и кодирования и ее структура. Состав ОК, принципы построения.
6. Технология использования штрихового кодирования экономической информации.
1. Понятие классификатора экономической информации. Виды классификаторов.
В условиях рыночной экономики возрастает роль информации как одного из наиболее важных ресурсов предприятия, необходимого для принятия эффективных и своевременных управленческих решений.
Основные особенности экономической информации:
- большие объемы ежегодно создаваемой, обрабатываемой и хранимой информации,
- бОльшая часть этой информации имеет символьное представление,
- высокий уровень стоимостных и трудовых затрат на поиск и обработку.
Для того, чтобы приспособить экономическую информацию для эффективного поиска, обработки на ЭВМ и передачи по каналам связи, ее необходимо представить в цифровом виде, с этой целью нужно выполнить две процедуры: упорядочить(классифицировать) информацию и формализовать ее с использованием классификатора.
Классификатор– это документ, с помощью которого осуществляется формализованное описание экономической информации в ЭИС.
Классификатор – это таблица, которая содержит: наименования объектов, наименования классификационных группировок, их кодовые обозначения.
Экономическая информация существует в двух формах:
· в форме экономических показателей
· в форме документов.
Для построения классификаторов необходимо проанализировать содержание документов и структуру показателей.
Экономический показатель – составная единица информации, отражающая: количественную характеристику некоторого процесса или элемента предметной области с помощью реквизита-основания, вместе с однозначно определяющими его качественными характеристиками - реквизитами-признаками.
Реквизиты-основания подразделяются по типу получения алгоритмов их получения на: количественные, стоимостные, проценты, удельные веса и тд.
Множество реквизитов-признаков по степени формализации делится на два подмножества:
· справочные реквизиты-признаки-наименования характеристик процессов, предназначенные для понимания показателя пользователем-экономистом;
· группировочные реквизиты-признаки – закодированные аналоги справочных признаков, предназначенные для логической обработки информации на ЭВМ.
Объекты классификации и кодирования являются справочные реквизиты-признаки, описывающие:
· объекты действия,
· процессы,
· место действия
· время выполнения процессов
· субъекты действия
К числу наименований объектов действия можно отнести наименования:
· материальных,
· трудовых,
· денежных,
· энергетических ресурсов,
· основных средств,
· готовой продукции и услуг.
К числу наименований процессов относятся:
· функции управления, деловых процессов,
· операций поступления сырья и материалов,
· отпуска их в производство,
· производства и выпуска готовой продукции,
· оказания услуг,
· процессов выполнения заказов,
· обслуживания клиентов,
· хранения,
· реализации готовой продукции,
· расчетов с поставщиками и покупателями,
· получения оплаты за реализованную продукцию и тд.
К объектам классификации и кодирования относятся также:
· наименования показателей,
· наименования документов,
· наименования компонентов проекта ЭИС(файлов, задач, подсистем, программных модулей и тд)
Целью разработки классификаторов является установления соответствия между значениями справочных или описательных в какого-либо элемента или процесса и значениями группировочных признаков.
Например: между значением реквизита «Фамилия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».
2. Понятия и основные системы классификации экономической информации.
Классификация – результат упорядоченного распределения объектов заданного множества на подмножества.
Система классификации - совокупность правил распределения объектов множества на подмножества.
Процесс классифицирования – процесс распределения объектов классификации в соответствии с принятой системой классификации.
Признак классификации – то свойство или характеристика объекта информации, которое позволяет установить его сходство или различие с другими объектами классификации.
Классификационная группировка - множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам.
Основание классификации - признак, по которому ведется разбиение множества на подмножества на определенной ступени классификации.
Ступени классификации – это результат очередного распределения объектов одной классификации группировки.
Уровень классификации- это совокупность классификационных группировок, расположенных на одних и тех же ступенях классификации.
Глубина системы классификации – это количество уровней классификации, допустимое в данной системе.
Каждая система классификации характеризуется следующими свойствами:
· гибкостью системы,
· емкостью системы,
· степенью заполненности системы (коэффициент заполненности)
Гибкость системы - это способность допускать включение новых признаков, объектов без разрушения структуры классификатора.
Гибкость определяет время жизни(Tж) системы.
Емкость системы - это наибольшее количество классифицированных группировок, допускаемое в данной системе классификации (Р).
Степень заполненности системы (Кзап) определяется как частное от деления фактического кол-ва группировок(Qф) на величину емкости системы(P).
Два типа систем классификации: иерархическая и многоаспектная.
Характерные черты иерархической системы: наличие в системе неограниченного количества признаков классификации и их соподчиненность на множество классификационных группировок по нижестоящему - подчиненному признаку.
При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:
· получающиеся на каждом уровне классификационные группировки должны составлять исходное множество объектов Mо;
· классификационные группировки Xjk на каждой ступени не должна пересекаться,
· классификация на каждой ступени должна проводиться только по одному признаку R
Положительные стороны данной системы:логичность, простота построения и удобство логической и арифметической обработки.
Недостатки:
· жесткая структура классификации, не позволяющая вносить новые признаки или изменять их последовательность,
· гибкость системы обеспечивается только за счет ввода большой избыточности в ветвях,
· что приводит к слабой заполненности структуры классификатора.
Многоаспектная система –система классификации, которая использует параллельно несколько независимых признаков(аспектов) в качестве основания классификации.
Аспект - точка зрения на объект классификации, который характеризуется одним или несколькими признаками.
Два типа многоаспектных систем: фасетная, дескрипторная.
Фасет – это аспект классификации, который используется для образования независимых классификационных группировок.
Фасетная система характеризуется следующими особенностями построения:
· имеется некоторое множество классифицируемых объектов Mо,
· это множество можно рассматривать в нескольких аспектах,
· каждый из которых может характеризоваться одним или несколькими признаками, образующими фасет Фr,
· устанавливается некоторый порядок следования фасетов с помощью фасетной формулы: F=(Ф1,Ф2,….Фr…,ФR)
Последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач.
Определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающимся при своем решении к тем или иным фасетам.
Внутри фасета значения признаков могут: перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.
Преимущества фасетной системы:большая емкость, высокая степень гибкости, эти системы классификации хорошо приспособлены для организации поиска с целью последующей логической и арифметической обработки информации на ЭВМ.
Недостатки:сложность структуры, низкая степень заполненности системы, система частично решает проблему содержательного поиска экономической информации при принятии управленческих решений.
3. Понятия и основные системы кодирования экономической информации.
Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования.
Система кодирования – это совокупность правил обозначения объектов и группировок с использованием кодов.
Код – это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой.
Код базируется на определенном алфавите – некотором множестве знаков.
Различают следующие типы алфавитов: цифровой, буквенный, смешанный.
Код характеризуется след. параметрами:
· длиной кода(L),
· основанием кодирования(A),
· структурой кода,
· коэффициентом избыточности(Kизб),
· степенью информативности(I)
Длина кода – число знаков в кодовом обозначении признака.
Основание кодирования – число знаков алфавита.
Структура кода – распределение знаков по признакам и объектам классификации.
Коэффициент избыточности(K изб) определяется как отношение максимального количества объектов Qmax к фактическому количеству объектов Qфакт.
K=Qmax\Qфакт
Степень информативности рассчитывается как частное от деления общего кол-ва признаков R на длину кода L:
I=R\L
Все системы кодирования можно сгруппировать в два подмножества: регистрационные и классификационные.
Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации.
Регистрационные коды используются для: идентификации объекта и передачи информации об объектах на расстоянии.
Они должны отвечать следующим требованиям:
· минимальности длины кода,
· однозначности соответствия наименования объекта и его кода в течение длительного периода времени
· защищенности кода от помех и ошибок.
Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок.
Контрольная часть может рассчитываться по различным алгоритмам.
Наиболее употребляемыми являются следующие формулы расчета:
1.
2.
Где М – модуль (простое число, делящееся на единицу и на само себя)
Xi – информационные разряды, i – номер разряда;
Bi – вес информационного i-го разряда.
К регистрационным системам относятся: порядковая и серийная система кодирования.
Порядковая система – наиболее простая по своему строению. Методика построения заключается в:
1. Определении множества объектов и их порядок следования ( этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту)
2. Определения длины кода и последовательном присвоении каждому объекту кодируемого множества Mo номера его порядка (т.е. присвоении цифр натурального ряда в порядке расположения объектов)
Порядковую систему применяют для кодирования малозначных, устоявшихся и простых множеств объектов, не требующих предварительной классификации.
Преимущества порядковой системы:
· простая система,
· минимальная длина кода.
Недостатки:
· отсутствие признаков не позволяет делать промежуточные итоге при обработке информации,
· слабая мнемоничность кода.
Серийная(серийно-порядковая) система отличает от порядковой тем, что:
1) номенклатура кодируемых объектов Mo предварительно должна быть разбита на группировки по одному признаку
2) каждой группировке должна быть отведена серия кодовых обозначений,
3) в пределах которой каждому элементу присваивается свой код по порядку.
Серии обозначений для каждой группировки определяются таким образом, чтобы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.
Преимущества:
· позволяет проводить классификацию по одному признаку,
· система гибкая, т.к. предусматриваем резервы,
· минимальная длина кода.
Недостатки:
· если много признаков, то она не применяется,
· сложность построения системы (программа должна учитывать наличие резервных позиций).)