Детализация представлений ЭИС
Классификация и основные свойства единиц информации
Существуют две основные единицы информации - атрибут и составная единица информации.
Атрибут информационное отображение свойства объекта. Атрибут соответствует понятию переменной в языках программирования и понятию реквизита в бухгалтерском учете. Атрибут характеризуется именем и значением.
Именем атрибута называется его условное обозначение в процессах обработки данных.
Значением атрибута называется величина, характеризующая некоторое свойство объекта, явления, процесса в конкретных обстоятельствах.
Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута.
Определение домена предполагает указание его имени и списка значений. Если число значений в домене невелико, то их список можно указать при объявлении данных в программе. Зачастую невозможно перечислить все элементы домена, поэтому для домена указываются тип и длина значения (например, домен фамилий 20 символов). Наиболее употребительны текстовые (символьные), числовые, логические значения, а также значения дат и другие специальные типы значений.
Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены.
Таблица 1.Свойства единиц информации
Название свойства | Атрибут | Составная единица информации | |||
Представления пользователя | Представления проектировщика | ||||
Документ | Показатель | Отношение | Веерное отношение | ||
Имя Значение Структура | + + | + + + + | + + + | + + + | + + + |
Операции над именем Над значением Над структурой | Переименование, объявление синонима | ||||
Перекодирование | Выборка, корректировка | ||||
Арифметические операции | |||||
- | Декомпозиция, Композиция, Нормализация, свертка | - | Проекция, соединение, добавление атрибутов | Добавление/ изъятие атрибутов |
Рассмотрим простейшие системы классификации и кодирования. Существуют следующие системы кодирования:
- порядковая;
- серийная;
- разрядная.
Порядковая система кодирования или нумерация применяется, если классификация объектов вообще не требуется.
Серийная система кодирования применяется, если все множество объектов классифицируется по одному признаку. Коды объектов разделяются на несколько частей (серий) по количеству значений этого признака и в пределах каждой серии использовать последовательные номера.
Разрядную систему кодирования применяется, когда используется несколько классификационных признаков и их взаимная подчиненность соответствует выделению классов объектов, подклассов внутри каждого класса и т.д.
Пример. Порядковый код студента - это просто его номер в списке всех студентов. Если различать студентов-дневников, вечерников и заочников с использованием серийной системы кодирования, то номера от 1 до 5999 будем использовать при кодировании дневников, номера от 6000 до 7999 - при кодировании вечерников, от 8000 до 9999 - при кодировании заочников. Если в этих же условиях применить разрядный код, то первый знак кода будет принимать три значения (1 -дневное отделение, 2 - вечернее, 3 - заочное), а следующие 4 знака отводятся для нумерации студентов каждого отделения. В разрядном коде можно учесть больше признаков, например, первый знак - код отделения, второй - код факультета, третий - код курса, четвертый - код группы, пятый - порядковый номер студента в группе.
Множество атрибутов объединяется в одну СЕИ по следующим принципам:
- соответствующие атрибуты описывают один и тот же факт или экономический процесс,
- значения атрибутов, входящих вСЕИ, возникают одновременно, связаны логическими или арифметическими соотношениями.
Простейшими характеристиками СЕИ являются имя, структура и значение.
Имя СЕИ - это ее условное обозначение в процессах обработки информации.
Структурой СЕИ называется вхождение одних единиц информации в состав других единиц информации.
Аппарат СЕИ рассчитан на описание структуры экономических документов.
Существует много способов описания структуры СЕИ, в зависимости от конкретных языков программирования и СУБД. Будем помещать этот список в круглые скобки, а имена атрибутов внутри скобок перечислять через запятую. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ.
Прих | ||||||||
Дата | Пост | Склад | ||||||
01.10.95 | ||||||||
Ним | Кво-док | Кво-пр | Цена | Сумма | ||||
5,00 6,00 | 80,00 48,00 | |||||||
Прих | ||||||||
Дата | Пост | Склад | ||||||
07.10.95 | ||||||||
Ним | Кво-док | Кво-пр | Цена | Сумма | ||||
6,00 8,00 5,00 | 60,00 64,00 25,00 | |||||||
Рисунок 1.8 - Бланки документа «Приходный ордер»
Пример:
Прих(2).(Дата, Пост, Склад, Табл(3). (Ннм, Кво-док, Кво-пр, Цена. Сумма))
где Прих – имя;
(2),(3) – размерность;
Дата, Пост, Склад, Табл, Ннм, Кво-док, Кво-пр, Цена, Сумма – имена атрибутов и СЕИ.
Значением СЕИ называется набор значений непосредственно входящих в нее атрибутов и набор собраний непосредственно входящих в нее других СЕИ.
Основные операции над единицами информации:
Операции для имени: Переименование и объявление синонима
Переименованием единицы информации называется присвоение ей нового имени.
Объявление синонима - это установление второго, третьего и т.д. равноценного имени для единицы информации.
Операция над значением атрибута всего одна - это перекодирование, т.е. замена существующего кода значения на новый для всех значений.
Операции над значением СЕИ:
Выборка - операция выделения подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки.
Корректировка означает выполнение одной из операций:
- добавление нового значения СЕИ,
- исключение существующего значения СЕИ,
- замена некоторого значения СЕИ на новое значение.
Операции над структурой СЕИ:
Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами.
Декомпозиция приходного ордера может привести, например, к двум СЕИ:
Цены(Ннм,Цена);
Приход(Дата,Пост,Склад,Ннм,Кво-док,Кво-пр,Сумма).
Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями, в частности, композиция Цены и Приход дает Прих.
Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой. Одновременно происходит перекомпоновка значений СЕИ.
Нормализация приходного ордера приводит к следующему результату:
Дата | Пост | Склад | Ннм | Кво-док | Кво-пр | Цена | Сумма |
01.10.95 | 5.00 | 80.00 | |||||
01.10.95 | 6.00 | 48.00 | |||||
07.10.95 | 6.00 | 60.00 | |||||
07.10.95 | 8.00 | 64.00 | |||||
07.10.95 | 5.00 | 25.00 |
Рисунок 1.9 Нормализация СЕИ
Свертка - операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой. Свертка нормализованного приходного ордера может быть произведена в исходную структуру, а также в другие ненормализованные документы, имеющие экономический смысл, например карточку складского учета (рис.1.10).
Карт | ||||||||
Склад | Ним | Цена | ||||||
5,00 | ||||||||
Пост | Дата | Кво-док | Кво-п | Сумма | ||||
1 728 | 01.10.95 07.10.95 | 80,00 25,00 | ||||||
Карт | |||||||||
Склад | Ннм | Цена | |||||||
6.00 | |||||||||
Пост | Дата | Кво-док | Кво-пр | Сумма | |||||
1 728 | 01.10.95 07.10.95 | 48,00 60,00 | |||||||
Карт | |||||||||
Склад | Ннм | Цена | |||||||
8,00 | |||||||||
Пост | Дата | Кво-док | Кво-пр | Сумма | |||||
07.10.95 | 64,00 | ||||||||
Рисунок 1.10 -Карточки складского учета
1.10 Экономические показатели и документы
Документом называют материальный носитель информации, содержащий оформленное в установленном порядке сообщение и имеющий юридическую силу.
При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты, называемые показателями.
Показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа. Показатель удобно применять как обобщающую единицу измерения объема данных.
Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс. Материальные процессы, как известно, имеют качественную и количественную характеристики. Соответственно и атрибуты делятся на два класса: «атрибуты-признаки» и «атрибуты-основания».
Атрибут-признак представляет собой информационное отображение качественного свойства некоторого объекта, предмета, процесса.
Атрибут-основание является отображением их количественного свойства.
В состав показателя должны входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания.
Для установления признаков и оснований в конкретных документах можно использовать следующие закономерности:
1) Если значение атрибута является исходным данным или результатом арифметической операции - это основание.
2) Если значение текстовое - это признак.
3) Если атрибут обозначает предмет - это признак.
4) Если атрибут в некотором показателе является признаком (основанием), - он будет играть эту роль и в других показателях.
5) Если показатели описывают сходные процессы - их призначные части совпадают.
6) Если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.
Минимальный набор атрибутов показателя должен содержать:
- атрибуты, отображающие идентификаторы объектов,
- атрибуты, отображающие признак времени,
- атрибут, отображающий некоторое количественное свойство объекта или взаимодействия.
Закономерности, установленные в математике для арифметических операций над переменными с индексами, трансформируются в правила арифметических действий над показателями.
Критерием качества создания базы данных может служить минимальная избыточность хранимой информации. Обычно минимальная избыточность выражается принципом: каждое сообщение хранится в БД один раз. Соблюдение этого принципа сокращает объем памяти ЭВМ, требуемой для хранения базы данных, сокращает трудоемкость ввода данных в ЭВМ и упрощает проблемы контроля достоверности вводимой информации, упрощает алгоритмы корректировки данных, так как корректировка сообщения может быть проведена за одно обращение к базе данных.
Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью. Для этого сначала расчленяют все сведения, циркулирующие в ЭИС,на показатели, а потом объединяют атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.
Описание хранимой и обрабатываемой информации в ЭИС делается с разной степенью детализации. Используются три уровня представления (рис. 1.11):
1) Внешний уровень - описание информационных потребностей конечного пользователя.
2) Концептуальный уровень - описание информационных потребностей на уровне понятий ЭИС.
3)Внутренний уровень - описание способа хранения информации в памяти ЭВМ и методов доступа к ней.
Внутренний уровень наиболее близок к физической памяти ЭВМ, внешний уровень наиболее близок к пользователям, а концептуальный уровень занимает промежуточное положение.
Пользователи
Рисунок1.11 Детализация представлений ЭИС.
1) Внешнее представление может пользоваться любым аппаратом понятий. Единственное требование состоит в возможности преобразования его в концептуальное представление. Внешнее представление оказывается достаточным для применения ряда прикладных программ, которые можно охарактеризовать как генераторы отчетов. Генерация отчетов предполагает преобразование потока входной информации в выходной поток.
2) Концептуальное представление описывает полное информационное содержание базы данных в более абстрактной форме по сравнению со способом физического хранения данных. Цель концептуального уровня - создать такое формальное представление о базе данных, чтобы любое внешнее представление являлось его подмножеством.
Концептуальный уровень описания оказывается достаточным для использования программной поддержки в виде систем управления базами данных. Концептуальное описание при этом необходимо адаптировать к требованиям конкретной СУБД, значительно упрощаются вопросы разработки программного обеспечения системы, сокращаются сроки разработки ЭИС.
К концептуальному представлению предъявляется требование устойчивости. Это означает, что ряд изменений в предметной области не должен приводить к обязательной корректировке концептуального представления.
При обработке данных правила описания данных содержатся в моделях данных, а описание информации для конкретной ЭИС называется представлением, схемой или структурой. Принципиальными различиями обладают три модели данных - реляционная, сетевая и иерархическая, у которых разные множества допустимых информационных конструкций.
3) Внутреннее описание данных определяет организацию данных в памяти ЭВМ и методы доступа к данным. Основные методы организации даннных - последовательный, цепной или списковый и древовидный. Это наиболее детальное описание процессов обработки данных в ЭИС. Если ЭИС разработана с применением СУБД, то требуемые параметры внутреннего описания довольно немногочисленны.
Если структура хранимой базы данных меняется, то должны обеспечиваться все требования концептуального описания системы, существовавшие до начала изменений.
Наличие нескольких уровней детализации позволяет расчленить процесс проектирования ЭИС на несколько более простых шагов, а также предоставить возможность участия в разработке ЭИС пользователям и специалистам, не имеющим профессиональной подготовки в области обработки данных.
1.12. Жизненный цикл ЭИС
В жизненном цикле ЭИС можно выделить несколько этапов, относящихся к ее разработке и эксплуатации.
Разработкой (проектированием) ЭИС называется процесс составления описания еще не существующей системы на разных языках и с различной степенью детализации, в ходе которого осуществляется оптимизация проектных решений.
Этапами проектирования являются:
- обоснование создания ЭИС;
- разработка технического задания;
- техническое проектирование;
- рабочее проектирование;
- ввод ЭИС в действие.
Более детальное описание работ на стадии проектирования включает в себя следующие действия.
1) Обследование предметной области. Результатом обследования является техническое задание (ТЗ).
2) Определение объектов иих атрибутов.
3) Установление всех структурных связей между объектами и процессами. Разработка структуры базы данных, проверка ее корректности и полноты.
4) Определение технологии работы ЭИС, т.е. определение порядка сбора, контроля и хранения данных.
5) Выбор ЭВМ и СУБД. Оценка требуемых объемов памяти и трудоемкости разработки программ.
6) Проверка корректности проекта и определение сроков его реализации.
Итогом перечисленных выше действий становится технический проект (ТП) ЭИС.
Проектирование | Эксплуатация. Моди- фикация | Утилизация | |
Тз и ТП | РП | Ввод | Использование Старого проекта в новом Использование Содержимого БД Продажа компонентов ЭИС |
Обследование ПО Идентификация Структура БД Технология Выбор ЭВМ и СУБД Проверка Корректности | Описание БД Интерфейсы Программирование Тестирование Обучение | Актуализация БД Опытная эксплуатация Авторский надзор |
Рисунок1.12 Этапы жизненного цикла ЭИС
На стадии рабочего проектирования (РП) необходимо:
- создать описания всех компонентов базы данных;
- разработать экранные формы и системы меню для всех групп пользователей,
- разработать программы для всех приложений,
- заполнить ЭИС отладочными данными и оттестировать ее,
- составить инструкции по работе с ЭИС и обучить пользователей.
Ввод в эксплуатацию:
- актуализация БД,
- опытная эксплуатация,
- авторский надзор.
Стадию эксплуатации можно охарактеризовать как период стабильного функционирования ЭИС, не требующий изменения ранее принятых проектных решений. Процесс эксплуатации обычно через некоторые периоды времени прерывается стадиями модификации системы.
Под стадией модификации будем понимать процесс корректировки проектных решений по отдельным компонентам ЭИС. Стадия эксплуатации начинается с заполнения ЭИС реальными данными. На стадии эксплуатации ЭИС требуется обеспечить реорганизацию БД, рестарт и восстановление, копирование БД, контроль непротиворечивости БД.
Этапы эксплуатации поочередно меняются с этапом модификации ЭИС до тех пор, пока не наступит момент морального старения ЭИС и будет принято решение о ее ликвидации и разработке принципиально новой системы. Важность модернизации ЭИС можно пояснить такими данными: стоимостные затраты на модернизацию ЭИС достигают примерно трети объема эксплуатационных расходов, т.к. за год в ЭИС обычно меняется 10-40% первичных документов и 20-50% выходных документов.
При утилизации ЭИС: используется старый проект в новом; используется содержимое БД; продажа компонентов ЭИС.