ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ 2 страница
Информация данной информационной системы рассматривается как некоторое множество - информационная совокупность - и считается внутренней, информация внешнего мира - внешней.
Информация, поступающая в экономическую информационную систему - входящая, а информация, выходящая из нее - исходящая. Входящая информация может быть подразделена на входящую внешнюю, поступающую из внешней среды (например, для предприятия - из министерства, других предприятий и организаций и т. д.), и входящую внутреннюю, получаемую от управляемого объекта, которая отражает обратную связь объекта с управляющим органом, поскольку несет сведения о состоянии объекта. Эту информацию чаще называют первичной (иногда—регистрируемой), так как она возникает в результате первичного учета. Первичная информация имеет важное значение для функционирования информационной системы объекта и управления им. От полноты, достоверности и своевременности первичных данных полностью зависит качество всего последующего преобразования информации.
Взаимосвязь различных потоков информации можно представить связным ориентированным графом, вершины которого отображают моменты наличия определенной информации, а дуги - основные информационные связи между ЭИС, объектом управления и внешней средой, а также основные функции ЭИС.
Общее рассмотрение ЭИС позволяет выделить в кругообороте информации три следующие стадии:
Первая стадия — наблюдение изучаемых явлений (процессов производства и обращения, находящих воплощение в разнообразных хозяйственных операциях); регистрация первичных данных; сбор информации из внешней среды. Эта стадия является этапом получения первичных данных в процессе наблюдения явлений, сбора данных из различных источников по определенной программе и обеспечения ЭИС входящей информацией. Источником информации для системы может служить некоторую внутренняя подсистема, вырабатывающая для рассматриваемой ЭИС входящую внутреннюю информацию.
Вторая стадия - предварительная техническая обработка зарегистрированных исходных данных с целью изготовления сводной, обобщенной информации, характеризующей не отдельные явления и факты, а их совокупность в наиболее удобном для последующего использования виде.
На третьей стадии полученная результатная информация (исходящая для ЭИС) анализируется и изучается. На ее основе делаются выводы об исследуемых явлениях и осуществляется непосредственное воздействие на их ход. Третья стадия является как бы этапом потребления исходящей информации ЭИС.
Единица информации, циркулирующая в ЭИС, является элементом ее информационной совокупности и относится к одной из рассмотренных разновидностей информации. Таким образом, ЭИС определяется наличием установленной совокупности информации, внутренней функции преобразования входящей информации в исходящую, а также динамическим характером этого преобразования (т. е. информация поступает в систему, обрабатывается и выдастся в определенном масштабе времени и циклично).
Любой процесс, как правило, можно разбить на составляющие его процессы, процедуры, действия; объекты – на входящие в них объекты, устройства, предметы, т.е. любая сущность может расчленяться на составляющие ее сущности, а, следовательно, отображающая их информационная система также может быть разбита на составляющие подсистемы. Если составляющие сущности взаимосвязаны, то и отображающие их подсистемы взаимодействуют.
Между подсистемами могут иметь место информационные связи, информацию которых условно можно назвать заимствуемой. По своей природе эта информация является частью промежуточной, выступающей для передающего блока в качестве исходящей информации, а для принимающего блока - в качестве входящей информации. Так, вполне возможно дублирование информации. Наличие заимствуемой информации при разделении подсистем пространством или временем означает дополнительные затраты на передачу данных, их перезапись из одних накопителей на другие, необходимость в промежуточном хранении и согласовании режимов обработки и, как правило, общую задержку в обработке. Однако, в качестве положительного момента разбиения системы на подсистемы, можно отметить возможность параллельной обработки, что существенно улучшает загрузку системы и ускоряет выполнение процедур обработки в целом.
Подсистему, не получающую информацию от другой внутренней подсистемы, можно назвать независимой, а подсистему, получающую информацию от другой - зависимой. Подсистему, вырабатывающую и посылающую информацию другой подсистеме, соответственно можно назвать влияющей (воздействующей), а подсистему, которая не передает информацию другой подсистеме, - не влияющей (не воздействующей).
В многоэлементных системах, какими являются экономические информационные системы, кроме непосредственных воздействий почти всегда наблюдаются и отдаленные воздействия, когда одна подсистема через ряд подсистем косвенно воздействует на другую систему. При изучении динамики ЭИС необходимо учитывать и такие отдаленные воздействия.
Разбиение ЭИС на подсистемы осуществляется двумя способами:
1 Каждая из них полностью сохраняет свойства ЭИС: относится к определенному объекту управления и имеет с ним прямую и обратную связи, получает информацию из внешней среды и передает ей информацию, имеет функцию преобразования данных и динамический характер.
2 Благодаря наличию информационных связей между подсистемами возможны построения структур связей, при которых одна из подсистем имеет с внешней средой или объектом управления лишь связь отдаленного воздействия через другую подсистему.
При разбиении системы на подсистемы и организации связей между ними важно, чтобы структура связей не приводила к потере свойств ЭИС и ее подсистем, которые также, пусть даже с помощью отдаленных связей, должны обладать свойствами ЭИС.
Контрольные вопросы
1 Перечислите базовые принципы, лежащие в основе методологии проектирования информационных технологий и раскройте их содержание.
2 Какие параметры отражает качественная оценка информационных технологий? Количественная оценка?
3 Назовите этапы проектирования информационных технологий и раскройте их содержание.
4 В чем суть процесса оптимизации технологического процесса? Приведите пример критериев оптимизации, обоснуйте целесообразность их применения в том или ином случае.
5 Назовите требования, предъявляемые к технологии диалогового решения. Поясните их.
6 Приведите определение системы, экономической системы, экономической информационной системы. Поясните относительно экономической информационной системы трактовку общесистемных принципов целостности, причинности и познаваемости.
7 Назовите и раскройте сущность основных свойств экономической информационной системы.
8 Какова специфика организационной и функциональной структуры экономической информационной системы?
9 На какие виды может быть разделена информация, циркулирующая в экономической информационной системе?
10 Раскройте специфику существующих подходов разделения экономической информационной системы на подсистемы.
Тема 4. Информационное моделирование профессиональной деятельности.
Основные понятия
Модель – объект-заместитель, который в определенных условиях может заменять объект-оригинал, воспроизводя отдельные его свойства и характеристики.
Моделирование - это процесс построения и изучения моделей систем (как реальных, так и абстрактных).
Процесс – преобразование входных потоков в выходные, осуществляемые в соответствии с некоторыми внутренними правилами.
Накопитель данных – приспособление для хранения информации, обладающее возможностью записи и извлечения данных. Способы доступа и хранения данных в накопителях в ходе анализа не уточняется.
Информационный поток – канал передачи данных от источника к приемнику. В качестве источников и приемников данных для потоков могут выступать внешние сущности, процессы и накопители.
Структура данных – именованная, логически связанная группа элементов и подструктур данных, хранящаяся в накопителе или передаваемая в информационном потоке. Структуры данных являются средством для задания состава и взаимосвязи отдельных элементов данных.
Элемент данных – квант информации, характеризующийся некоторым набором логических параметров – атрибутов, таких как формат, длина, значение по умолчанию и т.п.
Сущность (Entity) - реальный или воображаемый объект, имеющий существенное значение для определенной предметной области.
Внешняя сущность – объект, являющийся поставщиком и/или получателем информации. Например, “заказчик”, “банк” и т.д. Внешние сущности обозначают источники и приемники, которые не представляют для анализа интерес в данный момент и служат для ограничения моделируемой части предметной области.
Независимая сущность (независимая от идентификатора) - если каждый экземпляр может быть однозначно идентифицирован без определения его отношения с другими сущностями.
Зависимая сущность (зависимая от идентификатора) - если однозначная идентификация экземпляра сущности зависит от его отношения с другой сущностью.
Связь - именованная ассоциация между двумя сущностями, значимая для рассматриваемой предметной области. Связь - это ассоциация между двумя сущностями, при которой каждый экземпляр одной сущности ассоциирован с произвольным (в том числе нулевым) количеством экземпляров второй сущности, и наоборот.
Ключ - поле (атрибут) обеспечения связи между сущностями.
Атрибут - любая характеристика сущности, значимая для рассматриваемой предметной области и предназначенная для квалификации, идентификации, классификации, количественной характеристики или выражения состояния сущности.
Атрибут сущности – категория, образуемая теми понятиями, которые соответствуют отличительным признакам реальных объектов, процессов или явлений. Состав этих признаков определяется пользователями, исходя из необходимости выполнения ими своих функциональных обязанностей. Атрибут, рассматриваемый изолированно, сам по себе не имеет какого-либо смысла, а приобретает его только при соотнесении с сущностью. Атрибут принимает значения из допустимого множества значений, которое может быть конечным или бесконечным. Среди совокупности атрибутов, которыми представляется каждая сущность, может быть выделен набор атрибутов, называемый предметным ключом и характеризующийся тем, что значения входящих в него компонентов позволяют однозначно идентифицировать конкретные экземпляры сущностей.
Атрибут связи сущностей - представляет собой некоторую количественную меру, отнесенную к некоторой, определенной в модели ассоциативной сущности. Также как связь сущностей не может существовать без связываемых ею сущностей, так и атрибут связи сущностей (ассоциативной сущности) имеет смысл только при взаимосвязи объектов реального мира. В то же время этот атрибут нельзя приписать какой-либо из фундаментальных сущностей в отдельности.
Жизненный цикл информационной системы – это модель создания и использования системы, отражающая различные состояния, начиная с момента возникновения необходимости в данном комплексе средств и заканчивая моментом его полного выхода из употребления у пользователей.
Структурный анализ - метод исследования системы с помощью ее графического модельного представления, которое начинается с общего обзора и затем детализируется, приобретая иерархическую структуру со все большим числом уровней.
Понятие экономической информационной системы связано в первую очередь с организацией хранения данных и доступа к ним. При этом подразумевается либо хранилище структур данных (связанных множеств записей и способы работы с ними), либо хранение собственно модели предметной области, допускающей организацию доступного конечному пользователю способа взаимодействия с моделью.
При моделировании ЭИС может использоваться несколько моделей: обобщенная (понятийная) модель и модель, представленная схемой базы данных, которые чаще всего дополняются рядом промежуточных (например, модель "сущность-связь" определенного уровня общности).
Моделирование экономической информационной системы базируется на использовании модели предметной области, полученной в результате ее обследования, и включает определение состава и структуры данных предметной области, которые должны находиться в базе данных и обеспечивать выполнение необходимых запросов, задач и приложений пользователя.
Процесс создания информационной модели начинается с определения концептуальных требований пользователей. Требования пользователей интегрируются в едином обобщенном представлении - концептуальной модели.
Концептуальная модель (схема) является моделью логического уровня и представляет собой отображение логических связей между элементами данных безотносительно к их содержанию и среде хранения.
Назначение концептуальной модели, которую еще называют даталогической моделью, заключается в формировании такого представления о базе данных предметной области, чтобы любое внешнее представление являлось его подмножеством. В процессе интеграции внешних представлений устраняются двусмысленности и противоречия в информационных потребностях различных пользователей.
При разработке концептуальной модели проводится структуризация данных и выявление взаимосвязей между ними без рассмотрения особенностей реализации и вопросов эффективности обработки. Проектирование концептуальной модели основано на анализе решаемых специалистом задач и их информационной составляющей. Концептуальная модель включает описания объектов и их взаимосвязей, сведения о технологии обработки информации – применяемых методах контроля достоверности исходных данных, формировании и использовании результатной информации в подразделениях экономической системы, защите информации от несанкционированного доступа и ряде других технологических процедур, представляющих интерес в рассматриваемой предметной области и выявляемых в результате анализа данных и реализации информационных процессов.
Основным требованием, предъявляемым к концептуальной модели, является требование устойчивости. Это означает, что изменения в предметной области не должны приводить к обязательной корректировке концептуальной модели. С другой стороны, концептуальная модель должна быть достаточно абстрактной, т.е. не должна допускать ограничений, вытекающих из программной реализации методов обработки данных.
Концептуальная модель транслируется в модель данных, совместимую с выбранной системе управления базой данных (СУБД). Версия концептуальной модели, которая может быть обеспечена конкретной СУБД, называется логической моделью. Логическая модель отражает логические связи между элементами данных вне зависимости от их содержания и среде хранения. Логическая модель данных может быть реляционной, иерархической или сетевой. Пользователям выделяются подмножества этой логической модели, называемые внешними моделями, отражающие их представления о предметной области.
Наиболее распространенным средством моделирования данных являются диаграммы “сущность-связь”, впервые введенные П. Ченом (Entity-relationship diagram (ERD) – диаграма «Сущность-связь»). ER-диаграмы хорошо вписываются в методологию структурного анализа и проектирования информационных систем. Такие методологии обеспечивают строгое и наглядное описание проектируемой системы, которое начинается с ее общего обзора и затем уточняется, давая возможность получить различную степень детализации объекта с различным числом уровней.
Максимально формализованное описание задачи состоит из следующих компонентов:
- Наименование задачи.
- Цель работы.
- Функции задачи.
- Бизнес-правила.
- Требования к программе.
- Перечень вводимой информации.
- Перечень печатных отчетов.
- Требования к оснащению офиса фирмы компьютерной техникой.
Моделируемая сущность определяется уникальным идентификатором. Каждый экземпляр сущности должен однозначно идентифицироваться и отличаться от других экземпляров данного типа сущности. Каждая сущность должна обладать некоторыми свойствами:
- иметь уникальное имя; к одному и тому же имени всегда должна применяться одна и та же интерпретация; одна и та же интерпретация не может применяться к различным именам, если только они не являются псевдонимами;
- обладать одним или несколькими атрибутами, которые либо принадлежат сущности, либо наследуются через связь;
- обладать одним или несколькими атрибутами, которые однозначно идентифицируют каждый экземпляр сущности.
Сущность может обладать любым количеством связей с другими сущностями модели.
Если между некоторыми сущностями существует связь, то факты из одной сущности ссылаются или некоторым образом связаны с фактами из другой сущности.
Поддержание непротиворечивости функциональных зависимостей между сущностями называется ссылочной целостностью. Поскольку связи содержатся «внутри» реляционной модели, реализация ссылочной целостности может выполняться как приложением, так и самой системой управления базами данных (СУБД) с помощью механизмов декларативной ссылочной целостности и триггеров.
Связи могут быть представлены пятью основными характеристиками:
- тип связи (идентифицирующая, не идентифицирующая, полная/неполная категория, неспецифическая связь);
- родительская сущность;
- дочерняя (зависимая) сущность;
- мощность связи;
- допустимость пустых значений.
Связь (отношение) между сущностями обладает свойством, именуемым мощность (количество экземпляров сущности-потомка, которое может существовать для каждого экземпляра сущности-родителя).
Любая характеристика сущности, значимая для рассматриваемой предметной области и предназначенная для квалификации, идентификации, классификации, количественной характеристики или выражения состояния сущности - атрибут. Атрибут представляет тип характеристик или свойств, ассоциированных со множеством реальных или абстрактных объектов (людей, мест, событий, состояний, идей, предметов и т.д.). Экземпляр атрибута определяется типом характеристики и ее значением, называемым значением атрибута. В модели атрибуты ассоциируются с конкретными сущностями. Таким образом, экземпляр сущности должен обладать единственным определенным значением для ассоциированного атрибута. При проектировании данных рекомендуется создавать атомарные атрибуты.
Для обеспечения связи между сущностями используются понятия ключа:
1 Первичный ключ (главный ключ) - атрибут или группа атрибутов, однозначно идентифицирующая каждый экземпляр сущности. При выборе первичного ключа следует отдавать предпочтение наиболее простым ключам, имеющим числовой тип значений. Первичный (главный) ключ должен обладать следующими свойствами: должен иметь уникальные значения; не должен содержать пустых (неопределенных) значений; должен быть компактным, т.е. должен содержать только такие атрибуты, удаление любого из которых может привести к утрате уникальности.
2 Альтернативный ключ - заменитель главного ключа. Используется для организации поиска данных. Выбирается из числа ключей-кандидатов на роль главного ключа.
3 Внешний ключ - существует только для дочерней сущности и является ссылкой на значение ключа родительской сущности. При создании связей (отношений) между сущностями в дочернюю сущность передаются атрибуты, составляющие первичный ключ родительской сущности. Эти атрибуты и составляют внешний ключ.
Если экземпляр сущности-потомка однозначно определяется своей связью с сущностью-родителем, то связь называется идентифицирующей, в противном случае – неидентифицирующей.
Сущность-родитель в идентифицирующей связи может быть как независимой, так и зависимой от идентификатора сущностью, что определяется ее связями с другими сущностями). Сущность-потомок в неидентифицирующей связи будет независимой от идентификатора, если она не является также сущностью-потомком в какой-либо идентифицирующей связи.
Диаграммы "сущность-связь" лежат в основе проектирования баз данных (БД).
Основные модели, используемые при разработке БД
Реляционная модель
Информационная система представлена в виде совокупности таблиц. Строки в каждой таблице – это кортеж неструктурированных единиц данных, "атрибутов". Набор кортежей, составляющий таблицу, образует математическое отношение. Таким образом, модель данных представляется множеством таблиц-отношений (называемых также R-таблицами); отсюда название "реляционная", т.е. модель, представленная отношениями.
Атрибуты строк-кортежей (и таблиц-отношений) – это значения из заданных наравне с таблицами областей определения ("доменов"). Разные столбцы в одной и той же или в разных таблицах могут иметь одну и ту же область определения, а могут – разные.
Значения атрибутов в таблице-отношении могут иметь только один определенный вид функциональной зависимости друг от друга, а именно, все значения в произвольном кортеже должны по отдельности зависеть только от значений столбца или группы столбцов – одних для всего отношения. Такой столбец или группа столбцов, называются ключевыми, а значения атрибутов в них – ключами.
В рамках реляционной теории имеется список операций, которые можно осуществлять над таблицами, причем так, что результатом снова будет таблица (таким образом, в результате выполнения операции снова образуется реляционная база данных). Обычно это следующие операции:
базовые операции:
- ограничение - исключение из таблицы некоторых строк;
- проекция - исключение из таблицы некоторых столбцов;
- декартово произведение - из двух таблиц получается третья по принципу декартова произведения двух множеств строк;
- объединение - объединение множеств строк двух таблиц;
- разность - разность множеств строк двух таблиц;
- присвоение - именованной таблице присваивается значение выражения над таблицами;
производные операции:
- группа операций соединения;
- пересечение - пересечение множеств строк двух таблиц;
- деление;
- разбиение;
- расширение - добавление новых столбцов в таблицу;
- суммирование - в новой таблице с меньшим, чем в исходной, числом строк, строки получены как агрегирование (например, суммирование по какому-то столбцу) строк исходной.
Помимо "основных" таблиц, составляющих первоначальную основу БД, приведенные операции позволяют получать выводимые таблицы -представления, получаемые в результате применения операций.
Поскольку в основе лежит корректная математическая модель, то любой запрос к базе данных, составленный на каком-либо формальном языке повлечет ответ, однозначно определенный схемой данных и конкретными данными.
Реляционный подход приносит относительную простоту работы разработчику системы, поскольку прикладная область часто описывается в терминах таблиц достаточно естественно.
Е. Кодд, автор реляционного подхода, в конце 70-х гг. предложил правила соответствия произвольной СУБД реляционной модели, дополнив основные понятия реляционных баз данных определениями, важными для практики:
0 Основное (подразумеваемое) правило. Система, которая рекламируется или провозглашается поставщиком как реляционная СУБД, должна управлять базами данных исключительно способами, соответствующими реляционной модели.
1 Информационное правило. Вся информация, хранимая в реляционной базе данных, должна быть явно, на логическом уровне, представлена единственным образом: в виде значений в R-таблицах.
2 Правило гарантированного логического доступа. К каждому имеющемуся в реляционной базе атомарному значению должен быть гарантирован доступ с помощью указания имени R-таблицы, значения первичного ключа и имени столбца.
3 Правило наличия значения (missing information). В полностью реляционной СУБД должны иметься специальные индикаторы (отличные от пустой символьной строки или строки из одних пробелов и отличные от нуля или какого-то другого числового значения) для выражения (на логическом уровне, систематично и независимо от типа данных) того факта, что значение отсутствует по меньшей мере по двум различным причинам: его действительно нет либо оно неприменимо к данной позиции. СУБД должна не только отражать этот факт, но и распространять на такие индикаторы свои функции манипулирования данными не зависимо от типа данных.
4 Правило динамического диалогового реляционного каталога. Описание базы данных выглядит логически как обычные данные, так что авторизованные пользователи и прикладные программы могут употреблять для работы с этим описанием тот же реляционный язык, что и при работе с обычными данными.
5 Правило полноты языка работы с данными. Сколько бы много в СУБД ни поддерживалось языков и режимов работы с данными, должен иметься по крайней мере один язык, выражаемый в виде командных строк в некотором удобном синтаксисе, который бы позволял формулировать:
- определение данных,
- определение правил целостности,
- манипулирование данными (в диалоге и из программы),
- определение выводимых таблиц (в том числе возможности их модификации),
- определение правил авторизации,
- границы транзакций.
6 Правило модификации таблиц-представлений. В СУБД должен существовать корректный алгоритм, позволяющий автоматически для каждой таблицы-представления определять во время ее создания, может ли она использоваться для вставки и удаления строк и какие из столбцов допускают модификацию, и заносящий полученную таким образом информацию в системный каталог.
7 Правило множественности операций. Возможность оперирования базовыми или выводимыми таблицами распространяется полностью не только на выдачу информации из БД, но и на вставку, модификацию и удаление данных.
8 Правило физической независимости. Диалоговые операторы и прикладные программы на логическом уровне не должны страдать от каких-либо изменений во внутреннем хранении данных или в методах доступа СУБД.
9 Правило логической независимости. Диалоговые операторы и прикладные программы на логическом уровне не должны страдать от таких изменений в базовых таблицах, которые сохраняют информацию и теоретически допускают неизменность этих операторов и программ.
10 Правило сохранения целостности. Диалоговые операторы и прикладные программы не должны изменяться при изменении правил целостности в БД (задаваемых языком работы с данными и хранимых в системном каталоге).
11 Правило независимости от распределенности. Диалоговые операторы и прикладные программы на логическом уровне не должны страдать от совершаемого физического разнесения данных (если первоначально СУБД работала с нераспределенными данными) или перераспределения (если СУБД действительно распределенная).
12 Правило соблюдения реляционного языка. Если в реляционной СУБД имеется язык низкого уровня (для работы с отдельными строками), он не должен позволять нарушать или "обходить" правила, сформулированные на языке высокого уровня (множественном) и занесенные в системный каталог.
Реляционная модель данных, несмотря на ее достоинства, в ряде случаев не позволяет ясно (или вовсе) отразить особенности предметной области, так как в ней отсутствуют прямые средства выражения иерархии.
Объектно-ориентированная модель
Основные понятия объектно-ориентированной модели данных:
- объекты, обладающие внутренней структурой и однозначно идентифицируемые уникальным внутрисистемным ключом;
- классы, являющиеся по сути типами объектов;
- операции над объектами одного или разных типов, называемые "методами";
- инкапсуляция структурного и функционального описания объектов, позволяющая разделять внутреннее и внешнее описания (в терминологии предшествовавшего объектному модульного программирования - "модульность" объектов);
- наследуемость внешних свойств объектов на основе соотношения "класс-подкласс".
К достоинствам объектно-ориентированной модели относятся следующие:
- возможность для пользователя системы определять свои сложные типы данных (используя имеющийся синтаксис и свойства наследуемости и инкапсуляции);
- наличие наследуемости свойств объектов;
- повторное использование программного описания типов объектов при обращении к другим типам, на них ссылающимся.
К недостаткам объектно-ориентированной модели можно отнести:
- отсутствие строгих определений; разное понимание терминов и различия в терминологии;
- модель не исследована столь тщательно математически, как реляционная;
- отсутствие общеупотребимых стандартов, позволяющих связывать конкретные объектно-ориентированные системы с другими системами работы с данными.
Модель "объектов-ролей"
В отличие от реляционной в данной модели нет атрибутов, а основные понятия - это объекты и роли, описывающие их.
Роли могут быть как "изолированные", присущие исключительно какому-нибудь объекту, так и существующие как элемент какого-либо отношения между объектами. Модель служит для понятийного моделирования, что отличает ее от реляционной модели. Для описания модели помимо графического языка разработано подмножество естественного языка, не допускающее неоднозначностей, и, таким образом, пользователь (заказчик) не только общается с аналитиком на естественном языке, но и видит представленный на том же языке результат его работы по формализации задачи.