Средства моделирования программных средств документальных и фактографических информационных систем.

Информационная система представляет собой систему, реализующую автоматизированный сбор, обработку и манипулирование данными и включающая технические средства обработки данных, программное обеспечение и обслуживающий персонал.

Бурное развитие компьютерной техники привело к тому, что все большее распространение стали получать информационные системы, базирующиеся на использовании информационно-вычислительной техники и средств коммуникаций, которые являются основными техническими средствами хранения, обработки и передачи информации. Такие информационные системы называют автоматизированными. Они основаны на использовании специальных средств и методов преобразования информации, т.е. автоматизированных информационных технологий.

Автоматизированные информационные системы представляют собой совокупность различных средств, предназначенных для сбора, подготовки, хранения, обработки и предоставления информации, удовлетворяющей информационные потребности пользователей.

Автоматизированные информационные системы разнообразны и могут быть классифицированы по ряду признаков, относящихся как к системе в целом, так и к отдельным ее элементам.

Существуют различные классификации АИС. Например, по характеру обрабатываемой информации выделяют:

· документальные информационные системы;

· фактографические информационные системы.

Эти АИС характеризуются также и специфическими средствами моделирования их структуры.

1. В фактографических информационных системах хранимая и обрабатываемая информация представляет собой конкретные сведения (параметры и характеристики объектов, сведения технико-экономического характера, результаты измерений, справочные и статистические данные). Часто эта информация носит оперативный характер, т.е. регулярно обновляется и изменяется. В этом случае информационные системы являются оперативными.

Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Информация, с которой работает фактографическая ИС, имеет четкую структуру, позволяющую машине отличать одно данное от другого, – например, фамилию от должности человека, дату рождения от роста и т. п. Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы, например: “Сколько велосипедов марки А-18 продал магазин “Спорт” в июне 2004 г.?”, “Кто из работников фирмы с датой рождения не ранее 1 января 1970 г. имеет водительские права?”, “Какие культурно-исторические памятники Санкт-Петербурга включены в список ЮНЕСКО?” и т. д.

При создании фактографической системы важно изучить особенности объектов, сведения о которых хранятся в системе, и логические связи, существующие между объектами в реальном мире, которые определенным образом отображаются в информационных структурах.

2. Документальные информационные системы обслуживают класс задач, которые не предполагают однозначного ответа на поставленный вопрос. В документальных автоматизированных информационных системах объектами обработки, хранения и поиска являются определенные документы (книги, статьи, патенты и прочие информационные материалы). Основной задачей документальных информационных систем является накопление и предоставление пользователю документов, содержание, тематика, реквизиты и т. п. которых адекватны его информационным потребностям. Поэтому можно дать следующее определение документальной информационной системы – единое хранилище документов с инструментарием поиска и отбора необходимых документов. В документальных информационных системах важное значение приобретают вопросы, связанные с оценкой содержания, смысла документа и запроса, с определением степени соответствия смысла (содержания) документа смыслу (содержанию) запроса. Для решения этих вопросов используются специальные способы организации информации и методы поиска, а также привлекаются различные логико-лингвистические средства. Поисковый характер документальных информационных систем исторически определил еще одно их название – информационно-поисковые системы (ИПС).

Современные фактографические системы часто работают с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабженными структурированными описателями.

В зависимости от особенностей реализации хранилища документов и механизмов поиска документальные ИПС можно разделить на две группы:

· системы на основе индексирования;

· семантически-навигационные системы.

В семантически-навигационных системах документы, помещаемые в хранилище (в базу) документов, оснащаются специальными навигационными конструкциями, соответствующими смысловым связям (отсылкам) между различными документами или отдельными фрагментами одного документа. Такие конструкции реализуют некоторую семантическую (смысловую) сеть в базе документов. Способ и механизм выражения информационных потребностей в подобных системах заключаются в явной навигации пользователя по смысловым отсылкам между документами.

В системах на основе индексирования исходные документы помещаются в базу без какого-либо дополнительного преобразования, но при этом смысловое содержание каждого документа отображается в некоторое поисковое пространство. Процесс отображения документа в поисковое пространство называется индексированием и заключается в присвоении каждому документу некоторого индекса-координаты в поисковом пространстве. Формализованное представление (описание) индекса документа называется поисковым образом документа (ПОД). Пользователь выражает свои информационные потребности средствами и языком поискового пространства, формируя поисковый образ запроса (ПОЗ) к базе документов. Система на основе определенных критериев и способов ищет документы, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответствующие документы.

Особенностью документальных ИПС является также то, что в их функции, как правило, включаются и задачи информационного оповещения пользователей по всем новым поступающим в систему документам, соответствующим заранее определенным информационным потребностям пользователя.

Основными средствами моделирования рассматриваемых систем являются -Case – средства

(Computer Aided (помощник, полуавтоматический) Software/System Engineering) позволяют проектировать любые системы на компьютере. Необходимый элемент системного и структурно-функционального анализа, CASE-средства позволяют моделировать бизнес-процессы, базы данных, компоненты программного обеспечения, деятельность и структуру организаций. Применимы практически во всех сферах деятельности. Результат применения CASE-средств - оптимизация систем, снижение расходов, повышение эффективности, снижение вероятности ошибок.

Наиболее трудоемкими этапами разработки ИС являются этапы анализа и проектирования, в процессе которых CASE-средства обеспечивают качество принимаемых технических решений и подготовку проектной документации. При этом большую роль играют методы визуального представления информации. Это предполагает построение структурных или иных диаграмм в реальном масштабе времени, использование многообразной цветовой палитры, сквозную проверку синтаксических правил. Графические средства моделирования предметной области позволяют разработчикам в наглядном виде изучать существующую ИС, перестраивать ее в соответствии с поставленными целями и имеющимися ограничениями.

В разряд CASE-средств попадают как относительно дешевые системы для персональных компьютеров с весьма ограниченными возможностями, так и дорогостоящие системы для неоднородных вычислительных платформ и операционных сред. Так, современный рынок программных средств насчитывает около 300 различных CASE-средств, наиболее мощные из которых так или иначе используются практически всеми ведущими западными фирмами.

· Обычно к CASE-средствам относят любое программное средство, автоматизирующее ту или иную совокупность процессов жизненного цикла ПО и обладающее следующими основными характерными особенностями:

· мощные графические средства для описания и документирования ИС, обеспечивающие удобный интерфейс с разработчиком и развивающие его творческие возможности;

· интеграция отдельных компонент CASE-средств, обеспечивающая управляемость процессом разработки ИС;

· использование специальным образом организованного хранилища проектных метаданных (репозитория).

· Интегрированное CASE-средство (или комплекс средств, поддерживающих полный ЖЦ ПО) содержит следующие компоненты;

· репозиторий, являющийся основой CASE-средства. Он должен обеспечивать хранение версий проекта и его отдельных компонентов, синхронизацию поступления информации от различных разработчиков при групповой разработке, контроль метаданных на полноту и непротиворечивость;

· графические средства анализа и проектирования, обеспечивающие создание и редактирование иерархически связанных диаграмм (DFD, ERD и др.), образующих модели ИС;

· средства разработки приложений, включая языки 4GL и генераторы кодов;

· средства конфигурационного управления;

· средства документирования;

· средства тестирования;

· средства управления проектом;

· средства реинжиниринга.

· Все современные CASE-средства могут быть классифицированы в основном по типам и категориям. Классификация по типам отражает функциональную ориентацию CASE-средств на те или иные процессы ЖЦ. Классификация по категориям определяет степень интегрированности по выполняемым функциям и включает отдельные локальные средства, решающие небольшие автономные задачи (tools), набор частично интегрированных средств, охватывающих большинство этапов жизненного цикла ИС (toolkit) и полностью интегрированные средства, поддерживающие весь ЖЦ ИС и связанные общим репозиторием. Помимо этого, CASE-средства можно классифицировать по следующим признакам:

· применяемым методологиям и моделям систем и БД;

· степени интегрированности с СУБД;

· доступным платформам.

· Классификация по типам в основном совпадает с компонентным составом CASE-средств и включает следующие основные типы:

· средства анализа (Upper CASE), предназначенные для построения и анализа моделей предметной области (Design/IDEF (Meta Software), BPwin (Logic Works));

· средства анализа и проектирования (Middle CASE), поддерживающие наиболее распространенные методологии проектирования и использующиеся для создания проектных спецификаций (Vantage Team Builder (Cayenne), Designer/2000 (ORACLE), Silverrun (CSA), PRO-IV (McDonnell Douglas), CASE.Аналитик (МакроПроджект)). Выходом таких средств являются спецификации компонентов и интерфейсов системы, архитектуры системы, алгоритмов и структур данных;

· средства проектирования баз данных, обеспечивающие моделирование данных и генерацию схем баз данных (как правило, на языке SQL) для наиболее распространенных СУБД. К ним относятся ERwin (Logic Works), S-Designor (SDP) и DataBase Designer (ORACLE). Средства проектирования баз данных имеются также в составе CASE-средств Vantage Team Builder, Designer/2000, Silverrun и PRO-IV;

· средства разработки приложений. К ним относятся средства 4GL (Uniface (Compuware), JAM (JYACC), PowerBuilder (Sybase), Developer/2000 (ORACLE), New Era (Informix), SQL Windows (Gupta), Delphi (Borland) и др.) и генераторы кодов, входящие в состав Vantage Team Builder, PRO-IV и частично - в Silverrun;

· средства реинжиниринга, обеспечивающие анализ программных кодов и схем баз данных и формирование на их основе различных моделей и проектных спецификаций. Средства анализа схем БД и формирования ERD входят в состав Vantage Team Builder, PRO-IV, Silverrun, Designer/2000, ERwin и S-Designor. В области анализа программных кодов наибольшее распространение получают объектно-ориентированные CASE-средства, обеспечивающие реинжиниринг программ на языке С++ (Rational Rose (Rational Software), Object Team (Cayenne)).

ERwin - современное средство проектирования баз данных

Пакеты программ необходимо адаптировать и интегрировать с существующими системами. Хранилища данных объединяют и интегрируют множество баз данных, обеспечивая необходимые бизнесу гибкость и интеллектуальность. Успех применения всех этих приложений зависит от того, насколько хорошо спроектирована база данных. ERwin - мощное и простое в использовании средство конструирования баз данных завоевавшее широкое признание и популярность. Оно обеспечивает высочайшую продуктивность труда при разработке и сопровождении приложений с использованием баз данных. ERwin позволяет наглядно отобразить структуру и основные элементы вашей БД. Это инструмент разработки, способный автоматически создавать таблицы и генерировать тысячи строк текста хранимых процедур и триггеров для всех популярных СУБД. Революционная технология Complete-Compare (Завершить-Сравнить) позволяет организовать итеративную разработку, поддерживая постоянную согласованность модели и базы данных. Благодаря возможностям разбиения на фрагменты, а также совместного и многократного использования моделей, может быть повышена эффективность моделирования и обеспечено соблюдение корпоративных стандартов.

Oracle Designer

Представляет собой инструмент, позволяющий проектировать данные, моделировать бизнес-процессы, создавать диаграммы потоков данных и функциональные модели, а также реализовывать их в виде серверных объектов. Этот продукт главным образом предназначен для применения совместно с СУБД Oracle и поддерживает все особенности данной СУБД, хотя с его помощью можно осуществлять и обратное проектирование для СУБД других производителей.

Oracle Designer представляет собой интегрированную CASE-среду для автоматизации процессов всех этапов жизненного цикла сложной прикладной системы, включая формулировку и анализ требований, детальный анализ предметной области, проектирование, программирование, тестирование и оценка, сопровождение, обеспечение качества, управление конфигурацией, управление проектом, документирование системы.

В основе CASE-технологии и инструментальной среды Oracle лежит методология структурного проектирования, при которой разработка прикладной системы представляется в виде последовательности четко определенных этапов. Oracle Designer поддерживает все этапы жизненного цикла прикладной системы, начиная с общего анализа требований до получения и сопровождения готового программного продукта. В качестве основных этапов процесса разработки системы выделяются моделирование и анализ бизнес-процессов, разработка концептуальных моделей предметной области, проектирование прикладной системы и реализация.

Первый этап связан с моделированием и анализом процессов, описывающих деятельность организации, технологические особенности работы. Целью является построение моделей существующих процессов, выявление их недостатков и возможных источников усовершенствования.

Oracle Warehouse Builder

Oracle Warehouse Builder (OWB) - это многофункциональная расширяемая CASE-среда для разработки и развертывания корпоративных хранилищ и витрин данных.

Построенный на базе открытой архитектуры Common Warehouse Metamodel (CWM), OWB - интегрированное средство, позволяющее решать различные задачи, не прибегая к помощи нескольких узкоспециализированных продуктов. К этим задачам относятся проектирование, создание и администрирование хранилища данных, разработка и генерация процедур извлечения, преобразования и загрузки данных из различных источников, управление метаданными и интеграция инструментальных средств доступа. OWB использует все возможности СУБД Oracle, связанные с технологиями Хранилищ Данных, такие, как материализованные представления, объекты типа "измерение" ("dimension") и так далее. При решении задач администрирования и управления процессами загрузки данных в хранилище OWB опирается на Oracle Enterprise Manager и Oracle Workflow, интегрированные с базой данных Oracle.

Реализованный на Java и снабженный мастерами (Wizards) пользовательский интерфейс OWB существенно облегчает создание, развертывание и поддержку хранилища данных. Продукт позволяет визуально моделировать схему хранилища, либо импортировать метаданные из репозитория Oracle Designer. Разработчик визуально определяет отображения между источниками данных и хранилищем, и OWB затем автоматически генерирует на их основе модули загрузки в виде процедур PL/SQL или скриптов SQL*Loader. Продукт имеет встроенную библиотеку функций преобразования данных, которую при необходимости можно расширять собственными процедурами на PL/SQL. Встроенный в OWB дополнительный компонент Match-Merge предоставляет мощные средства автоматической очистки данных, включающие алгоритмы нечеткой логики, вероятностные модели и так далее. Источниками данных для OWB, помимо СУБД Oracle различных версий, могут быть плоские файлы, СУБД других производителей (доступ через шлюзы и ODBC), а также приложения ERP (Oracle E-Business Suite, SAP R/3 и др.). Также OWB имеет встроенные средства экспорта-импорта метаданных OLAP Option и Oracle Discoverer.