Развитие систем обработки данных

 

По мере возникновения новых потребностей в хранении или обработке данных создавались все новые и новые файлы. Отдельные группы внутри организаций разрабатывали собственные приложения, накапливая и поддерживая необходимые данные в частных файлах. Прикладные программы разрабатывались с учетом имеющихся файлов данных, и наоборот, при этом много информации неявным образом содержалось в организации взаимосвязи между программой и файлом.

Организации постепенно осознавали необходимость централизации управления данными и приложениями. Понимание этой необходимости приходило различными путями.

Во-первых, руководители высшего уровня очень быстро обнаружили, что требуемую для принятия решений информацию не очень легко получить. Чтобы выполнить запрос на информацию, необходимо было написать прикладную программу, способную обработать несколько частных файлов, каждый со своим собственным форматом. Руководитель часто был вынужден отказываться от запроса из-за того, что за время, в течение которого информация могла быть получена, она становилась бесполезной, или из-за того, что ценность информации не соответствовала затратам на ее получение.

Во-вторых, принятие решений сдерживалось отсутствием целостности данных. Отчеты, полученные с помощью ЭВМ, имели много расхождений по той причине, что логически идентичные элементы данных имели разные значения. Это было вызвано дублированием данных в частных файлах и непоследовательным проведением их обновления. Имелось также дублирование усилий по накоплению данных и выдаче отчетов. Вычислительные ресурсы, память и машинное время расходовались нерационально.

В-третьих, развитие технологии подошло к такому уровню, когда стало возможным проектировать, накапливать и обрабатывать большие наборы данных в вычислительной среде. В конце концов организации осознали значимость такого ресурса, как данные, и необходимость централизованного управления ими. Поэтому во второй половине 60-х и в 70-х годах получили распространение информационные системы, имеющие название банки данных.Под банком данных понимается совокупность базы данных (БД), прикладных программ (ПП), пользователей банка данных, СУБД и словарей- справочников. Структура автоматизированного банка данных представлена на рис. 1.3. Данные в таких системах формируются в специально организованные базы данных. Таким образом, понятие базы данных было сформулировано только в недавние годы. База данных может быть определена как совокупность предназначенных для машинной обработки данных, которая служит для удовлетворения нужд многих пользователей в рамках одной или нескольких организаций. Ключевым моментом является то, что база данных, будучи интегрированным средством, предназначена для использования всеми членами организации, которым необходима информация, содержащаяся в базе данных. Информация уже не скрыта в сочетании «файл-программа», она хранится явным образом в базе данных, которая может включать много различных типов логических записей. База данных ориентирована на интегрированные требования, а не на одну программу, как было с частными файлами данных.

 
 

 

Рис. 1.3

 

Наиболее широко база данных используется в управленческой деятельности благодаря следующим свойствам:

ü Скорость. Вычислительная техника позволяет осуществить оперативный доступ к информации.

ü Полная доступность. Вся информация, содержащаяся в базе данных, доступна для использования.

ü Гибкость. Имеется возможность получать ответы на те вопросы, которые ранее оставались без ответа. Изменения в базу данных вносятся сравнительно легко.

ü Целостность. Уменьшилось дублирование данных, появилась возможность упорядочить проведение обновления, что привело к согласованности данных.

Однако наличие базы данных само по себе не разрешает полностью проблем организации в области обработки данных и принятия решений. Управление базой данных, являющейся достоянием многих пользователей внутри организации, должно осуществляться с пользой для всей организации и с точки зрения организации в целом, а не отдельных пользователей. Пользователи, естественно, стремятся развивать приложения для своих собственных целей, вовсе не интересуясь тем, какое влияние оказывают эти новые приложения на других пользователей. Без централизованного управления базой данных ее полезность со временем снижается.

Переход от структуры БД к требуемой структуре в программе пользователя осуществляется автоматически с помощью СУБД.

СУБД – это система управления базой данных, т.е. комплекс программных средств, обеспечивающих загрузку информации в базу данных, реорганизацию и ведение базы, поиск и преобразование информации для обеспечения работы программ пользователей банка данных. Каждой прикладной программе СУБД предоставляет интерфейс с базой данных и располагает средствами непосредственного доступа к ней. Таким образом, СУБД играет центральную роль в функционировании автоматизированного банка данных.

 
 

В последнее время наметилась новая тенденция в технологии БД –использование баз знаний. Под банком знаний будем понимать банк, имеющий в своем составе интеллектуальный интерфейс, обеспечивающий непосредственное взаимодействие конечных пользователей с вычислительной системой. Наиболее общая структура банка знаний приведена на рис. 1.4.

 

Рис. 1.4

 

Диалоговый процессор переводит сообщения пользователя с естественного языка во внутреннее представление. Формализованное описание исходной задачи поступает на вход планирующей системы (планировщика), который и преобразует это описание в рабочую программу. Планировщик, представляющий собой специальный комплекс программ, во время своей работы постоянно контактирует с базой знаний. Из этой базы он получает, во-первых, информацию о проблемной среде и способах решения тех или иных задач и, во-вторых, информацию о том, как составляются рабочие программы, сведения о возможностях автоматического синтеза программ из набора базовых программных модулей, имеющихся в банке знаний. Из баз данных через СУБД получается вся необходимая информация для выполнения синтезированной прикладной программы, данные, получаемые из БД, выступают в этом случае как входные аргументы прикладной программы.

Синхронизация взаимодействия (управление всем этим комплексом программ) осуществляется программным блоком-монитором При отсутствии необходимой информации в БД и БЗ знания качественного характера могут быть получены с помощью подсистемы пополнения знаний, которая реализует логические алгоритмы синтеза новых знаний. Кроме того, она обеспечивает автоматическое пополнение и модификацию знаний исходя из результатов взаимодействия с конечным пользователем, т.е. в соответствии с изменением проблемной среды.

В настоящее время известно много вариантов построения банков знаний. Можно выделить следующие виды банков знаний:

· интеллектуальные информационные системы;

· интеллектуальные пакеты прикладных программ;

· экспертные системы.

Появление таких систем привело в последнее время к очень существенным, поистине революционным изменениям в технологии обработки информации.

Интеллектуальные информационные системы представляют собой развитие традиционных банков документов и банков данных на основе использования интеллектуального интерфейса. Среди отечественных систем этого вида известность получили системы ДИЛОС (диалоговая информационно-логическая система), ПОЭТ (программа обработки экономических текстов), ЗАПСИБ (запрос к справочно-информационной базе).

Интеллектуальные пакеты прикладных программ накапливают значения в виде моделей, алгоритмов и процедур и позволяют конечному пользователю решать задачи по их словесным описаниям и исходным данным без программирования процесса решения задач.

Одним из наиболее важных видов являются экспертные системы, к появлению которых в последнее время также привели успехи в области искусственного интеллекта, они имитируют поведение экспертов при принятии решений в отдельных узкоспециализированных областях знаний. Основная задача в этом случае состоит в оказании помощи специалистам на основе использования знаний о предметной области, полученных из самых разнообразных источников: книг, статей, научно-технической документации, от экспертов-специалистов и т.п. В экспертных системах хранится информация, обещающая коллективный опыт, накопленный в некоторой проблемной области, например в медицине, ремонтном обслуживании сложной аппаратуры, геологии и др. Такие экспертные системы используются в качестве автоматизированных «консультантов» специалиста, обратившегося за помощью к экспертной системе. Таким специалистом, например, может быть молодой врач, испытывающий затруднения в установлении диагноза болезни по совокупности непонятных ему симптомов. Экспертная система должна дать ему «совет» в установлении диагноза и объяснить непонятное для него явление.

На работе и в обыденной жизни человек нередко попадает в ситуацию, когда для принятия верного решения необходимо переработать большие объемы информации, рассмотреть множество альтернатив, учесть влияние различных факторов, оценить вероятные последствия того или иного решения. Такая ситуация возникает, когда нужно справиться с плохо структурированными задачами, для решения которых невозможно построить строгий алгоритм решения. Вот почему все чаще взоры людей, ответственных за принятие решений, обращаются к системам, получившим название «системы поддержки принятия решений» (СППР). СППР успешно применяются всюду, где необходимо проводить анализ и выбор по многим количественным и качественным критериям. Сегодня в России существует ряд групп, занимающихся разработкой и распространением программного обеспечения в области СППР. Первые пакеты класса СППР появились еще в середине 80-х годов, и с тех пор их принципиальная схема не изменилась. Традиционно система поддержки принятия решений включает два главных компонента: базу данных и базу моделей.

База данных содержит информацию об анализируемых объектах, а в базе моделей хранятся математические модели многокритериального (сравнительного) анализа информации. Сегодня известны десятки таких моделей, каждая из которых имеет свои свойства и особенности. Назначение моделей – получить от пользователя информацию о его предпочтениях (или в виде весовых коэффициентов показателей, или в виде результатов парных сравнений важности показателей, или в виде опорных точек в пространстве решений, указывающих, что «этот вариант лучше того») и, используя определенные процедуры, упорядочить сравниваемые альтернативы.

Но сложность ситуации состоит в том, что не существует в природе метода, который давал бы истинный результат. Когда мы имеем дело со сложными многокритериальными объектами, один аналитический метод может ставить «Мерседес» выше «Вольво», другой – наоборот. Поэтому выбор моделей для включения в СППР всегда был и остается «головной болью» разработчиков такого рода пакетов. Кроме того, искусство разработки СППР заключается в создании инструмента, позволяющего возможно более точно и тонко моделировать пользовательскую ситуацию принятия решения.

Развитие СППР видится во включении в пакеты технологий искусственного интеллекта – баз знаний, оболочек экспертных систем, в широком использовании графических интерфейсов. Расширение круга отечественных пользователей СППР будет идти одновременно с развитием цивилизованного рынка, требующего внимательной оценки и глубокого анализа при выборе инвестиционных программ, отбора персонала, при проведении маркетинговых исследований. Сегодня на российском рынке имеется ряд СППР, одними из которых являются: Pilot, «Инвестор», EXCO.

Система Pilot ориентирована на решение традиционных задач многократного сравнительного анализа в различных проблемных областях – от подбора кадров до оценки месторождений полезных ископаемых.

Система «Инвестор» предназначена для сравнительной оценки и отбора перспективных инновационных проектов, а также для оптимизации распределения ресурсов по времени финансирования проектов.

Система EXCO предназначена для обеспечения работы экспертного совета – от регистрации конкурсных проектов до вынесения окончательного решения.

3. Системы типа «Гипертекст»

Гипертекст – это текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите выделенные в тексте слова. Если их отметить курсором, то будет выполнено некое действие, связанное с данным выделенным словом, например, на экране появится текст, на который ссылалось это слово, возможно, это другой участок текста этого же документа, а возможно, совсем другой документ.

Гипертекстовые системы представляют собой новый класс систем управления информацией. Цель создания таких систем – дать возможность пользователям создавать, распространять, связывать друг с другом и использовать массивы самой разнородной информации в форме текста, графиков, изображений, аудио-, видеоинформации, программ и т.п.

Дальнейшим развитием идеи гипертекста является гипермедиа. Гипермедиа – это синтез гипертекста и мультимедиа. То есть гипермедиа – это документ, включающий не только гипертекст, но и графику, а также звук и видео со встроенными ссылками, которые могут быть привязаны к любым элементам данного документа, где активными могут быть разные элементы документа (текст, графика и т.п., а также их отдельные части). Перспективы применения систем гипермедиа заключаются в возможностях создания сложных информационных массивов, имеющих связи с другими массивами.

В общих чертах гипертекстовую систему можно рассматривать как систему баз данных, которая обеспечивает совершенно разные методы доступа и управления информацией. Однако, в отличие от традиционных систем баз данных, которые имеют регулярную, упорядоченную структуру, гипертекстовые системы баз данных не имеют строгой структуры, и пользователь может оперировать информацией различными доступными ему методами.

Основная идея гипертекстовых систем заключается в концепции автоматически поддерживаемых связей как внутри одного документа, так и между различными документами. Поддержка таких связей позволяет организовывать нелинейные текстовые структуры. Преимущества нелинейных документов очевидны: в отличие от линейного документа, например, статьи в журнале, которая является одноуровневым, неизменяемым и имеющим ограниченный набор ссылок, гипертекстовый документ представляет собой гибкую структуру, которая может быть ориентирована на конкретного читателя. Читатель по желанию может либо ограничиться поверхностной информацией одного уровня, либо при необходимости получать более полную информацию других уровней, не тратя времени на поиск нужных документов по ссылкам.

Создатель гипертекстового документа может дополнять документ новыми ссылками, обновлять отдельные части документа, не меняя структуры в целом, а также изменять структуру документа, не меняя содержимого отдельных частей.

Гипертекст был определен как подход к управлению информацией, при котором данные хранятся в узлах некой сети, соединенные связями. Хранимая в узлах информация может иметь текстовый, графический или какой-либо другой вид. Узел обычно представляет одиночное понятие или идею и может содержать текстовую, графическую или какую-либо другую форму информации. На экране пользователя узлы могут быть представлены как текст (в виде статьи, предложения, оглавления и др.), как части экрана и т.д., специально выделенные, чтобы передать их семантический смысл. Связи представляют отношения между узлами-понятиями. Они могут быть двунаправленными, позволяя возвращаться от последующего узла к предыдущему (т.е. делать шаг назад).

Основные черты гипертекстовых систем следующие :

· Графический пользовательский интерфейс, позволяющий пользователям ориентироваться в море информации путем установления связей с узлами и получения информации о содержимом узлов.

· Управляющая система с инструментом создания и управления узлами и связями (система для создания гипертекстовых документов) .

· Механизм поиска информации либо традиционный – типа поиска по ключевым словам, авторам, тематике, либо возможность создания механизма поиска по запросам пользователя.

· Механизм управления информацией об узлах и связях между ними.

· Система хранения информации, которая может быть, например, файловой системой, системой баз знаний либо системой управления реляционными или объектно-ориентированными базами данных.

Ярким примером глобальной гипертекстовой системы является WWW («Всемирная паутина»). Гипертекстовая система WWW была предложена в марте 1989 г. как система для обмена информацией среди участников Европейского центра ядерных исследований (CERN). В настоящее время WWW является одной из наиболее распространенных систем не только в сфере физических исследований, но и во многих других областях, поскольку является удобным и мощным инструментом управления информацией. Она дает универсальный доступ к большому объему документов на WWW-серверах и, сверх того, поддерживает ряд наиболее распространенных протоколов для общения с другими информационными системами. WWW работает по принципу клиент – сервер.

Для создания и использования гипертекстовых документов определен язык HTML (HyperText Markup Language), являющийся прикладной разновидностью мощного языка описания документов SGML, являющегося стандартом ISO. Гипертекстовые HTML – документы представляют собой обычные 7-битовые ASCII файлы, содержащие форматные коды, которые определяют внешний вид документа (шрифты, заголовки, параграфы, картинки, изображения и пр.) и гиперсвязи. В действительности HTML – язык простой и прозрачный. «Программировать» гипертексты непосредственно на нём даже проще, чем писать простейшие программы на ПАСКАЛЕ. Для описания форматной и структурной информации HTML использует «tag». Перевод этого термина еще не устоялся, вы можете встретить, например, такие варианты: «тег», «флаг', «ярлык». Tag представляет собой указание (директиву) и необходимые параметры. Указания и параметры должны быть заключены в угловые скобки, отделяющие их от основного текста.

Весь HTML документ помещается в групповые скобки html, т.е. документ обрамляется парными tag-ами <html> и </html>. Шапка – это тоже группа, она открывается tag-ом </head>. Шапка содержит заголовок документа (title). В шапку можно поместить также и обратную ссылку – на тот объект, который породил данный гипертекст, например, указание автора или владельца документа. За шапкой следует тело (boby) документа. И заголовок, и тело документа также являются группами.

Большинство современных БД на основе гипертекстовых систем используют собственные формы хранения данных. Применение в них, например, реляционных форм ограничило бы их применимость, исключив из области их компетенции такие приложения, как системы автоматизированного проектирования (САПР), системы управления документацией (СДУ), геоинформационные системы. Для этого класса приложений характерны сложные, многомерные и большие объемы данных, интенсивный обмен ими. Этот класс приложений требует модель баз данных более выразительную и гибкую, нежели реляционная модель. Предполагается для этого использовать объектно-ориентированные модели.

Многие наработки объектно-ориентированного подхода в его приложении к системному анализу и разработкам, языкам программирования, операционным системам и СУБД можно расширить применительно к гипертекстовой модели.