Системах обработки данных

Интегрированные технологии в распределенных

Управление экономикой на любом уровне (предприятие, город, регион, страна) требуют участия в этом процессе достаточно крупных коллективов (внутренних и внешних). Соответственно коллективы могут располагаться в различных отделах предприятия, районах города, регионах страны и в различных странах. Для решения задач управления, обеспечивающих реализацию экономической стратегии, становятся важными и актуальными скорость и удобство обмена информацией, а также возможность тесного взаимодействия всех участвующих в процессе выработки управленческих решений. Возникает логически обоснованное требование перехода к распределенной обработке данных.

Распределенная обработка данных – обработка данных, выполняемая на независимых, но связанных между собой компьютерах, представляющих распределенную систему. Основу ее составляют следующие аспекты:

– много организационно и физически распределенных пользователей, одновременно работающих с общими данными и/или общей базой данных (разные пользователи могут располагаться на различных вычислительных установках, с различными полномочиями и задачами);

– логически и физически распределенные данные, составляющие и образующие, тем не менее, общую базу данных (отдельные таблицы, записи и даже поля могут располагаться на различных вычислительных установках или входить в разные локальные базы данных).

Для реализации распределенной обработки данных были созданы многомашинные ассоциации, структура которых разрабатывается по одному из следующих направлений:

– многомашинные вычислительные комплексы (МВК);

– компьютерные (вычислительные) сети.

Многообразие компьютерных сетей и форм взаимодействия ПК порождает насущную проблему их интеграции или, по крайней мере, соединения на уровне обмена сообщениями.

В распределенных системах используются три интегрированные технологии:

– технология «клиент – сервер»;

– технология совместного использования ресурсов в рамках глобальных сетей;

– технология универсального пользовательского общения в виде электронной почты.

Основная форма взаимодействия в сети – это «клиент – сервер». Обычно один ПК в сети располагает информационно-вычислительными ресурсами (процессоры, файловая система, почтовая служба, служба печати, база данных), а другие ПК пользуются ими. Компьютер, управляющий тем или иным ресурсом, принято называть сервером этого ресурса, а компьютер, желающий им воспользоваться, – клиентом. Если ресурсом являются базы данных, то говорят о сервере баз данных, назначение которого – обслуживать запросы клиентов, связанные с обработкой данных; если ресурс – файловая система, то говорят о файловом сервере или файл-сервере и т.д.

Технология «клиент – сервер», получает все большее распространение, но реализация технологии в конкретных программных продуктах существенно различается.

Исходное положение технологии «клиент – сервер» проявляется в разделении операций обработки данных на три группы, имеющие различную природу. Первая группа – это ввод и отображение данных. Вторая группа объединяет прикладные операции обработки данных, характерные для решения задач данной предметной области. К третьей группе относятся операции хранения и управления данными (базами данных или файловыми системами).

Согласно этой классификации в любом техпроцессе можно выделить программы трех видов:

– программы представления, реализующие операции первой группы;

– прикладные программы, поддерживающие операции второй группы;

– программы доступа к информационным ресурсам, реализующие операции третьей группы.

В соответствии с этим выделяют три модели реализации технологии «клиент – сервер»:

– модель доступа к удаленным данным (Remote Data Access – RDA);

– модель сервера базы данных (DataBase Server – DBS);

– модель сервера приложений (Application Server – AS).

В RDA-модели программы представления и прикладные программы объединены и выполняются на компьютере-клиенте, который поддерживает как операции ввода и отображения данных, так и прикладные операции.

Рисунок 2.4 – Модель доступа к удаленным данным

Доступ к информационным ресурсам обеспечивается или операторами языка SQL, если речь идет о базах данных, или вызовами функций специальной библиотеки. Запросы к информационным ресурсам направляются по сети удаленному компьютеру, например серверу базы данных, который обрабатывает запросы и возвращает клиенту необходимые для обработки блоки данных (рис. 2.4).

DBS-модель строится в предположении, что программы, выполняемые на компьютере-клиенте, ограничиваются вводом и отображением, а прикладные программы реализованы в процедурах базы данных и хранятся непосредственно на компьютере-сервере базы данных вместе с программами, управляющими и доступом к данным – ядру СУБД (рис. 2.5).

Рисунок 2.5 – Модель сервера базы данных

 

В AS-модели программа, выполняемая на компьютере-клиенте, решает задачу ввода и отображения данных, т. е. реализует операции первой группы. Прикладные программы выполняются одним либо группой серверов приложений (удаленный компьютер или несколько компьютеров). Доступ к информационным ресурсам, необходимым для решения прикладных задач, обеспечивается так же, как и в RDA-модели.

Прикладные программы обеспечивают доступ к ресурсам различных типов – базам данных, индексированным файлам, очередям и др. RDA- и DBS-модели опираются на двухзвенную схему разделений операций. В AS-модели реализована трехзвенная схема разделения операций, где прикладная программа выделена как важнейшая (рис. 2.6).

 

 

Рисунок 2.6 – Модель сервера приложений

 

Главное преимущество RDA-модели состоит в том, что она представляет множество инструментальных средств, которые обеспечивают быстрое создание приложений, работающих с SQL-ориентированными СУБД. Иными словами, основное достоинство RDA-модели заключается в унификации и широком выборе средств разработки приложений. Подавляющее большинство этих средств разработки на языках четвертого поколения, включая и средства автоматизации программирования, обеспечивает разработку прикладных программ и операций представления.

Несмотря на широкое распространение, RDA-модель уступает место более технологичной DВS-модели. Последняя реализована в некоторых реляционных СУБД (Ingress, SyBase, Oracle).

В DBS-модели приложение является распределенным. Программы представления выполняются на компьютере-клиенте, в то время как прикладные программы решения задач оформлены как набор хранимых процедур и функционируют на компьютере-сервере БД. Преимущества DBS-модели перед RDA-моделью очевидны: это и возможность централизованного администрирования решения экономических задач, и снижение напряженности, и возможность разделения процедуры между несколькими приложениями, и экономия ресурсов ПК за счет использования однажды созданного плана выполнения процедуры.

Основным элементом принятой в AS-модели трехзвенной схемы является сервер приложения. Он реализует несколько прикладных функций, каждая из которых оформлена как служба и предоставляет услуги всем программам, которые желают и могут ими воспользоваться. Серверов приложений может быть несколько, и каждый из них предоставляет определенный набор услуг. Любая программа, которая пользуется ими, рассматривается как клиент приложения. Детали реализации прикладных программ в сервере приложений полностью скрыты от клиента приложения.

AS-модель имеет универсальный характер. Четкое разграничение логических компонентов и рациональный выбор программных средств для их реализации обеспечивают модели такой уровень гибкости и открытости, который пока недостижим в RDA- и DBS-моделях. Именно AS-модель используется в качестве фундамента относительно нового вида программного обеспечения – мониторов транзакций.

Мониторы обработки транзакций (Transaction Processing Monitor – ТРМ), или просто мониторы транзакций, – программные системы, обеспечивающие эффективное управление информационно-вычислительными ресурсами в распределенной сети, представляют собой гибкую, открытую среду для разработки и управления мобильными приложениями, ориентированными на оперативную обработку распределенных транзакций.

Понятия транзакции в ТРМ и традиционных СУБД несколько различны. Транзакция в СУБД – это атомарное действие над базой данных. В ТРМ транзакция трактуется гораздо шире: она включает не только операции с данными, но и любые другие действия – передачу сообщений, запись в индексированные файлы, опрос датчиков и т.д. Это и позволяет реализовывать в ТРМ прикладные действия предметной области, в то время как СУБД это сделать не в состоянии.

Основная функция ТРМ – обеспечить быструю обработку запросов, поступающих к AS от множества клиентов – сотен и даже тысяч. ТРМ обладают возможностями, которые существенно снижают стоимость обработки данных в режиме on-line. Небольшие затраты на приобретение ТРМ компенсируются экономией на СУБД. Как правило, стоимость современных СУБД рассчитывается исходя из числа одновременных подключений. Экономист-пользователь считается подключенным к СУБД, начиная с момента открытия сеанса с базой данных и заканчивая ее закрытием. В течение сеанса СУБД считает пользователя активным и вынуждена хранить факт его подключения даже в том случае, если пользователь вообще не направляет запросов СУБД, а решает свои внутренние задачи.

Эффективная обработка сообщений может быть повышена за счет использования систем управления очередями. Разработчики ТРМ обычно включают в арсенал своих систем специальный менеджер ресурсов, отвечающий за управление очередями.

Управление очередями возложено на специальную программу. Помещение в очередь и выборка из них – прерогатива серверов, которые запрашивают менеджер очередей для выполнения соответствующих действий.

Упрощенно работа с очередями выглядит следующим образом. Пользователь посылает запрос конкретной службе (выделенному серверу), который помещает сообщение в очередь запросов к данной службе. Другой сервер извлекает сообщение из очереди запросов, выполняет предписанные действия и формирует ответ на запрос также в виде сообщения, посылая его в очередь ответов.

Возможность хранения очередей сообщений в долговременной памяти позволяет говорить о практически стопроцентной надежности взаимодействия клиента и сервера. В случае сбоя ПК все сообщения сохраняются, а их обработка возобновляется с той точки, где произошел сбой.

На современном рынке мониторов транзакций наиболее популярными являются такие системы, как ACMS (DEC), CICS (IBM), TOP END (NCR), PATHWAY (Tandem), ENCINA (Transarc), TUXEDO System (USL).

Среди сетевого программного обеспечения (СПО) можно выделить три класса систем: слабые, средние и серьезные. К первому классу принадлежат программы типа Lap Link или типа коммуникационных средств программы Тotal Commander. Они обычно занимают минимум ресурсов сервера и соединяют с сервером только одну машину.

Ко второму классу СПО относятся программы типа Lantastic, NetWare Lite и Lansmart и др. Такие СПО обычно позволяют выполнять большинство сетевых задач. При старте программы выделяется компьютер – сервер сети. В таких сетях ПК тоже потребляют достаточно мало ресурсов сервера.

СПО третьего класса работают достаточно независимо от операционной системы и часто используют свои драйверы низкого уровня для доступа к ресурсам сервера.

Следует различать чистые операционные системы (например, UNIX) и сетевые операционные системы (например, NetWare). В первых обычно значительно более развиты многозадачные традиционные возможности. Можно сказать, что UNIX – это операционная система, в которую добавили средства обеспечения локальной сети, а NetWare есть система разделения ресурсов, в которую добавили средства операционной системы.

К третьему классу относятся СПО NetWare фирмы Nowell, Banyan Vines и др.

Технологии совместного использования ресурсов в рамках глобальных сетей представляют уникальный симбиоз компьютеров и коммуникаций. Идет активное включение всех стран во всемирные сетевые структуры. Возрастает потребность в средствах структурирования, накопления, хранения, поиска и передачи информации. Удовлетворению этих потребностей служат информационные сети и их ресурсы. Совместное использование ресурсов сетей (библиотек программ, баз данных, вычислительных мощностей) обеспечивается технологическим комплексом и средствами доступа.

Глобальные сети (Wide Area Network, WAN) – это телекоммуникационные структуры, объединяющие локальные информационные сети, имеющие общий протокол связи, методы подключения и протоколы обмена данными. Каждая из глобальных сетей (Internet, Bitnet, DECnet и др.) организовывалась для определенных целей, а в дальнейшем расширялась за счет подключения локальных сетей, использующих ее услуги и ресурсы.

Крупнейшей глобальной информационной сетью является Internet (Интернет). Передача данных в этой сети организована на основе протокола Internet – IP (Internet Protocol), представляющего собой описание работы сети, которое включает правила налаживания и поддержания связи в сети, обращения с IP-пакетами и их обработки, описания сетевых пакетов семейства IP. Сеть спроектирована таким образом, что пользователь не имеет никакой информации о конкретной структуре сети. Чтобы послать сообщение по сети, компьютер размещает данные в некий «конверт», называемый, например, IP, с указанием конкретного адреса.

Процесс совершенствования сети идет непрерывно, большинство новаций происходит незаметно для пользователей.

В России подключение к Интернет началось в начале 1990-х гг. Архитектура сетевых протоколов ТСР/IР, на основе которых построена Интернет, предназначена специально для объединенной сети. Сеть может состоять из совершенно разнородных подсетей, соединенных друг с другом шлюзами. В качестве подсетей могут выступать локальные (Token Ring, Ethernet, пакетные радиосети и др.), национальные, региональные и специализированные сети, а также другие глобальные сети, например Bitnet или Sprint. К этим сетям могут подключаться машины разных типов. Каждая из подсетей работает в соответствии со своими специфическими требованиями и имеет свою природу связи, сама разрешает свои внутренние проблемы. Однако предполагается, что подсеть может принять пакет информации и доставить его по указанному в этой подсети адресу. Таким образом, две машины, подключенные к одной подсети, могут напрямую обмениваться пакетами, а если возникает необходимость передать сообщение машине другой подсети, то вступают в силу межсетевые соглашения, для чего подсети используют межсетевой язык – протокол IР. Сообщение передается по цепочке шлюзов и подсетей до достижения нужной подсети, где доставляется непосредственно получателю.

Для обеспечения доступа к глобальным сетям пользователю необходимо осуществить подключение к подсети.

Рассмотрим распространенные виды доступа, основанные на взаимосвязи протокола обмена и типа линии связи.

Непосредственный (прямой) доступ обеспечивает доступ ко всем возможностям сети. Поставщик услуг сдает в аренду выделенную линию с требуемой пропускной способностью и позволяет поместить узловой компьютер (сетевой сервер) непосредственно у заказчика. Этот узел отвечает за связь фирмы с другими узлами и пересылку данных в обе стороны. Данный вид доступа очень дорогой, но, установив однажды такое соединение, пользователь может подключать к этому узлу столько компьютеров, сколько требуется.

Непосредственный доступ предлагает наиболее гибкое подключение. Каждый из компьютеров является полноправным членом сети и может воспользоваться любой из ее функций. Для обслуживания и эксплуатации своего узла потребуется персонал и документация, что увеличивает эксплуатационные затраты.

Доступ через протоколы канального уровня Интернет – SLIP и РРР. SLIP и РРР являются версиями программного обеспечения, которые работают на обычных телефонных линиях, используя стандартные высокоскоростные модемы. SLIP и РРР – это протоколы канального уровня, причем РРР – это более поздний протокол, выполняющий те же функции, что и SLIP. РРР совершеннее и мощнее своего предшественника, поэтому он быстро вытесняет SLIP. SLIP и РРР удобны для подключения удаленного компьютера к локальной сети, которая входит в Интернет. Работа по SLIP или РРР происходит на обычной линии, которую пользователь освобождает по окончании сеанса работы, и этой линией могут воспользоваться другие пользователи. Преимущество SLIP и РРР состоит в том, что они позволяют работать в режиме полноправного входа в Интернет.

Доступ «по вызову» (Dial-up Access). Системы с коммутируемым доступом – самый распространенный путь к ресурсам Интернет для небольших групп и индивидуальных пользователей. В этих системах используются ресурсы чужого компьютера.

Доступ по стандартным телефонным линиям через UNIX, UUCP. Все системы UNIX поддерживают метод, называемый UUCP, который позволяет пересылать данные по стандартным телефонным линиям. UUCP – это, как SLIP и РРР, протокол канального уровня, но он не обладает полным спектром возможностей, которые можно было бы реализовать на этом уровне. UUCP позволяет лишь пересылать файлы из одной системы в другую.

Доступ через другие сети, входящие в глобальную сеть. Доступ через другие сети можно рассмотреть на примере онлайновых систем, предоставляющих полноценный доступ к Интернет, электронную почту, передачу файлов и удаленный доступ к другим компьютерам. Это первый случай, когда крупная, ориентированная на потребителя онлайновая система предоставила доступ в Интернет с таким обширным набором услуг. Система обеспечивает не только шлюзы электронной почты, но и прямое подсоединение ко всем возможностям глобальной сети.

Технология универсального пользовательского общения в виде электронной почты является популярной услугой вычислительных сетей.

Как было отмечено в п. 2.4, электронная почта в локальных сетях обеспечивает передачу документов, успешно используется при автоматизации офисных работ. В большинстве конкретных случаев использование электронной почты предполагает передачу сообщений через специальные «почтовые ящики», между которыми размещаются устройства обработки данных. «Почтовый ящик» – общая область памяти вычислительной сети, предназначенная для записи информации с помощью одной прикладной программы с целью ее дальнейшего использования другими прикладными программами, функционирующими в других узлах сети.

Электронная почта глобальных сетей передачи сообщений обеспечивает:

– работу в офлайновом режиме, когда не требуется постоянного присутствия на почтовом узле. Достаточно указать специальной программе-почтовику (Mailer) время системных событий и адреса, где следует забирать почту;

– доступ к телеконференциям (Echo Conference);

– доступ к файловым телеконференциям (File Echo Conference).

Файловые телеконференции отличаются от обычных тем, что в качестве сообщений в них существуют не письма, а файлы. Например, создается файловая телеконференция, посвященная экономике, где каждый участник конференции может поместить свой файл, а другие участники этот файл непременно получат.

Существуют и другие возможности, предоставляемые членам сети. Можно, например, послать заказ на посылку или прием факса. Составляется обычное электронное письмо, оформленное должным образом, и посылается на адрес компьютерного узла, занимающегося факсимильными операциями. Текст этого письма в виде факса будет доставлен на факсимильный аппарат адресата.

К преимуществам электронной почты относятся скорость и надежность доставки корреспонденции, относительно низкая стоимость услуг, возможность быстро ознакомить с сообщением широкий круг пользователей. Любая система электронной почты состоит из двух главных подсистем:

– клиентского программного обеспечения, с которым непосредственно взаимодействует пользователь;

– серверного программного обеспечения, которое управляет приемом сообщения от пользователя-отправителя, передачей сообщения, направлением сообщения в почтовый ящик адресата и его хранением до момента открытии его пользователем-получателем.

Серверное программное обеспечение при совместимости протоколов передачи данных может обрабатывать почту, подготовленную различными клиентскими программами. Это программное обеспечение различается уровнями производительности, надежности, совместимости, устойчивостью к ошибкам, возможностями расширения.

Клиентское программное обеспечение предоставляет пользователям удобные средства для работы с почтой.

Несмотря на их многообразие в различных системах электронной почты, все они имеют общие функции: оповещение о прибытии новой почты; чтение входящей почты; создание исходящей почты; адресация сообщений; использование адресной книги, содержащей список абонентов, которым часто посылают почту; отправка сообщений; обработка сообщений и их сохранение. К обработке сообщений относятся такие функции, как печать, удаление, переадресация письма, сортировка, архивирование сообщений, хранение связанных сообщений.

Различные почтовые программы могут быть классифицированы по разным признакам, например в какой операционной системе они могут работать. Другим важным признаком классификации является функциональная возможность почтовых программ, в частности обработка мультимедийных сообщений (поддержка стандарта MIME), возможность работы с разными кодировками сообщений, наличие многопользовательского интерфейса и др. К дополнительным признакам можно отнести интерфейс пользователя, качество справочной системы, интеграцию с другими пакетами, требуемое дисковое пространство для установки, цену.

Таким образом, интегрированные технологии в распределенных системах обработки данных реализуют одну из главных задач организационного управления – своевременное предоставление достоверной, в необходимом количестве информации специалистам и руководителям для принятия обоснованных управленческих решений и возможность тесного взаимодействия их в процессе выработки управленческих решений.

 

Вопросы для самоконтроля

1. Назовите важнейшие классификационные признаки информационных технологий.

2. Каковы роль и место автоматизации офисной деятельности в системе коммуникации персонала?

3. Определите задачи информационной технологии обработки данных, приведите примеры ее программной реализации.

4. Каковы цель и задачи информационной технологии управления на предприятии?

5. В чем отличие использования технологий обработки данных, поддержки принятия решений и технологии использования экспертных систем?

6. Опишите основные компоненты информационной технологии управления.

7. Определите состав информационной технологии поддержки принятия решений и роль ее компонентов.

8. Дайте определение экспертной системы.

9. Назовите сферы применения нейросетевых технологий.

10. Дайте определение нейронной сети и ее основных свойств.

11. В чем заключается распределенная обработка данных?

12. Охарактеризуйте основные технологии, используемые в распределенных системах обработки данных.

13. Опишите модели реализации технологии «клиент – сервер».

14. Назовите отличительные особенности сервисов сети Интернет в рамках технологии универсального общения.