Распределенные системы обработки данных

Тема 9. ИНТЕГРИРОВАННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

1. Распределенные системы обработки данных.

2. Организация параллельной обработки данных.

3.Технология «клиент-сервер»

Распределенная обработка данных позволяет повысить эффективность изменяющейся информационной потребности работника и обеспечить гибкость принимаемых решений.

Ее достоинствами являются:

- большое число взаимодействующих пользователей, выполняющих функции сбора, регистрации, хранения, передачи и выдачи информации;

- снятие пиковых нагрузок с централизованной базы посредством распределения обработки и хранения локальных баз данных на разных ЭВМ;

- обеспечение доступа информационного работника к вычислительным ресурсам сети ЭВМ;

- обеспечение симметричного обмена данными между удаленными пользователями.

Архитектура СУБД описывает функционирование базы как взаимодействие процессов двух типов: клиента и сервера. Распределенная обработка и распределенная база данных - разные вещи. При распределенной обработке выполняется работа с базами данных, под этим понимается то, что представление данных, их содержательная обработка, работа с базами данных на логическом уровне выполняется на ПЭВМ клиентами, а поддержание баз данных в актуальном состоянии - на сервере.

В случае использования распределенной базы данных предполагается, что она размещается на нескольких серверах. Работа с ней производится на тех же или иных ПЭВМ, единственным условием работы с распределенной базой данных является использование сетевой СУБД для доступа к удаленным данным. В системе распределенной обработки клиент может послать запрос к собственной локальной базе данных или удаленной.

Удаленный запрос - единичный запрос к одному серверу. Несколько удаленных запросов к одному серверу - объединяются в транзакцию (удаленную). Если отдельные запросы транзакции обрабатываются различными серверами, то транзакция называется распределенной. При этом один запрос транзакции обрабатывается одним сервером.

Распределенная СУБД позволяет обрабатывать один запрос несколькими серверами. Такой запрос называют распределенным. Только обработка распределенного запроса поддерживает концепцию распределенной базы данных.

Организация обработки данных зависит от способа их распределения. Существуют централизованный(рисунок 4), децентрализованный и смешанный(рис. 11) способы распределения данных.

 

Клиенты

 

 

Рисунок 11 – Централизованное распределение данных

 

При централизованной организации данныхна одном сервере организуется единственная копия базы данных. Все операции с базой обеспечиваются этим сервером. Доступ к данным организуется с помощью удаленного запроса или удаленной транзакции. Одним из главных преимуществ использования данного способа является простота поддержки базы данных в актуальном состоянии. Недостатками являются ограниченность размера базы данных, ее зависимость от размера памяти, все запросы производятся к единственному серверу с соответствующими затратами на стоимость связи и временную задержку. Этим объясняется ограничение на параллельную обработку. База данных может быть недоступной для удаленных пользователей при появлении ошибок связи и полностью выходит из строя при отказе центрального сервера.

Децентрализованная организация данныхпредполагает разбиение базы на несколько физически распределенных.

 

 

Клиенты

 

 

Рисунок 12 - Децентрализованная организация данных способом распределения

 

 

Каждый клиент пользуется своей базой данных, которая может быть либо частью общей информационной базы (рис. 13), либо копией информационной базы данных в целом (рисунок 6), что приводит к ее дублированию для каждого клиента.

 

Клиенты

 

 

Рисунок 13 - Децентрализованная организация данных способом дублирования

 

При распределении данныхна основе разбиения база данных размещается на нескольких серверах. Существование копий отдельных частей - недопустимо.

Достоинства этого метода:

- большинство запросов удовлетворяются локальными базами данных, что сокращает время ответа;

- увеличивается доступность к данным и надежность их хранения;

- стоимость запросов на выборку и обновление снижается, по сравнению с централизованным распределением;

- система частично остается работоспособной при выходе из строя одного сервера или более;

- доступность и надежность работы системы в целом увеличена. Недостатки:

- часть удаленных запросов (транзакций) может потребовать доступ ко всем серверам, что увеличивает время ожидания и цену обслуживания;

- необходимо иметь сведения о размещении данных в различных БД.

Расчлененные базы данных наиболее подходят в случае совместного использования глобальных и локальных сетей ЭВМ.

Дублирование информациивыполняется на каждом сервере сети ЭВМ, где будет размещаться полная база данных, что способствует наиболее надежному хранению данных.

Недостатками данного способа являются.

- повышенные требования к объему внешнего запоминающего устройства;

- усложнение корректировки баз данных, т.к. требуется синхронизация для согласования копий.

Основным достоинством является то, что запросы выполняются локально, что обеспечивает быстрый доступ к данным.

Такой способ распределения используется, когда фактор надежности является критическим, база небольшая, интенсивность обновления невелика.

Для смешанного способа распределения данныххарактерно то, что достоинства и недостатки наследуются от двух вышеописанных способов (разбиения и дублирования). Необходимо всегда учитывать объем памяти, отводимого под базы данных, а также под базы данных, расположенных на других серверах для обеспечения надежности и эффективности работы всей системы в целом