Основные свойства распределенных баз данных

С точки зрения пользователей распределенная база данных вы­глядит как обычная настольная база данных, компоненты кото­рой могут находиться на различных компьютерах (узлах) локаль­ной сети предприятия.

В идеале для распределенных баз данных должны быть харак­терны следующие свойства:

· локальная автономия (local autonomy);

· независимость узлов (no reliance on central site);

· непрерывность операций (continuous operation);

· прозрачность расположения (location independence);

· прозрачность фрагментации (fragmentation independence);

· прозрачность тиражирования (replication independence);

· возможность обработки распределенных запросов (distributed query processing);

· возможность обработки распределенных транзакций (distributed transaction processing);

· независимость от оборудования (hardware independence);

· независимость от операционных систем (operationg system independence);

· прозрачность сети (network independence);

· независимость от баз данных (database independence).

Локальная автономия — свойство, означающее, что управле­ние данными на каждом из узлов распределенной системы вы­полняется локально. База данных, расположенная на одном из узлов, является неотъемлемым компонентом распределенной си­стемы. Будучи фрагментом общего пространства данных, она в то же время функционирует как полноценная локальная база дан­ных, управление которой выполняется локально и независимо от других узлов системы.

Независимость узлов — свойство, означающее, что в идеальной системе все узлы равноправны и независимы, а расположенные на них базы являются равноправными поставщиками данных в общее пространство данных. База данных на каждом из узлов самодоста­точна, т. е. она включает в себя полный собственный словарь дан­ных и полностью защищена от несанкционированного доступа.

Непрерывность операций — свойство, которое можно тракто­вать как возможность непрерывного доступа к данным (24 ч в сут­ки или семь дней в неделю) в рамках DDB независимо от их рас­положения и независимо от операций, выполняемых на локаль­ных узлах. Это свойство можно выразить следующим образом: дан­ные доступны всегда, а операции над ними выполняются непре­рывно.

Прозрачность расположения — свойство, означающее полную прозрачность расположения данных. Пользователь, обращающийся к DDB, ничего не должен знать о реальном (физическом) разме­щении данных в узлах информационной системы. Все операции с данными выполняются без учета их местонахождения. Транспор­тировка запросов к базам данных осуществляется встроенными системными средствами.

Прозрачность фрагментации — свойство, которое трактуется как возможность распределенного размещения данных, логиче­ски представляющих собой единое целое. Существует фрагмента­ция двух типов: горизонтальная и вертикальная. Первая означает хранение строк одной таблицы на различных узлах (фактически хранение строк одной логической таблицы в нескольких идентич­ных физических таблицах на различных узлах), а вторая — рас­пределение столбцов логической таблицы по нескольким узлам.

Прозрачность тиражирования данных (асинхронного в общем случае процесса переноса изменений объектов исходной базы дан­ных в базы, расположенные на других узлах распределенной сис­темы) — свойство, означающее возможность переноса измене­ний между базами данных средствами, невидимыми пользовате­лю распределенной системы, или, что тиражирование возможно и достигается внутрисистемными средствами.

Возможность обработки распределенных запросов — свойство DDB, которое трактуется как возможность выполнения операций выборки информации из распределенной базы данных, сформу­лированных в рамках обычного запроса на языке SQL. Это означа­ет, что операцию выборки из DDB можно сформулировать с по­мощью тех же языковых средств, что и операцию в локальной базе данных.

Возможность обработки распределенных транзакций — свойство DDB, которое можно трактовать как возможность выполнения операций обновления распределенной базы данных (INSERT, UPDATE, DELETE), не разрушая целостность и согласованность данных, что достигается применением двухфазового (или двух­фазного) протокола фиксации транзакций (two-phase commit protocol), ставшего фактическим стандартом обработки распреде­ленных транзакций. Использование этого протокола гарантирует согласованное изменение данных на нескольких узлах в рамках распределенной (или глобальной) транзакции.

Независимость от оборудования — свойство, означающее, что в качестве узлов распределенной системы могут выступать компью­теры любых моделей и производителей.

Независимость от операционных систем — свойство, вытекаю­щее из предыдущего свойства и означающее многообразие опера­ционных систем, управляющих узлами распределенной системы.

Прозрачность сети — свойство, означающее, что в распреде­ленной системе возможны любые сетевые протоколы, т.е. доступ к любым базам данных может осуществляться по сети и спектр под­держиваемых конкретной СУБД сетевых протоколов не должен быть ограничением системы с распределенными базами данных.

Независимость от баз данных — свойство, означающее, что в распределенной системе могут сосуществовать СУБД различных производителей, а также возможны операции поиска и обновле­ния в базах данных различных моделей и форматов.

Рассмотренные свойства во многом связаны с технологиями, осуществляющими доступ и обработку информации в удаленных базах данных.

 

ГЛАВА 2. ПРИНЦИПЫ РАЗРАБОТКИ И ЭКСПЛУАТАЦИИ СИСТЕМ УПРАВЛЕНИЯ УДАЛЕННЫМИ БАЗАМИ ДАННЫХ