Геореляционная модель

Цифровые модели карт

Лекция 6

Существует несколько способов связи атрибутивной информации с пространственными объектами. Совокупность пространственных и атрибутивных данных связанные воедино, в информационной системе называются цифровой моделью (ЦМ) карты.

Модель данных – это концептуальный уровень организации данных, некоторый логический уровень. Количество существенно различных моделей определяется наличием различных множеств информационных конструкций.

Модель данных в информационных системах, в общем случае, предусматривает указание множества:

- допустимых информационных конструкций (объектов);

- допустимых операций над данными;

- ограничений для хранимых значений данных.

В геоинформационных системах существует три подхода к организации совместной работы с пространственной и атрибутивной информацией, три модели такого взаимодействия.

Наиболее известная и применимая в настоящее время модель – геореляционная. Следует заметить, что эффективные средства управления атрибутивными данными - СУБД давно созданы и успешно используются во всех прикладных областях информационных технологий. К сожалению, эти средства плохо приспособлены к работе с графическими данными. В геоинформационных системах, наоборот, при эффективной работе с графическими данными, эффективность работы с атрибутивными данными достаточно низкая. Геореляционная модель использует возможности программного объединения этих двух технологий. Поэтому эта модель называется иногда гибридной. Для организации пространственной компоненты применяются правила геоинформационных систем, а атрибутивная информация организована по правилам СУБД. Но между пространственной и атрибутивной информацией устанавливаются и поддерживаются связи через идентификатор объекта. Главной функцией механизма установленной связи является возможность выполнения различных запросов пользователя. Запросы могут осуществляться как через выборку пространственного объекта – чем характеризуется выбранный объект? Так и из таблицы свойств – где находятся объекты с обозначенными свойствами? Пространственная информация, метрическая, а в некоторых системах и топологическая, хранится в своих файлах или системе файлов, совершенно отдельно от атрибутивной информации. Такой подход позволяет добиться одновременной оптимизации хранения географических и содержательных данных.

Атрибутивная информация организована в виде таблиц, которые управляются с помощью реляционной СУБД. Эта СУБД может быть как встроенной в ПО ГИС в виде его функциональной подсистемы или быть внешней по отношению к ГИС. Иногда реализуется одновременно оба подхода – существует простая встроенная подсистема, в то же время возможно использование внешних СУБД для хранения атрибутивной информации. Модуль СУБД, встроенный в ГИС, обладает обычно несколько меньшими возможностями по сравнению с настоящей СУБД. Его возможности, как правило, ограничиваются основными функциональными задачами – это ввод, редактирование, хранение, поиск и конвертация данных. Манипулирование данными осуществляется при помощи операций, порождающих таблицы. Комбинируя таблицы, выбирая отдельные столбцы и строки, пользователь имеет возможность одной операцией сформировать новые таблицы для отображения на мониторе, дальнейшей обработки или записи на хранение. В дополнение к этому некоторые ГИС поддерживают основные элементы реляционной алгебры – отношения один ко многим, много к одному и т.п., что дает возможность использовать разнородные атрибутивные данные объектов в распределенных таблицах. Реляционная СУБД поддерживает возможность работы с внешними базами данных по законам реляционной алгебры. Внутренняя таблица создается и существует в среде программного обеспечения ГИС. Внешняя таблица может быть создана и существовать вне системы. Обращение к такой таблице осуществляется по мере необходимости пользователем. Для осуществления связи между внутренней и внешней таблицей необходимо совпадение одного из полей в обеих таблицах.

 

Рисунок 20. Соединение внешней и внутренней таблицы по общему полю

(отношение один ко многим)

Связь возможна в отношении многие к одному, один к одному или один ко многим. При соединении таблиц по общему полю во внутреннюю таблицу добавляется необходимая информация из внешней таблицы. Соединение может быть постоянным или временным. В случае, когда отношение определяется один ко многим, происходит временное связывание таблиц. Во внешней таблице в результате связывания активными становятся все записи, соответствующие выборке объекта внутренней таблицы. Возможность работы с внешними таблицами приносит неоспоримые преимущества:

- хранение в базе данных ГИС минимально необходимой атрибутивной информации;

- возможность эффективной работы с секретной или коммерческой информацией;

- использование результатов обработки данных в специализированных информационных системах.

В то же время у реляционной модели есть одно уязвимое место – организовать работу с такой таблицей достаточно сложно, поскольку традиционно в реляционной модели пути доступа к данным заранее не определяется и при обработке запросов приходится просматривать практически всю базу. В настоящее время, при хорошей конфигурации компьютера, это не является большой проблемой, кроме того, проблема решается с помощью задания вспомогательных путей.

Наиболее распространенными форматами атрибутивных данных являются dBASE, Paradox, MS Access, форматы электронных таблиц, ASCII-файлы.

Существует два подхода к решению задачи организации атрибутивной БД.

В первом случае в качестве оперативного формата выбирается один из популярных форматов данных или некий «свой» формат. Таким образом,все операции, проводимые ГИС с атрибутивными данными, поддерживаются только для этого формата. Для использования данных, представленных в других форматах, необходима их конвертация. Такими были предыдущие версии всех распространенных на рынке ГИС. При использовании внутреннего формата обеспечивается относительная простота использования и, как правило, более высокая скорость работы с данными. К недостаткам такой организации данных относится необходимость конвертации данных или хранения в нескольких экземплярах в случае, если вы предполагаете работу с ними в других приложениях, не владеющим возможностями работы с предложенным форматом.

При использовании другого подхода работа ведется с несколькими форматами с использованием средств IDAPI, ODBC или аналогов. Такие средства позволяют ГИС несколько абстрагироваться от формата БД и, как следствие, работать с разными форматами почти одинаково хорошо. Подобные системы занимают сейчас лидирующее положение на рынке.

Достоинства этих систем в том, что если у вас уже есть атрибутивная информация, нет необходимости ее конвертировать. Нужно только осуществить пространственную привязку базы данных. Если почему-то вам понадобились дополнительные возможности по манипулированию БД, вы можете воспользоваться развитыми средствами СУБД,

В последние годы применяют так называемую архитектуру связи клиент-сервер. При реализации решения "клиент-сервер" вся обработка атрибутивных данных ведется на специально выделенном компьютере (или нескольких), называемом СУБД сервер. Компьютеры-клиенты отправляют запросы на сервер БД и потребляют их результаты. Клиенты и серверы соединены между собой каналами связи (например, они находятся в одной ЛВС). Необходимость такого решения возникает, когда ГИС является частью большой информационной системы всего лишь одним из клиентов большой базы данных, находящейся под управлением СУБД сервера. Пространственные данные хранятся локально или на файле сервера в системе DBC. Такими возможностями обладают многие современные западные ГИС - ARC/INFO. MapInfo, Intergraph и др. Причем некоторые из них опираются на использование только этой возможности доступа к данным. К достоинствам организации такой связи относится высокая степень масштабируемости и независимости от аппаратных средств, а также высокая эффективность обработки данных, но только при правильном применении. При использовании такого подхода появляется реальная возможность ведения распределенных БД, что часто бывает необходимо при использовании очень больших БД. К недостаткам такого подхода следует отнести высокую стоимость программных и аппаратных средств, сложность поддержки и необходимость высококвалифицированных кадров.