Векторное представление данных
Анализ исходной информации
Вся информация подразделяется на две большие группы: графическая и параметрическая. Графическая информация представляет собой логически организованное множество элементов - примитивов, к которым относятся точки, линии и полигоны. Иногда к ним относят также дуги, окружности, ячейки пространственных сетей и т.д. Исходная графическая информация может быть представлена либо в растровом, либо в векторном виде.
В ГИС наибольшее распространение получило векторное представление данных.
Векторная форма представления цифровой картографической информации это способ математического описания объектов карты в виде набора векторов фиксированной для каждого типа объектов длины.
Положение каждого объекта на карте описывается уравнением:
F=f (х,у,h,z1,z2,z3,...,zn),
где х, у - координаты точек, характеризующих положение текущего объекта;
h - высота объекта над уровнем моря;
z1,z2,z3,...,zn - семантические признаки объекта.
Основными способами формирования векторного представления данных является дигитализация и векторизация по растру.
Дигитализация (оцифровка) выполняется, как правило, с использованием планшетных устройств ввода плановых координат и может быть реализована в двух режимах: дискретном и непрерывном. При непрерывной дигитализации координаты точек регистрируются либо с постоянным шагом, либо с постоянным интервалом по времени обводки линии. Проблема, с которой приходится здесь сталкиваться заключается в избыточности данных, характеризующих положение объекта. Наиболее экономичным является способ кодирования объектов, при котором фиксируются координаты только характерных точек, таких например, как конечные точки кривой, экстремальные точки и точки максимальной кривизны, точки перегиба, точки сопряжения дуг с различными радиусами кривизны и др. Для прямолинейных линий - это конечные точки прямой, для ломанных линий - точки ее изломов. Для внемасштабных знаков - это главные точки, определяющие их местоположение на карте. Классические кривые линии второго порядка (окружности, эллипсы и т.д.) задаются координатами особых точек (центр, фокус) и величинами необходимых параметров (радиус, угловая величина дуги и т.п.). Положение любой промежуточной точки вычисляется по соответствующим формулам аналитической геометрии, например, уравнениям прямой, окружности и т.д.
В настоящее время известно много различных форматов векторного представления данных, которые предназначены для хранения цифровой картографической информации. Все они отличаются друг от друга сложностью выбранных моделей представления данных и, соответственно, возможностями их использования, манипулирования и анализа. В самых простых форматах содержится информация только о геометрических связях объектов, в более сложных форматах добавляется информация о топологических сущностях объектов и его атрибутах. Приведем краткое описание некоторых из них.
1) Модель данных "спагетти".
Одна из самых простых моделей представления данных в векторном формате
Тип объекта | Номер объекта | Координаты |
Точка | X,Y | |
Линия | X1,Y1,X2,Y2, …….,Xn,Yn | |
Полигон | X1,Y1,X2,Y2, …….,X1,Y1 | |
X1,Y1,X2,Y2, …….,X1,Y1 |
Рисунок 2.1- Структура данных модели "спагетти"
2) Текстовый (АSС11) формат
Достаточно часто В ГИС используют для обмена данными текстовый (ASCII) формат данных. Данные представляются в виде последовательности строк текста, состоящих из заголовка (ключевого слова) и следующего набора цифровых данных, описывающих атрибуты объекта, определенного заголовком. Например, запись может иметь вид:
ТИП ОБЪЕКТА = О
141 141
что означает определение точки внутренними координатами х =141, у =141.
Следует отметить, что в различных ГИС соглашения о правилах формирования ASCII файла могут отличаться друг от друга, поэтому необходимо внимательно знакомится с документацией разработчиков и строго выполнять формальные условия при создании подобных файлов (обращая внимание на табуляцию, наличие пробелов, применение спецсимволов и т.д.). Впрочем, многие ГИС оснащены встроенными преобразователями (конверторами) форматов, что значительно упрощает процедуру обмена данными.
3) Формат ОХР
Файлы в формате ОХР состоят из следующих четырех отдельных секций:
- секция заголовка (HEADER);
- секция таблиц (ТАВLЕ);
- секция блоков (ВLОСКS);
- секция объектов (ЕNТIТIES).
Секция заголовка содержит значения, определяющие рабочие параметры чертежа и его окружения.
В секции таблиц информация разбита на четыре подсекции:
- подсекция тип линий (LINETYPE);
- подсекция слой (LAYER);
- подсекция шрифт (STYLE);
- подсекция вид (VIEW).
В каждой подсекции содержится столько записей, сколько необходимо для поддержки всей имеющейся графической информации. Если в чертеже используется 10 слоев, то в таблице слоев будет 10 записей.
Секция блоков содержит подробную информацию об объектах для всех определенных в чертеже блоков. Эти блоки могут быть образованы при .выполнении операций нанесения размеров, вставки изображения из графических библиотек и т.д.
Каждый блок начинается с имени блока и зафиксированной точки признака данного блока, затем следует список объектов, входящих в этот блок.
В секции объектов содержится список всех активных графических объектов со ссылками на секции блоков и таблиц.
Каждый объект (точка, линия, дуга и т.д.) имеет свой формат описания.
4) Цепочно-узловой формат
Графическая информация в цепочно-узловом формате представляется в виде трех элементов: узлов, звеньев и объектов. Объекты могут быть точечными, линейными и площадными (контурными). Между этими элементами устанавливаются связи на уровне описания имен. Известно несколько модификаций этого формата. Приведем упрощенное описание одного из них.
Файл в данном формате состоит из четырех секций:
- секция точек;
- секция узлов;
- секция звеньев;
- секция объектов.
В секции точек записи имеют структуру: "номер точки, X, Y".
В секции узлов, для каждой точки, являющейся узлом, содержится ее номер и список звеньев к нему примыкающих.
По каждому звену в секции звеньев хранится информация о номерах точек, его составляющих.
В секции объектов каждый объект описывается номерами звеньев, из которых он состоит, и ссылки на запись с его семантикой в атрибутивной базе данных.
Большинство ГИС способно оперировать с несколькими форматами векторных данных, что позволяет осуществлять операции экспорта/импорта графической информации.
5 Форматы растрового изображения
Наиболее распространенными в настоящее время растровыми форматы представлены в таблице. Растровые данные, которые получаются после сканирования картографической продукции, должны быть структурированы в формате, который обеспечивает возможность быстрого доступа. Это позволяет применять технологии сжатия и расширения для снижения размера работающего файла растра, что имеет важное значение, поскольку несжатое бинарное изображение карты размером 50 х 50 см при разрешении 1000 точек на дюйм составляет более 300 Мб.
Следует отметить, что в настоящее время для сжатия растровых полутоновых изображений наиболее широко используется, так называемый, стандарт JPEG , позволяющий уменьшить объем хранимых данных в тысячи раз, однако при восстановлении информации возникают искажения малозаметные при визуальном наблюдении, но существенно искажающие геометрические свойства изображения, вследствие чего в картографических системах при использовании данного метода, например, для сжатия данных, полученных после сканирования аэрофотоснимков, не удается получить уменьшение объемов информации более, чем в 4-5 раз.
Формат | Расширение | Максимальное количество цветов |
GIF | GIF | |
PCX | PCX | 16.7 миллионов |
BMP | BMP | 16.7 миллионов |
TARGA | TGA | 16.7 миллионов |
DCX | DCX | 16.7 миллионов |
TIFF | TIF | 16.7 миллионов |
EPS | EPS | 16.7 миллионов |
WMF | WMF | 16.7 миллионов |
WPG | WPG | |
PICT | PCT | 16.7 миллионов |
JPEG | JPG | 16.7 миллионов |
Тема №4 «Базы данных»
Вопросы:
1 Признаки описания объектов
2 Модели баз данных
3 Требования при выборе СУБД
4 Форматы и стандарты пространственных данных
5 Библиотека условных знаков
1 Признаки описания объектов
Формальное представление всех объектов осуществляется с помощью их описания конечным набором характеристик, а их хранение - в соответствующих графических и параметрических базах данных. Как правило, выделяют три группы признаков (характеристик) описания объектов:
1 Идентификационные характеристики
2 Классификационные характеристики
3 Выходные характеристики
Идентификационные характеристики служат для однозначного определения местоположения объекта на карте и его опознания. К ним относятся названия географических объектов, его географические или прямоугольные координаты, род объекта и т.д.
Классификационные характеристики служат для количественного и качественного описания объекта и используются для получения производных характеристик путем математической обработки (качественный и количественный анализ, моделирование и т.д.)
Выходные характеристики содержат информацию об источниках и датах получения соответствующих данных по каждой группе признаков является обеспечение возможности определения достоверности поступающей информации.
Содержание баз данных и методы их организации могут быть различны и зависят от их назначения. Формирование баз данных осуществляется в процессе цифрования исходной информации и ввода соответствующей семантической информации.
Графическая информация хранится в графических базах данных, как в векторном, так и в растровом форматах. Параметрическая информация хранится в символьных базах данных. Графические базы данных представляют собой совокупность файлов с графическими данными, то для создания параметрических баз данных, как правило, используется одна из известных СУБД.
2 Модели баз данных
Ядром любой базы данных является ее модель. Различают три основные модели данных:
· иерархическая,
· сетевая
· реляционная.
Иерархические модели получили широкое распространение в начале шестидесятых годов. Входящие в состав такой модели записи образуют древовидную структуру - каждая из них связана с одной записью, находящейся на более высоком уровне иерархии. Доступ к любой из записей осуществляется путем прохода по строго определенной цепочке узлов дерева с последующим просмотром соответствующих этим узлам записей.
Для достаточно простых задач эта система эффективна, но она практически непригодна для использования в сложных системах с оперативной обработкой запросов и распределенной архитектурой. Она не может обеспечить быстродействие, необходимое для работы в условиях одновременного модифицирования файлов несколькими прикладными системами.
Сетевые модели устранили некоторые недостатки иерархических. В этой модели каждый узел имеет не один, а несколько узлов-родителей. Записи, входящие в состав сетевой структуры, содержат в себе указатели, определяющие местоположение других записей, связанных с ними. Такая модель позволила ускорить доступ к данным, но одна важная задача осталась нерешенной - изменение структуры базы по-прежнему требовало значительных усилий и времени. Операции модификации и удаления данных требовали перестановки указателей, а манипулирование данными осталось ориентированным на записи и описывалось языком процедурного типа.
Для поиска отдельной записи в иерархической или сетевой структуре программист вначале должен определить путь доступа, а затем просмотреть все записи, лежащие на этом пути. На каждом шагу приходится определить индивидуальные управляющие команды и условия, с помощью которых обрабатываются исключительные ситуации (например, обнаружение конца набора просматриваемых записей).
В современных ГИС наиболее распространенной является реляционная модель данных. Ее особенностью является то, что все данные представляются в виде двумерных таблиц (отношений), где строка содержит описание свойств какого-либо объекта, а столбец таблицы ассоциируется с определенной характеристикой объектов, представленных в таблице. Каждая клетка таблицы содержит элементарную характеристику описываемого объекта и не является структурой. Связи между объектами определяются также как и сами объекты через значения клеток семантически однородных столбцов связываемых таблиц.
В реляционных БД имеется механизм блокировки, предотвращающий переход системы в противоречивое состояние в результате одновременного доступа двух или более запросов к одному и тому же элементу данных.
Реляционные модели данных достаточно просты. Они собирают данные в унифицированные таблицы и позволяют работать с ними, не вдаваясь в подробности механизма их хранения. Пользователь может:
· заносить в базу новые данные;
· создавать и уничтожать таблицы;
· добавлять строки и столбцы к ранее созданным таблицам;
· создавать и уничтожать индексы;
· определять и отменять представления хранимых данных;
· изменять привилегии различных пользователей
Графические и параметрические базы данных должны быть связаны между собой для обеспечения корректной и синхронной работы с информацией. Примерами таких операций являются: удаление объекта на экране влечет за собой удаление информации о нем в параметрической БД.
Таким образом, базой данных ГИС является форма компьютерного представления картографической информации, когда объекты базы данных представляются в виде их графических образов и связанной с ними описательной или атрибутивной информации. Так, например, объект базы данных «река» может быть представлен в виде графического объекта - линия, а атрибутивная информация, содержащая, например, название реки, данные о скорости течения и т.д. - в виде структурированных таблиц.
Программные средства ГИС позволяют структурировать входную информацию в любых объектах реального мира, которые можно представить в графическом представлении в виде точки, линии или площадного объекта. В случае использования полностью реляционных СУБД, допускаются связи типа «один к одному», « многие к одному», « один ко многим» и «многие ко многим», то есть, в общем случае, один и тот же графический объект может иметь различную атрибутивную информацию. Например, в случае прохождения административной границы по реке нет необходимости иметь в системе два полностью идентичных графических объекта, достаточно одному и тому же графическому объекту присвоить два разных атрибута. И наоборот, если несколько графических объектов имеют одинаковые атрибуты, то нет необходимости для каждого графического объекта иметь строку в таблице базы данных, достаточно связать все графические объекты с одной строкой в таблице.
Каждый описанный в базе данных объект должен иметь уникальные наименование, код, тип (точка, линия, полигон), имя таблицы для хранения атрибутивной информации, располагаться на своем уникальном слое в графическом файле и иметь свои уникальные атрибуты отображения (цвет, тип и толщина линии, условный знак). Объекты близкие по своей тематической принадлежности объединяют в слои. Так, например, к слою «Гидрография» могут относится объекты «Река», «Береговая линия», «Озеро» и т.д.
3 Требования при выборе СУБД
В настоящее время при проектировании ГИС руководствуются, как правило, следующими требованиями при выборе СУБД:
n возможность оперировать данными разного типа;
n иметь язык запросов высокого уровня;
n хранить данные в одном из стандартных форматов или иметь конвертор для соответствующих преобразований;
n наличие возможностей работы в сетях;
n возможность обработки больших объемов информации;
n иметь систему защиты данных от потерь из-за технических сбоев
В ГИС применяют различные СУБД. Часть ГИС реализуют собственные встроенные СУБД, другие пользуются готовыми системами, такими, как PARADOX, Dbase и др., третьи применяют смешанный способ - внутренние СУБД, пока общий объем баз не превышает определенной величины, и СУБД, предназначенные для больших объемов данных (обычно ORACLE), если информации очень много.
4 Форматы и стандарты пространственных данных
Вне зависимости от того, какая конкретно СУБД используется в ГИС, в системе должны быть средства, позволяющие перевести данные в один из стандартных форматов БД или считать тематическую информацию из популярных баз. К числу таких форматов принадлежат DBF, SQL, INGRES, SYBASE, MIMER ,RDB и др. Практически все зарубежные ГИС обладают такими средствами, чего, к сожалению, нельзя сказать о многочисленных отечественных системах, которые таким образом сильно ограничивают свои возможности применения накопленной ими информации в других системах.
Для обмена электронными и цифровыми картами разработан стандарт «Пространственные данные, цифровые и электронные карты» с его Техническим описанием. В стандарте изложена область применения, нормативные ссылки, определения, обозначения и сокращения, требования к системе классификации и кодирования, требования к цифровому описанию, требования к форматам обмена данными, требования системе условных знаков и библиографические данные. В Техническом описании рассмотрены: классификатор справочно-технологических параметров (коды смысловых значений параметров, особенности его формирования, описание типов пространственно-логических связей), классификатор топографической информации (общее описание, структура, перечень наименований объектов классификационной группировки «Подписи на карте» и их кодовых обозначений, определения объектов классификации), правила цифрового описания картографической информации (общее описание, структура правил цифрового описания, особенности цифрового описания элементов картографического изображения - математической основы, рельефа, гидрографии, населенных пунктов, промышленных, с/х и культурно-социальных объектов, дорожной сети, растительного покрова и грунтов, границ), формат обмена данными электронных и цифровых карт, требования к обменным носителям информации, система условных знаков электронных карт.
При разработке Стандарта использован отечественный, а также зарубежный опыт: стандарты А2260 (Австрия), SAIF(Канада),EgiGeo (Франция),ATKIS (Германия), IEF91 (Израиль),MT (Япония),STFGI (Нидерланды), SOSI (Норвегия),NES (Южная Африка), NTF (Великобритания),SDTS (США), DX-90 (Международная гидрографическая организация), ETF (Европейский комитет стандартов), а также DIGEST (НАТО).
5 Библиотека условных знаков
Библиотека условных знаков состоит из четырех разделов по типам условных знаков: линейные, площадные, точечные, условно-линейные. Разделы содержат таблицы названий объектов электронной карты и номера условных знаков, которыми они отображаются.
Размеры условных знаков заданы в пикселях. Изображения знаков на бумаге даны с увеличением.
Тема №5 «Способы ввода графической информации в ГИС»
Вопросы: