ОБЩИЕ СВЕДЕНИЯ ОБ ИНФОРМАЦИОННЫХ СИСТЕМАХ

СОДЕРЖАНИЕ И ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ИНФОРМАЦИИ

 

Понятия данные, информация.

Прежде чем перейти к обсуждению понятия информационной системы (ИС), попытаемся выяснить, что же понимается под словом информация.

С точки зрения, как пользователей, так и разработчиков ИС, у информации есть одно важное свойство – она является единицей данных, подлежащих обработке. Данные – совокупность разрозненных фактов, имеющих количественные и качественные характеристики, и выступают как способ представления информации в определенной, фиксированной форме, пригодной для обработки, хранения и передачи.

Понятие «информация» (от лат. information — осведомлять). Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ «Об информации, информационных технологиях и о защите информации» дает следующее определение: «информация – сведения (сообщения, данные) независимо от формы их представления».

Информация должна быть зафиксирована на материальном носителе и храниться в течение определенного периода времени, или «цикла жизни».

Стадии состояния информации

Можно выделить следующие стадии состояния информации:

- хранение;

- преобразование информации;

- передача;

- сортировка, синтез, обработка;

- использование;

- оценка;

- уничтожение.

Характеристики информации:

- целевое назначение;

- способ и формат;

- избыточность;

- быстродействие;

- периодичность;

- стоимость;

- ценность;

- надежность и достоверность;

- статичность и динамичность.

Информация, необходимая для эффективного управления, должна удовлетворять ряду требований, основные из которых сле­дующие: информация должна быть целевой, необходимой и достаточной, надежной и достоверной, своевременной, представлен­ной в виде, удобном для дальнейшего использования.

 

2.1 Этапы развития информационных систем

 

Первые информационные системы появились в 50-х гг. Они были предназначены для обработки счетов и расчета зарплаты, а реализовывались на электромеханических бухгалтерских счетных машинах. Это приводило к некоторому сокращению затрат и времени на подготовку бумажных документов.

60-е гг. знаменуются изменением отношения к информационным системам. Информация, полученная из них, стала применяться для периодической отчетности по многим параметрам. Для этого организациям требовалось компьютерное оборудование широкого назначения, способное обслуживать множество функций, а не только обрабатывать счета и считать зарплату.

В 70-х – начале 80-х гг. информационные системы начинают широко использоваться в качестве средства управленческого контроля, поддерживающего и ускоряющего процесс принятия решений.

К концу восьмидесятых годов концепция использования информационных систем вновь изменяется. Они становятся стратегическим источником информации и используются на всех уровнях организации любого профиля. Информационные системы этого периода, предоставляя вовремя нужную информацию, помогают организации достичь успеха в своей деятельности, создавать новые товары и услуги, находить новые рынки сбыта, обеспечивать себе достойных партнеров, организовывать выпуск продукции по низкой цене и многое другое.

 

2.2 Определение информационной системы. Основные задачи, функции и свойства

 

Система (system – целое, составленное из частей; греч.) – это совокупность элементов, взаимодействующих друг с другом, образующих определенную целостность, единство.

Информационная система – это взаимосвязанная совокупность технических средств, программного обеспечения и персонала, используемых для хранения, обработки, и выдачи информации в интересах достижения поставленной цели.

Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ «Об информации, информационных технологиях и о защите информации» дает следующее определение: «информационная система — совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств».

Основные задачи ИС

Каждая ИС должна решать основные задачи, а именно:

- систематизировать всю поступающую информацию в ЭВМ;

- организовать оперативный поиск необходимой информации, т.е. по запросу пользователя должна быть сформирована выборка данных в удобном виде в рамках конкретной предметной области.

Основные функции информационной системы:

- сбор информации;

- хранение информации;

- поиск и обработка информации;

- передача информации.

Свойства информационных систем

В целом информационные системы определяется следующими свойствами:

1) любая информационная система может быть подвергнута анализу, построена и управляемая на основе общих принципов построения систем;

2) информационная система является динамичной и развивающейся;

3) при построении информационной системы необходимо использовать системный подход;

4) выходной продукцией информационной системы является информация, на основе которой принимаются решения;

5) информационную систему следует воспринимать как человеко-машинную систему обработки информации.

 

2.3 Процессы, протекающие в информационных системах

 

Последовательность действий, выполняемых с информацией, называется информационным процессом.

Процессы, обеспечивающие работу информационной системы любого назначения это:

- выявление информационных потребностей;

- осуществление отбора источников информации;

- сбор информации;

- ввод информации из внешних или внутренних источников;

- выполнение действий по обработке информации, оценке ее полноты и значимости;

- вывод информации для представления потребителям ее в удобном виде или передачи в другую систему;

- организация использования информации для оценки тенденций, разработки прогнозов, оценке альтернативных решений и действий, выработки стратегии;

- обратная связь – это информация, переработанная людьми данной организации для коррекции входной информации.

 

2.4 Структура информационной системы

Информационные системы с позиции информатики состоят из четырех компонентов:

- технических средств (процессор, компьютер);

- программного обеспечения (прикладное программное обеспечение и СУБД);

- данных и их качественных и количественных характеристик;

- персонала (пользователь, программисты, администраторы, аналитики и т.д.).

С позиции структуры программного обеспечения информационная система составляет совокупность отдельных ее частей, назы­ваемых подсистемами.

Подсистема - это часть системы, выделенная по какому-либо признаку.

Основные компоненты (подсистемы) информационной системы :

- подсистема ввода и преобразования данных;

- подсистема хранения данных;

- система управления базой данных (СУБД);

- подсистема обработки и анализа данных;

- подсистема визуализации данных;

- подсистема вывода информации.

 

 

Подсистема ввода и преобразования данных

 

Подсистема ввода и преобразования данных — это программно-технический комплекс, отвечающий за ввод данных и подготовку информации для ее передачи в ЭВМ (процессору) для последующей обработки.

Техническими средствами в системе ввода являются: клавиатура; манипулятор мышь, внешние носители информации; компьютерные сети; дигитайзер (цифрователь), сканер, геодезические приборы.

Так же в качестве источника могут быть аэрофото- и космические снимки, которые обрабатываются на специализированных рабочих станциях. Большие потенциальные возможности для сбора данных в ГИС открывает GPS (Global Positioning System) – тexнология, предназначенная для сбора высокоточной цифровой ин­формации о местности, фактических топографических данных (географических координат и отметки высоты рельефа в данной точке местности), при которой точность измерений достигает не­скольких сантиметров.

Устройства ввода информации

Для ручного ввода пространственных данных является дигитайзер.

Дигитайзер – устройство планшетного типа, предназначенное для ввода информации в цифровой форме.

Он является более совершенным и гораздо более точным родственником наиболее широко используемого графического манипулятора – мыши, которую пользователь может свободно перемещать по практически любой поверхности. Внутри мыши находятся датчики, которые реагируют на вращение резинового шара, помещенного внутрь корпуса мыши. Для увеличения точности подобного устройства в дигитайзере используется электронная сетка на его столике. К столику присоединено подобное мыши устройство, называемое курсором, которое перемещается по столу в различные положения на карте, которая к этому столу прикреплена. Курсор обычно имеет перекрестие, нанесенное на прозрачную пластинку, которое позволяет оператору позиционировать его точно на отдельных элементах карты. Кроме того, на курсоре размещены кнопки, которые (число их зависит от уровня сложности устройства) позволяют указывать начало и конец линии или границы области, явно определять левые и правые области и т.д. Использование кнопок определяется в основном спецификой программы ввода. Рабочая поверхность (планшет) дигитайзера может быть гибкой или жесткой, размерами от книжной страницы до очень больших форматов для размещения больших карт, даже с запасом. Некоторые из крупноформатных дигитайзеров имеют подъемно-поворотное основание, позволяющее оператору устанавливать оптимальное для работы положение. Размер стола определяется частично размером вводимых документов. Автоматизированные дигитайзеры, или дигитайзеры с отслеживанием линий, имеют устройство, подобное головке оптического считывания проигрывателя компакт-дисков. Оно фиксируется на выбранной пользователем линии (как проигрыватель фиксируется на дорожке записи) и, самостоятельно следуя вдоль нее, передает координаты точек линии в компьютер.

Сканер – устройство для считывания графической и текстовой информации.

Большее распространение получили растровые сканеры. Они позволяют вводить растровое изображение карты в компьютер без вмешательства человека. Сами растровые сканеры делятся на ручные, роликовые (с протяжкой листа), планшетные и барабанные. Наиболее дорогие сканеры – фотограмметрические. Основные характеристики сканеров - оптическое разрешение, скорость сканирования и стабильность.

Геодезические приборы

Электронные теодолиты – первые геодезические приборы, позволяющие снимать отсчет автоматически с использования специального отсчетного устройства.

Тахеометры – основные геодезические приборы, нашедшие наиболее широкое применение в большинстве видов геодезических работ. Своей популярностью они обязаны встроенным функциям, которые обеспечивают автоматизацию измерений и вычислений, а также своим техническим параметрам. При небольшом весе, они позволяют помимо измерений обрабатывать полученную информацию, а также хранить ее до момента камеральной обработки

Электронные нивелиры – также как и электронные тахеометры обладают электронной системой компенсации наклонов, имеют регистрирующие устройства и т. д.

Сбор данных – это процесс подготовки информации для ее непосредственной передачи либо передачи с промежуточным запоминанием для последующей обработки в ЭВМ.

В зависимости от места сбора данных различают три формы организации:

- в непосредственной близости от протекания наблюдаемого процесса;

- децентрализованный сбор, в ряде разработанных территориальных пунктах;

- централизованный сбор, в данном дистанционно удал1енном от процесса центральном пункте.

Сбор данных непосредственно в месте протекания процесса может осуществляться автоматически, регистрацией сигналов данных или оператором (наблюдателем), наблюдающим за приборами. Децентрализованный сбор информации выполняется каждым устройством автономно. Достоинством подобных систем является параллельность в работе отдельных устройств и как следствие более высокое быстродействие и повышенная надежность.

Недостаток – большое количество линий связи, проложенных от первичных измерительных преобразователей до центральной ЭВМ.

Отмеченный недостаток отсутствует в системе централизованного сбора информации. Но эта система оказывается менее быстродействующей по сравнению с децентрализованной, из-за задержки между появлением информации в процессе и ее последовательной передачей в центральную ЭВМ через устройство централизованного сбора данных. Кроме того, в подобных системах снижается надежность из-за использования единого центра сбора и обработки информации.

В зависимости от времени задержки между сбором и получением результатов выделяют три режима сбора и получения:

- в масштабе реального времени. Если информация о состояниях контролируемого процесса, немедленно передается, через устройства сбора, в центральный процессор и последний ведет обработку информации в темпе ее поступления, то говорят об обработке данных в реальном масштабе времени. Подобные системы совместно с объектом образуют единое целое.

- приближенная к масштабу времени. Происходит небольшая задержка между сбором и получением информации.

- пакетный режим. Если информация о процессе сбора предварительно накапливается в промежуточных запоминающих устройствах, после чего частями передается в центральный процессор для обработки. При этом накопление отдельных массивов данных можно осуществлять по определенным признакам или в соответствии с определенными правилами, где получение результатов несколько задерживается. Она осуществляется в так называемом масштабе времени, близкому к реальному.

 

Подсистема хранения данных

Различают внутренние устройства хранения информации и внешние.

К внутренним устройствам хранения относятся разного рода жесткие магнитные диски или «винчестеры», HDD (Hard Disk Drive); с емкостью от несколько десятков до сотни гигабайт с различной файловой системой (FAT16, FAT32, NTFS и другие). Они позволяют хранить значительные объемы информации и являются основным источником ее использования, ведь на них еще устанавливается операционная система, которая управляет работой компьютера.

К внешним устройствам хранения относятся различные дисководы. Это устройства чтения/записи информации с дискет FDD емкостью в основном 1.44 мегабайт, лазерно-оптические CD с емкостью 1Гбайт и цифровые DVD с емкостью до десятка Гбайт, магнитооптические диски, стримеры. В последние годы стали использоваться запоминающие устройства – FLASH-память. Внешние устройства позволяют переносить не значительные объемы информации с одного компьютера на другой, а также являются источником аварийного копирования важной информации в случае выхода из строя жесткого диска. Накопители на жестких и магнитных дисках предназначены для формирования промежуточных массивов ЦКИ в процессах их обработки. Накопители на гибких магнитных дисках предназначены для временного хранения информации, а также для обмена информацией. Накопитель на оптических дисках является средством архивации, а сами оптические диски - средством архивного хранения. Пока это самое надежное и эффективное средство для хранения и распространения картографической информации в цифровой форме.

 

СУБД (системы управления базами данных)

Для компьютерной обработки баз данных используют специальное программное обеспечение – системы управления базами данных (СУБД).

СУБД – это пакет прикладных программ и языковых средств, предназначенных для создания, ведения и использования баз данных.

БД (база данных) - компьютерная файловая система, предназначенная для хранения, обработки и манипулирования данными. БД не зависит от прикладных программ. Создание БД и обращение к ней (по запросам) осуществляются с помощью системы управления базами данных (СУБД).

Любая информация в ИС сохраняется в БД, которая состоит из СБД (семантическая) и ГБД (геометрическая) баз данных.

Базы данных в зависимости от способа представления данных и отношений между ними могут иметь реляционную, сетевую, иерархическую, объектно-ориентированную структуры данных.

На практике чаще используют реляционную структуру данных, которая представляет собой таблицу. Столбцы – (поле, домен), где вносятся атрибуты или характеристики объекта, строка – картеж (запись), в которой отражены значения атрибутов объекта.

Каждая запись относится к одному объекту. Объединение двух баз данных выполняется по ключу, который называется идентификатором (ID).

Работа СУБД включает следующие этапы:

- создание структуры (шаблона) базы;

- заполнение базы;

- просмотр и редактирование базы;

- сортировка информации;

- фильтрация информации;

- поиск информации и последующая выборка;

- модификация структуры базы ее записей;

- создание запросов, форм, отчетов.

В каждой СУБД реализован специальный язык для обработки и поиска данных или информации SQL – язык запросов. Прикладное программное обеспечение создается с помощью стандартного языка программирования высокого уровня Delphi, Visual Basic и т.д.

По характеру использования СУБД делятся на персональные (пользовательские) и многопользовательские.

К персональным СУБД относятся Visual, FoxPro,dBase, Access, Clipper и др. СУБДП представляют собой совокупность языковых и программных средств, предназначенных для создания, ведения и использования БД. Персональные СУБД могут функционировать только в одной операционной системе и на одной платформе.

К многопользовательским СУБД относятся, например, СУБД Oracle, Informix, InterBase и др. Многопользовательские СУБД, включают в себя сервер БД и клиентскую часть, работают в неоднородной вычислительной среде — допускаются разные типы ЭВМ и различные операционные системы. Поэтому на базе СУБДМ можно создавать информационные системы, функционирующие по технологии клиент – сервер.

К основным функциям СУБД, как персональным, так и многопользовательским относят следующее:

- централизованное определение и контроль данных, известных под названием словарь/классификатор;

- защита данных и обеспечение их целостности;

- одновременный доступ к данным для нескольких пользователей;

- формирование запросов, обработки и извлечения данных;

- создания прикладных программ.

 

Подсистема обработки и анализа данных

 

В ее задачу входят выполнение процедур обработки данных, манипулирования про­странственными и семантическими данными, осуществляемых при отработке пользовательских запросов.

 

Подсистема визуализации данных

 

Визуализация одна из главных функций обработки изображения и представления данных. Техническим средством является – монитор с высоким разрешением. Здесь используется компьютерная графика, обработка изображения и распознавание.

Компьютерная графика – представление графиков, диаграмм.

Обработка – (входят программы приложения) главная задача которых улучшить изображение на экране. Например: удаление лишних элементов, для улучшения изображения.

Распознавание – входят программы, получения описаний изображений объектов. Пример: система оптического распознавания текста программа Fine Rider .

 

Подсистема вывода данных

 

Система вывода ИС предназначена для представления результатов работы в виде, удобном потребителю. К техническим средствам относятся плоттеры, принтеры. Результаты работы могут быть представлены в виде слайдов, видеофильмов, записаны на магнитные носители, распечатаны в форме отчетов, таблиц, диаграмм, картографических документов или экспортированы во внешние компьютерные системы, интернет.

Принтеры

Они предназначены для вывода информации на бумагу. Используются в основном для вывода на печать текстовых документов или небольших графических документов. Принтеры используют несколько основных способов нанесения красителей на бумагу: точечно-матричный, струйный, лазерный.

Графопостроители (плоттеры)

Для вывода широкоформатных чертежей в цвете широко ис­пользуют устройства, получившие название плоттеров (от англ., blot — наносить на карту). По принципу построения изображения различают векторные (перьевые) и растровые плоттеры

В векторных плоттерах изображение рисуется пишущим узлом.

В качестве пишущего узла могут выступать карандаши, шариковые и капиллярные стержни, фломастеры и даже гравировальные резцы.

Растровые плоттеры создают изображение путем нанесения красителя на отдельные точки носителя. Имеется несколько типов растровых плоттеров, которые используют те же способы нанесения красителей, что и принтеры.

Среди растровых технологий (электростатических, лазерных, термографические) особо выделяются плоттеры со струйной технологией печати. При выводе чертежей, карт, схем повышенной сложности, насыщенных цветными элементами, струйные плоттеры намного эффективнее растровых.

 

2.5 Классификация информационных и геоинформационных систем

 

По характеру представления и логической организации хранимой информации, информационные системы можно разделить на два типа: документальные (ДИС), фактографические (ФИС).

Документальные информационные системы служат для работы с документами на естественном языке (монография и публикации). Они обеспечивают смысловой анализ запроса (поиска) при неполном или приближенном представлении смысла о документе.

Характерными представителями этого типа являются:

ИПС – информационно – поисковые системы;

ЭС – экспертные системы;

ИИС – интеллектуально - информационные системы.

Фактографические информационные системы накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров или некоторая их совокупность отражают фактические сведения по какому-либо факту, событию отдельно от всех прочих сведений и фактов. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики объектов данной предметной области. Комплектование информационной базы в фактографических информационных системах включает, как правило, обязательную структуризацию входной информации. Фактографические информационные системы предполагают удовлетворение информационных потребностей непосредственно, т.е. путем представления потребителям самих сведений (данных, фактов, концепций).

Центральным функциональным звеном фактографических информационных систем является система управления базой данных (СУБД).

В зависимости от сфер применения все ФИС (фактографические) можно разделить:

производственные информационные системы (ПИС), системы в которых автоматизируются процессы производства;

информационные системы управления (ИСУ), системы в которых автоматизируется процесс организационного управления;

Каждый из рассмотренных типов систем в свою очередь подразделяются на подклассы в соответствии с определенным признаком. Наиболее распространенными системами, относящиеся к классу ПИС являются следующие виды систем, различающихся характером автоматизируемого производства:

ИС – автоматизированные системы обработки данных, предназначены для сбора, хранения и обеспечения доступа к большим объемам информации с помощью ЭВМ (электронные тахеометры, GPS - приемники второго поколения);

ИСОД – автоматизированные системы обработки данных, предназначены для обработки данных по формализованным алгоритмам на ЭВМ (Armig, Topograd, Credo_Dat);

ИСНИ – автоматизированные системы научных исследований, используемые научными работниками при творческих процессах выработки и проверки научных идей, технических новшеств и т. д.;

САПР – системы автоматизированного проектирования ориентированные как на автоматизацию инженерно-технических, так и технико-экономических расчетов (AutoCad, Microstation);

ИСУТП – автоматизированные системы управления технологическими процессами, обеспечивающие эффективное выполнение технологического процесса производства.

Системы из классов ИСУ различаются в зависимости от территориального охвата и уровня объектов управления:

ОГИСУ – общегосударственные информационные системы управления;

ОИСУ – отраслевые информационные системы управления;

ТИСУ – территориальные (республиканские, областные, городские, районные) информационные системы;

ИСУП — информационные системы управления предприятием

ЭС – экспертные системы;

ИИС – интеллектуально - информационные системы.

Дальнейшее развитие ИС и цифровой картографии приводит к появлению нового типа, который называется - геоинформационные системы (ГИС).

До сих пор нет однозначного определения «геоинформационная система». Различные источники предлагают свою версию этого определения:

ГИС – это суперсистема, которая может состоять из географических, природно – ресурсных, экологических, муниципальных ИС, с ее помощью можно редактировать, аккумулировать, моделировать ту или иную ситуацию на цифровой карте, при этом данные могут быть получены как с земли (методы наземной съемки) так и из космоса (дистанционные методы зондирования);

ГИС - аппаратно-программный человеко-машинный комплекс, обеспечивающий сбор, обработку, отображение и распространение пространственно-координированных данных, интеграцию данных и знаний о территории для их эффективного использования при решении научных и прикладных географических задач, связанных с инвентаризацией, анализом, моделированием, прогнозированием и управлением окружающей средой и территориальной организацией общества.

В соответствии с определением Института системных исследо­ваний окружающей среды (разработчика ГИС ARC/INFO) – это организованный набор аппаратуры, программного обеспечения, географических данных и персонала, предназначенный для эф­фективного ввода, хранения, обновления, обработки, анализа и визуализации всех видов географически привязанной информа­ции.

Объекты ГИС – отображаемые предметы или явления.

Основная задача ГИС — формиро­вание знаний о земном шаре, его отдельных территориях, а также обеспечение пространственными данными различных пользовате­лей. Поэтому предметом ГИС является исследование закономер­ностей информационного обеспечения пользователей, включая принципы построения системы сбора, накопления, обработки, моделирования и анализа пространственных данных, их отобра­жения и использования, доведения до пользователей, формирова­ния технических программных средств, разработки технологии изготовления электронных и цифровых карт, формирования соот­ветствующих организационных структур.

ГИС используют практически во всех отраслях и областях зна­ний: в навигации, на транспорте и в строительстве, в геологии, географии, военном деле, топографии, экономике, экологии, те­матической картографии и др.

Геоинформационные системы могут быть классифицированы по следующим признакам:

- назначению (в зависимости от целевого использования и характера решаемых задач);

- проблемно-тематической ориентации (в зависимости от области применения);

- территориальному охвату (в зависимости от масштабного ряда цифровых картографических данных, составляющих базу данных ГИС);

- по функциональным возможностям;

- способу организации географических данных (в зависимости от форматов ввода, хранения, обработки и представления картографической информации).

В свою очередь, по назначению возможно выделение многоцелевых, информационно-справочных, мониторинговых и инвентаризационных, исследовательских, принятия решений, учебных и издательских ГИС.

ГИС проблемно-тематической ориентации это:

экологические, природопользовательские, социально-экономические, земельно-кадастровые, геологические, инженерных коммуникаций и городского хозяйства, чрезвычайных ситуаций, навигационные, транспортные, торгово-маркетинговые, археологические.

По территориальному охвату устанавливают следующие виды ГИС: глобальные, общенациональные, региональные, локальные, муниципальные.

По функциональным возможностям ГИС можно подразделить:

Профессиональные, нацеленные на обработку больших массивов информации на высокопроизводительных компьютерах и вычислительных сетях и предназначенные для серьезных научных исследований, руководства целыми отраслями или крупными территориями (государствами, мегаполисами, городами). Наиболее выделяющиеся среди них программные продукты фирм ESRI, INTERGRAPH, AutoDesk, SIMENS NIXDORF, GDS и др.;

Инструментальные ГИС – системы с наиболее широкими возможностями, включающие подсистемы ввода данных, подсистемы пространственного моделирования и анализа данных, мощные средства запросов, средства вывода на твердые носители информации, средства расширения возможностей систем. Среди них можно отметить такие продукты, как MapInfo Professional, ArcView, WinGIS, Atlas GIS, Credo, ГИС-Конструктор и т.д.

ГИС-вьюеры – системы сопровождения инструментальных ГИС (электронные атласы). Предназначены для просмотра введенной ранее информации, позволяющие вести информационные запросы, корректировку данных.

Наиболее известны следующие ГИС-вьюверы: ArcView1 и 2 ( ESRI, США), WinCAT( Simens Nixdorf, Германия).

Справочные картографические системы - это закрытые (в отношении формата и адаптации) оболочки, содержащие простой механизм запросов и отображения. Представителями этого рода программных продуктов являются ArcExplorer (ESRI), M-City (информационно-справочная система с картой г. Москвы), Владивосток (Адресный план города), Дубль ГИС (г. Новосибирск).

Специальные средства пространственного моделирования – системы, оперирующие с пространственной информацией, предназначенные для моделирования процессов.

Основными представителями данных средств пространственного моделирования являются:

- линия продуктов фирмы Eagle Point, США;

- линия продуктов фирмы SOFTDESK, США.

Векторизаторы растровых изображений. Этот класс продуктов связан с вводом картографических данных. Поскольку основная аналитическая работа в ГИС-пакетах реализуется на векторной модели данных, то существует обширная группа задач по обработке отсканированных растровых картографических изображений (MapEdit, EasyTrace).

Средства обработки данных дистанционного зондирования.

Материалы, получаемые в результате аэро и космических съемок, требуют большой предварительной обработки, которая и производится с помощью средств обработки данных дистанционного зондирования.

Наиболее известными представителями являются ERDAS Imagine, ER Mapper, серия продуктов Intergraph, TNT Mips.

Функциональные возможности ГИС определяются также архитектурным принципом их построения:

Закрытые системы. Они не имеют возможностей расширения, у них отсутствуют встроенные языки, не предусмотрено написание приложений, они выполняют только то, что выполняют на момент их покупки. В большинстве случаев закрытые системы вообще невозможно изменить, поэтому они имеют низкие цены и короткий жизненный цикл.

Открытые системы. Системы этой категории обычно имеют от 10 до 40% встроенных функций и по 10 – 30% могут быть достроены самим пользователем при помощи специального аппарата создания приложений при помощи специального аппарата (встроенных языков программирования).

Открытые системы обычно дороги первоначально, но имеют большой жизненный цикл.

Кроме того ГИС можно классифицировать по типам представления географической информации. Выделяют два типа ГИС, в которых используются разные модели представления данных:

- ГИС на основе растровой модели представления данных.

- ГИС на основе векторной модели представления данных.

 

3.ОСНОВЫ ЦИФРОВОЙ КАРТОГРАФИИ

 

3.1 Общие понятия о цифровой модели местности.

 

Под (ЦММ) – понимают логико – математическое описание в цифровой форме объектов земной поверхности (информация обо всех элементах местности - рельефе, ситуации, топографических объектах) и отношения между ними.

Особенности ЦММ:

- ее содержание ориентировано на отображение топографических свойств местности;

- информация структурирована;

- она имеет дискретную форму.

Свойство ЦММ:

- Адекватность модели исходному объекту, т.е. объекты на ЦММ должны реально отображать местность с необходимой и достаточной точностью.

Содержание ЦММ:

Состоит из двух частей информации: ЦММ={Iсл.;Iт}

- служебная информация;

- топографическая информация.

Служебная информация– включает в себя параметры ЦММ: номенклатуру, разграфку, масштаб, систему координат и высот, наименование организации, год съемки, метод съемки.

Главная особенность служебной информации заключается в том, что она не зависит от свойств конкретной местности.

Топографическая информация - включает в себя формирование данных об элементах местности об элементах местности, полученных геодезическими, фотограмметрическими и картометрическими методами. Она состоит из 3 составляющих Iт{Iг;Iсем;Iстр}:

-геометрической информации;

-семантической информации;

-структурной информации.

Геометрическая информация – это отображение пространственных свойств местности, т.е. взаимное расположение, форма и размеры объектов или поверхности. В качестве составных частей геометрической информации можно выделить 2 типа информации:

Iг = {Iм;Iс}, где (Iм ) метрическая и (Iс) синтаксическая.

Метрическая информация представляет собой совокупность данных о пространственном положении точек. Iм= x,y. Синтаксическая информация, характеризует структуру и форму объекта, иначе ее можно назвать как правило объединения точек в контур.

Для отображения содержательных свойств местности вводят такое понятие как «семантическая информация». Эту информацию составляет множество данных и характеристик технических, биологических, социальных и т.д.

Структурная информация позволяет отобразить пространственно-логические отношения между объектами. В общем виде ЦММ состоит: ЦММ={Iсл;Iм;Iсин;Iсем;Iстр},т.к. очень трудно описать правила объединения точек в контур, эти правила выносятся.

В связи с тем, что достаточно трудно формировать синтаксическую информацию, ее исключают из общей формулы, а для ее реализации в каждом программном продукте есть правила формирования объектов. ЦММ={Iсл;Iм;Iсем}.

 

3.2.Цифровые и электронные топографические карты

 

Цифровая карта – цифровая модель земной поверхности сформированная с учетом законов картографической генерализации в принятых для карт картографической проекции, разграфке, системе координат и высот.

Электронная топографическая карта-это (векторная или растровая) карта, изготовленная в принятых для общегосударственных топографических карт математической и геодезической основах, содержании, графическом и цветовом оформлении

Цифровая карта получается путем преобразования ЦММ, а электронная – путем визуализации цифровой.

Цифровая карта по составу, так и по содержанию не отличается от традиционной карты, но при этом есть отличие: - высокая точность, объекты хранятся в реальных координатах,

более высокие требования в математической и топологической корректности.

 

3.3 Требования к цифровым топографическим картам (планам)

 

Основные требования к цифровым картам:

1) Содержание цифровых карт определяется сферой их использования или применения.

2) Цифровые топографические карты должны содержать все объекты ЦТК, соответствующие их масштабу и состоянию описываемой ими местности. Объекты ЦТК должны принадлежать одному из следующих элементов (слоев) содержания цифровой топографической карты:

- математическая основа;

- опорные пункты и аэронавигационные данные;

- рельеф суши;

- гидрография и гидротехнические сооружения;

- населенные пункты;

- промышленные, сельскохозяйственные и социально-культурные объекты;

- дорожная сеть и дорожные сооружения;

- растительный покров и грунты;

- границы и ограждения;

- подписи;

- зарамочное оформление;

- слои создаются на растре.

3) В обязательном порядке содержание объектов ЦТК должно включать в себя:

- номер (код) объекта ЦТК, семантику объекта, метрику объекта.

Семантика объекта ЦТК должна содержать данные о его количественных и качественных характеристиках в объеме, определяемом требованиями к представлению этого объекта в составе топографических карт соответствующего масштаба. Семантика объекта ЦТК должна обеспечивать однозначное соответствие объекта описания и его цифрового представления в составе ЦТК.

Способ формирования метрики объекта ЦТК должен определяться характером локализации объектов ЦТК, который принят для его описания. Характер локализации должен быть одним из следующих: дискретный, линейный, площадной, подпись.

При создании и обновлении номенклатурных листов цифровых топографических карт должна быть обеспечена метрическая согласованность объектов ЦТК.

4) В составе каждого номенклатурного листа ЦТК в качестве отдельной структурной единицы информации необходимо наличие паспорта, в котором в обязательном порядке должны присутствовать справочные данные:

- номенклатура, название и масштаб листа;

- система координат, высот и разграфки;

- координаты углов рамки в градусной и прямоугольной системах координат и в системе координат данного НЛ ЦТК,

- сведения о материалах, использованных при создании НЛ;

- дата выпуска (приемки) и гриф НЛ;

- предприятие-изготовитель цифровой топографической карты;

- сведения о сводке данного листа со смежными листами;

- дата последнего обновления; и т.д

5) Точность метрики объектов цифровой топографической карты,включенных в состав ЦТК, должна соответствовать требованиям, предъявляемым к топографическим картам тех же масштабов.

Количественные характеристики объектов и справочные данные паспорта НЛ ЦТК должны быть представлены с точностью, соответствующей требованиям, которые предъявляются к объектам топографических карт тех же масштабов.

6) Для поддержания ЦТК на современном уровне как по содержанию, так и по форме, они должны обновляться с учетом следующих критериев:

- степень современности ЦТК;

- важность отдельных изменений на местности;

- необходимость преобразования содержания ЦТК в соответствии с изменением стандартов обменного формата цифровой топографической карты, классификатора и правил цифрового описания картографической информации.

7) Согласование информации:

- описание метрики объектов в составе ЦТК.

- согласование создаваемой ЦТК с ЦТК смежного масштаба.

 

3.4 Векторные и растровые форматы данных, их структура

 

Существует два основных способа представления графической информации в цифровом виде: растровое и векторное.

Растровое изображение формируется, как совокупность цветных "точек" (пикселей). Каждый пиксель характеризуется своим местоположением в изображении и цветом.

Другим широко распространенным видом представления графической информации является векторный. В этом формате все элементы изображения описываются геометрическими фигурами, как правило, это точки, линии и многоугольники.

В этом случае положение элементов изображения описывается координатами характерных точек фигур и цветовыми характеристиками.

Способ представления и расположения графических данных на внешнем носителе называется форматом графического файла.

 

Растровые форматы данных

 

Растровые форматы применяют для изображений со сложными гаммами цветов, оттенков и форм. Это такие изображения, как фотографии, рисунки, отсканированные данные.

BMP (Windows Device Independent Bitmap) - (аппаратно-независимое побитовое изображение Windows) поддерживается любыми Windows-совместимыми программами. Структура файла BMP используется Windows для хранения растровых изображений. В этом формате хранятся рисунки фона, пиктограммы и другие растровые изображения Windows. Этот формат сводит к минимуму вероятность ошибок или неправильной интерпретации растровых данных.

Данный формат имеет недостатки. Только версии формата с 4- и 8-битовым цветом поддаются сжатию (к ним можно применить метод сжатия RLE), следовательно, 24-битовые файлы BMP будут очень большими. Кроме того, применение файлов BMP ограничено платформами Windows и OS/2.

GIF (Graphics Interchange Format) – формат обмена графической информацией, не зависящий от аппаратного обеспечения, для передачи растровых изображений по сетям (в Интернете).

JEPG ( Joint Photographic Experts Group) – объединенная экспертная группа по фотографии, рабочая группа по созданию стандартов видео- и мультипликационных изображений. Формат представляет собой сжатый BMP. Несмотря на медленную программную распаковку и упаковку, обеспечивает наилучшее сжатие за счет кодирования с большими потерями. Формат предназначен для обмена между различными системами и приложениями. Данный формат позволяет сжать информацию в 20-100 раз. При этом качество изображения будет ниже, чем в других. Нашел широкое применение в Интернете.

TIFF – (Tagged Image File Format) – платформенно-независимый формат файла, предназначенный для обмена изображениями высокого качества между настольными издательскими системами и связанными с ними приложениями. Основным недостатком формата является большое количество расширений, что требует точной передачи в заголовке типа расширения.

PNG (Portable Network Graphics - Переносимая сетевая графика) - формат, разработанный относительно недавно для сети, призванный заменить собой устаревший GIF. В файл формата PNG записывается также информация о гамма-коррекции. Эта особенность помогает реализации основной идеи WWW - одинакового отображения информации независимо от аппаратуры пользователя. Формат PNG поддерживается Microsoft Internet Explorer.

PCX – один из самых старых и наиболее широко используемых растровых форматов для персональных компьютеров, разработанный фирмой Zsoft Corporation. Поддерживает полноцветные изображения (24-битовые цвета), которые реализуются либо в качестве палитры, имеющей до 256 цветов, либо как полный 24-битовый RGB, с размерами до 64 000 * 64 000 пикселов. Формат не позволяет хранить данные CMYK- или HSI-моделей, таблицы коррекции цвета или оттенков серого. Данные сжимаются методом группового кодирования. Поддерживается настольными издательскими системами, графическими редакторами, программами захвата видеокадров.

PSD – PhotoShop Document – собственный формат программы PhotoShop, позволяющий хранить слои и каналы.

 

Структура растровых форматов

В общем виде структура растрового формата включает четыре раздела:

- заголовок;

- карта цвета;

- растровые данные;

- концовка.

Заголовок – обычно располагается в начале файла. Хранит общую информацию о растровых данных, например: версия формата, размер изображения, разрешение, битовая глубина, тип сжатия, система координат.

Карта цвета – палитра цветов, которые используются в файле.

Растровые данные – хранятся в виде 1-, 4-, или 8-битовых индексов карты цветов или в виде буквенных 24-битовых данных системы RGB. Пиксели в растре записываются, начиная с нижнего левого угла изображения, и читаются слева направо и снизу вверх.

Концовка – раздел, где вводятся дополнительные данные, которые обеспечивают совместимость с предыдущими версиями формата.

 

Сжатие изображений

Как и многая информация, графика может быть сжата. Это выгодно с точки зрения экономии памяти компьютера, так как, например, высококачественные изображения, имеют размеры до нескольких десятков мегабайтов. Для файлов графических изображений разработаны множество схем и алгоритмов сжатия, основными из которых являются:

- групповое сжатие (RLE);

- кодирование методом Хаффмана;

- сжатие по схеме LZW;

- арифметическое сжатие;

- сжатие с потерями;

- преобразование цветов RGB в цвета YUV.

В основе большинства схем сжатия лежит использование одного из свойств графических данных: избыточность, предсказуемость и необязательность. В частности, групповое кодирование (RLE) основано на использовании первого свойства. Кодирование по методу Хаффмана и арифметическое кодирование, основанные на статистической модели, используют предсказуемость, предлагая более короткие коды для более часто встречающихся пикселов. Алгоритмы сжатия с потерями основаны на избыточности данных.

Следует учесть, что алгоритм, обеспечивающий большую степень сжатия, обычно более сложный и поэтому требует для распаковки данных больше процессорного времени.

 

Групповое сжатие

Групповое сжатие представляет собой одну самых простых схем сжатия файлов. Суть его заключается в том, что серия повторяющихся величин заменяется единственной величиной и ее количеством. На примере можно заметить выгоду в длине между «aabbbbbbbcdddeeeeaaa» и 2a7b1c3d4e3a». Данный алгоритм прост в реализации и хорошо сжимает графические файлы с большими однотонными областями. Групповое кодирование используется во многих форматах растровых файлов, таких как ~TIFF, PCX и т. д.

 

Кодирование методом Хаффмана

Смысл метода Хаффмана заключается в замене данных более эффективными кодами. Более короткие коды используются для замены более часто появляющихся величин.

В основе этого метода лежит кодирование не байтами, а битовыми группами:

- перед началом кодирования производится частотный анализ кода документа и выявляется частота повтора каждого из встречающихся символов.

- чем чаще встречается тот или иной символ, тем меньшими количеством битов он кодируется (соответственно, чем реже встречается символ, тем длиннее его кодовая битовая последовательность).

- образующаяся в результате кодирования иерархическая структура прикладывается к сжатому документу в качестве таблицы соответствия.

 

Достоинства растровой графики:

- растровая графика позволяет создать (воспроизвести) практически любой рисунок, вне зависимости от сложности;

- распространенность;

- высокая скорость обработки сложных изображений, если не нужно масштабирование;

- растровое представление изображения естественно для большинства устройств, ввода/вывода графической информации.

 

Недостатки растровой графики:

- большой размер файлов с простыми изображениями;

- невозможно обойтись без искажений при любых трансформациях: поворотах, наклонах и т.д.;

- невозможность идеального масштабирования;

- неудобно связывать изображения с описанием объекта;

- затруднено пространственное преобразование изображения,

 

Векторные форматы данных и их структура

В настоящее время известно много различных форматов векторного представления данных, которые предназначены для хранения цифровой картографической информации. Все они отличаются друг от друга сложностью выбранных моделей представления данных. В самых простых форматах содержится информация только о геометрических связях объектов, в более сложных форматах добавляется информация о топологии (связи или отношениях между объектами) и их атрибутах (семантика – характеристики и свойства объекта – технические, биологические, социальные и др.).

Векторные форматы:

WMF(Windows MetaFile) – использует графический язык Windows и является ее родным форматом. Служит для передачи векторов через буфер обмена (Clipboard). Понимается практически всеми программами Windows, так или иначе связанными с векторной графикой.

DXF (Drawing Exchange Format) — открытый формат файлов для обмена двумерной графической информацией между приложениями САПР.

Достоинства векторной графики:

- малый объем памяти и легкость редактирования;

- свобода трансформации;

- аппаратная независимость;

- удобство связывания изображения объектов с записями в базах данных;

- легкость изменения изображения по заданным правилам.

Недостатки векторной графики:

- программная зависимость;

- сложность векторного принципа описания изображения;

- векторная графика действительно ограничена в чисто живописных средствах и не предназначена для создания фотореалистических изображений.

 

Структура векторных форматов.

Из всех форматов можно выделить 4 типа:

1) спагетти;

2) текстовый;

3) DXF;

4) цепочно-узловой.

 

Модель данных «спагетти» («spaghetti»)

Одна из самых простых моделей представления данных в векторном формате на рисунке 1.

 
 

 

 


Рисунок 1 - «Спагетти» - модель.

Данные описываются в виде строчных элементов (таблица 1).

 

Таблица 1 - Структура данных модели "спагетти"

Объект номер Положение
Точка Одна пара координат (x,y)
Линия Набор пар координат (x,y)
Область Набор пар координат (x,y), первая и последняя совпадают

 

В этой модели не содержится описания отношений между объектами, каждый геометрический объект хранится отдельно и не связан с другими, например общая граница объектов 25 и 26 записывается дважды, хотя с помощью одинакового набора координат. Все отношения между объектами должны вычисляться независимо, что затрудняет анализ данных и увеличивает объем хранимой информации.

Текстовый (ASCII) формат

(ASCII) Сокращение от American Standard Code for Information Interchange (Американский стандартный код для обмена информацией). ASCII является стандартной кодировкой, используемой в большинстве микрокомпьютеров, многими компьютерными терминалами и принтерами для представления символов. В эту кодировку включены не только буквы, цифры и другие графические знаки, но и управляющие символы типа возврата каретки и т.п.

Текстовый (ASCII) формат данных используют для обмена данных между ИС.

Данные представляются в виде последовательности строк текста, состоящей из заголовка (ключевого слова – определяется тип объекта) и следующего за ним набора цифровых данных, описывающих атрибуты объекта, определенного заголовком. Например, запись может иметь вид:

ТИП ОБЪЕКТА = О

141 141 ,

что означает определение точки внутренними координатами х=141, у=141.

 

Формат DXF

DXF (Drawing Exchange Format) — открытый формат файлов для обмена двумерной графической информацией между приложениями САПР. Был создан фирмой Autodesk для системы AutoCAD. Поддерживается практически всеми CAD-системами на платформе PC. Структура формата состоит из четырех отдельных секций:

- секция заголовка (HEADER);

- секция таблиц (TABLE);

- секция блоков (BLOCKS);

- секция объектов (ENTITIES).

Секция заголовка содержит значения, определяющие рабочие параметры чертежа и его окружения. Это номер версии программы AutoCAD, система координат, единицы измерения расстояний, углов, режим отображений и вычерчивания.

В секции таблиц информация разбита на четыре подсекции:

- подсекция тип линий (LINETYPE);

- подсекция слой (LAYER);

- подсекция шрифт (STYLE);

- подсекция вид экрана (VIEW).

Секция блоков содержит подробную информацию об объектах (набор стандартных примитивов) для всех определенных в чертеже блоков. Под блоком понимается совокупность примитивов. Эти блоки могут быть образованы при выполнении операций нанесения размеров, вставки изображения из графических библиотек и т.д.

Каждый блок начинается с имени блока и зафиксированной точки признака данного блока (местоположения), затем следует список объектов, входящих в этот блок.

В секции объектов содержится список всех активных графических объектов со ссылками на секции блоков и таблиц. Секция объектов описывается тремя понятиями: признак (тип объекта), маркер, значение.

Каждый объект (точка, линия, дуга и т.д.) имеет свой формат описания.

Каждый примитив имеет признак либо наименование, маркер или значение.

 

Цепочно-узловой формат

Цепочно-узловой формат используется внутри ИС. Графическая информация в цепочно-узловом формате представляется в виде трех элементов: узлов, звеньев и объектов (рис.2).

Между этими элементами устанавливаются связи на уровне описания имен. Известно несколько модификаций этого формата. Приведем упрощенное описание одного из них.

Файл в данном формате состоит из четырех разделов:

- точек;

- узлов;

- дуг;

- областей.

В файле точек записи имеют структуру «номер точки, X, Y» (таблица точек).

В файле узлов, для каждой точки, являющейся узлом, содержится ее номер и список дуг к нему примыкающих. Узел - это пересечение двух или более дуг, и его номер используется для ссылки на любую дугу, которой он принадлежит (таблица узлов).

В файле дуг каждая дуга начинается и заканчивается либо в точке пересечения с другой дугой, либо в узле, не принадлежащем другим дугам. Дуги образуются последовательностью отрезков, соединенных промежуточными точками. В этом случае каждая линия имеет два набора чисел: пары координат промежуточных точек и номера узлов. Кроме того, каждая дуга имеет свой идентификационный номер, который используется для указания того, какие узлы представляют ее начало и конец (таблица дуг).

В файле областей каждая область описывается номерами дуг, из которых он состоит, и ссылки на запись с его семантикой в атрибутивной базе данных (таблица областей).

Цепочно-узловой формат позволяет легко контролировать соблюдение топологических отношений связанных с примыканиями объектов и расположением площадных и линейных объектов друг относительно друга. При использовании такой структуры, есть возможность избежать повторения сложных объектов.

 

 
 

 

 


Рисунок 2 - Цепочно – узловой формат

Таблица точек

 

Файл точек
Номер точки Координата X Координата Y

 

Таблица узлов

 

Файл узел
Номера точки Список дуг
1, 4
4, 3, 5
1,2,3
2,5

Таблица дуг

 

Файл дуг
Номер дуги Правый полигон Левый полигон Начальный узел Конечный узел

 

 

Таблица областей

 

Файл областей
Номера областей Список дуг
1, 4, 3
2, 3, 5