Лекция 3

Организация данных в информационных системах

Под организацией данных понимается совокупность методов и средств, позволяющая эффективно использовать данные при решении информационных задач.

В любых автоматизированных системах данные организованы с помощью двух основных типов данных:

· внутримашинных

· нешнемашинных

Под базой данных понимается упорядоченное или структурированное, определенным образом, информация, необходимая для решения информационных задач в АС.

БД выполняет сложные основные функции:

· хранение

· поиск

· извлечение информации

· преобразование к виду, удобному для обработки.

Внутримашинные базы данных представляют собой совокупность структурированных данных и управляющих программ, обеспечивающих работу с данными.

Внутримашинняя база данных состоит из двух основных частей:

· совокупности данных, представленных связанными файлами

· системы управления базой данных (СУБД), представляющие программное обеспечение обработки данных.

Данные в компьютере могут храниться с помощью двух основных способов:

1. файловая система

2. база данных.

Данные, организованные в файловой системе (Windows) – это совокупность файлов и папок, упорядоченных в иерархическую структуру.

Основное отличие файловой системы от базы данных – файлы между собой не связаны, независимы. Преимущество файловой структуры заключается в простоте работы с данными. Недостатки заключаются в малой эффективности решения задач поиска и извлечения нужной информации.

В базе данных данные также хранятся в файле, но эти файлы связанны между собой в определенную структуру, основное значение которой – исключить дублирование данных, обеспечить их эффективный поиск, поддержку целостности данных так, чтобы при удалении (добавлении) данных структура не нарушалась.

В настоящее время, используют реляционные типы (relation - отношение) данных. В таких базах данных, данные связаны между собой специальными типами отношений, которые позволяют эффективно хранить и обрабатывать базу данных.

Преимущества:

1. это быстрый поиск нужной информации

2. сохранение целостности данных

3. исключение дублирующего ввода данных.

Недостатки:

1. сложность создания и поддержки баз данных

2. специальные алгоритмические языки для описания структуры данных

3. сложность поддержания целостности данных

4. для работы с базой данных требуются специалисты высокой квалификации (администраторы базы данных).

Наиболее известные СУБД:

· Microsoft Access

· Progress

· Oracle

· Fox Pro

Задачи эффективного представления и хранения данных, в настоящее время, не решена до конца, поэтому пользователь всегда стоит перед проблемой выбора: «Какую СУБД использовать в своей информационной системе?»

СУБД Access предназначена для решения задач в информационной системе малых предприятий.

Под немашинной информацией БД понимается совокупность методов и средств кодирования, идентификации, хранения, поиска и извлечения данных, хранящихся в немашинной форме представления:

· Нормативно – справочный материал

· Подлинники документов (фото/киноматериал, накладные, видео/аудио материал, на кассетах с магнитной лентой).

Для немашинной информации центральную роль играют методы и технологии классификаций и кодирования информации. Существуют стандарты на методы классификации и кодирование информации, а также общероссийские классификаторы документов в различных прикладных областях.