Лекция 3
Организация данных в информационных системах
Под организацией данных понимается совокупность методов и средств, позволяющая эффективно использовать данные при решении информационных задач.
В любых автоматизированных системах данные организованы с помощью двух основных типов данных:
· внутримашинных
· нешнемашинных
Под базой данных понимается упорядоченное или структурированное, определенным образом, информация, необходимая для решения информационных задач в АС.
БД выполняет сложные основные функции:
· хранение
· поиск
· извлечение информации
· преобразование к виду, удобному для обработки.
Внутримашинные базы данных представляют собой совокупность структурированных данных и управляющих программ, обеспечивающих работу с данными.
Внутримашинняя база данных состоит из двух основных частей:
· совокупности данных, представленных связанными файлами
· системы управления базой данных (СУБД), представляющие программное обеспечение обработки данных.
Данные в компьютере могут храниться с помощью двух основных способов:
1. файловая система
2. база данных.
Данные, организованные в файловой системе (Windows) – это совокупность файлов и папок, упорядоченных в иерархическую структуру.
Основное отличие файловой системы от базы данных – файлы между собой не связаны, независимы. Преимущество файловой структуры заключается в простоте работы с данными. Недостатки заключаются в малой эффективности решения задач поиска и извлечения нужной информации.
В базе данных данные также хранятся в файле, но эти файлы связанны между собой в определенную структуру, основное значение которой – исключить дублирование данных, обеспечить их эффективный поиск, поддержку целостности данных так, чтобы при удалении (добавлении) данных структура не нарушалась.
В настоящее время, используют реляционные типы (relation - отношение) данных. В таких базах данных, данные связаны между собой специальными типами отношений, которые позволяют эффективно хранить и обрабатывать базу данных.
Преимущества:
1. это быстрый поиск нужной информации
2. сохранение целостности данных
3. исключение дублирующего ввода данных.
Недостатки:
1. сложность создания и поддержки баз данных
2. специальные алгоритмические языки для описания структуры данных
3. сложность поддержания целостности данных
4. для работы с базой данных требуются специалисты высокой квалификации (администраторы базы данных).
Наиболее известные СУБД:
· Microsoft Access
· Progress
· Oracle
· Fox Pro
Задачи эффективного представления и хранения данных, в настоящее время, не решена до конца, поэтому пользователь всегда стоит перед проблемой выбора: «Какую СУБД использовать в своей информационной системе?»
СУБД Access предназначена для решения задач в информационной системе малых предприятий.
Под немашинной информацией БД понимается совокупность методов и средств кодирования, идентификации, хранения, поиска и извлечения данных, хранящихся в немашинной форме представления:
· Нормативно – справочный материал
· Подлинники документов (фото/киноматериал, накладные, видео/аудио материал, на кассетах с магнитной лентой).
Для немашинной информации центральную роль играют методы и технологии классификаций и кодирования информации. Существуют стандарты на методы классификации и кодирование информации, а также общероссийские классификаторы документов в различных прикладных областях.