Иерархическая модель (дерево)

Тема 6. Организация информации в компьютерных системах

Для того чтобы эффективно работать с информацией, необходимо знать, как она организована, то есть где она находится. А находится она в документах.

В современной информатике это понятие значительно более широкое, чем то, которое традиционно применяется в области делопроизводства.

Документ - поименованный объект, содержащий определенную информацию. Имя документа используется для его поиска и идентификации. Используя такое широкое определение, документами можно назвать книгу, письмо, кинофильм, аудиозапись, файл и даже любой экспонат музея.

Электронный документ - документ, в котором информация представлена в электронно-цифровой форме.[3]

В компьютерных технологиях электронный документ часто называют файлом. Аналогично, одно и то же обозначают такие понятия как каталог, папка и директория.

Различные способы организации информации называют моделями представления информации (данных).

Иерархия – подчиненность нижних структур верхним.

Так же как по папкам раскладывают бумаги, электронные документы (файлы) группируются по каталогам (папкам). Каталоги располагаются на диске. Один каталог может быть вложен в другой.

Корневым называется каталог, в который вложены все другие каталоги.. Каталог, который вложен в корневой - каталогом первого уровня. Каталог, вложенный в каталог первого уровня, называется каталогом второго уровня и т. д.

Деревом каталоговназывается разветвленная, иерархическая система каталогов всех уровней. Текущими называются диск и каталог, с которыми в данный момент происходит работа.

Полное имя файла состоит из пути к файлу, его имени и расширения. Путь указывает диск и последовательность каталогов, ведущих к файлу.

Имя файла используется для поиска и идентификации файла. Расширение указывает тип файла. Файлы с расширениями exe, com, bat запускают выполнение программ. Файл может и не иметь расширения.

Например, файл с именем proba.txt находится в каталоге TEXT, который вложен в каталог LEX корневого каталога, и все это размещено на диске С.

Тогда полное имя файла будет: C:\Документы\Отчеты\Годовой.doc

В этой записи отражено следующее:

Путь к файлу:

С: - Диск С,

\ - корневой каталог,

Документы - каталог 1-ого уровня,

Отчеты - каталог второго уровня,

Годовой - имя файла,

doc – расширение.

 

С:\

 
 

 

 


Рис. Дерево папок

 

Только указав полное имя файла (с путем к нему), вы можете рассчитывать, что операционная система, как опытный библиотекарь, найдет «нужную полку» с вашим файлом.

Описанная выше система организации информации напоминает дерево. Если корневой каталог – это ствол, то каталог первого уровня – это ветвь, идущая от ствола, ветвь от нее – каталог второго уровня
и т. д. На конце ветки дерева листок – документ. Такая организация информации по принципу дерева хороша тем, что позволяет быстро находить документ, если известен путь к нему (полное имя документа). По этому принципу организована информация не только в компьютерных системах, но и в обычных библиотеках (систематический каталог с индексами УДК).

Достоинство модели – адекватное описания иерархических систем и быстрый поиск информации, если известно полное имя файла.

Недостаток – трудности с поиском, если полное имя файла неизвестно.

Сетевая модель (паутина)

Однако, в том случае, когда неизвестны точные имена документов, поиск затруднен. В этом случае удобнее использовать другой принцип организации информации – сетевой или принцип «паутины».

 
 

 


Рис. 3.Паутина

 

Принцип паутины– такая организация информации, при которой информация на определенную тему сосредоточена в информационных узлах, связанных между собой множественными связями, ссылками (нитями паутины).

Рассмотрим принцип «паутины» на примере книги. Каждая научная книга, помимо текста, имеет список литературы и ссылки на него. То есть каждая книга через ссылки связана с множеством других книг, а те, в свою очередь, с другими и так далее. Книга является узлом информационной паутины, а ссылки – её нитями. В компьютерных технологиях документы тоже имеют ссылки, а точнее гиперссылки. Документы, содержащие гиперссылки, называются гипердокументами или Web-страничками. Гиперссылка – это выделенный текст или графика, активизация которых (щелчком мыши) открывает документ, на который сделана ссылка. Отличие гиперссылки от обычной ссылки чисто техническое. Для того чтобы найти нужную книгу согласно ссылки, читателю придется идти в библиотеку, а пользователь компьютера автоматически получит запрашиваемый документ, лишь щелкнув по гиперссылке. Конечно, во втором случае процесс поиска информации значительно ускоряется, ведь документ может быть быстро получен по сетям из другого города, другой страны и даже другого континента.

Всемирная информационная паутина (WWW) - это совокупность гигантского количества взаимосвязанных Web-страничек в сети Интернет.

Пользователь, подключенный к Интернет, получает доступ к необъятным информационным ресурсам всего человечества.

Использование принципа «паутины» эффективно на стадии начального знакомства с новой темой. Ведь достаточно найти один подходящий по теме документ (что не сложно сделать с помощью специальных поисковых машин) и затем, открывая с помощью гиперссылок другие документы, довольно быстро получить нужную информацию.

Эффективная технология поиска информации заключается в том, что на первом этапе используя принцип паутины, происходит поиск наиболее «богатых» (в смысле наличия информации по заданной теме) узлов, записываются их точные адреса, а затем отслеживается вновь появляющаяся в этих узлах информация, используя принцип «дерева».

4. Реляционная модель

Реляционная модель данных используется для создания баз данных.

Реляционная модель данных представляет собой множество взаимосвязанных двумерных реляционных таблиц, в каждой из которых содержатся сведения об одной сущности автоматизируемой предметной области.

(Relation – связь, отношение).

Сущность – объекты, процессы, события, явления.Например: товар, поставщик, заказчик, поставка, отгрузка. Сущность описывается в виде информационного объекта.

Информационный объект – это информационное описание некоторой сущности предметной области.

Информационные объекты описываются с помощью реквизитов.

Реквизит – элементарная (неделимая на смысловом уровне) характеристика ИО (поле в таблице БД). Содержимое поля отображается в столбце таблицы и содержит данные одного типа. Структура реляционной таблицы определяется составом полей.

Информационный объект имеет множество реализаций – экземпляров объекта (запись в БД).

Запись – строка таблицы, содержащая данные о конкретном экземпляре сущности.

Правила построения таблиц (пример – оценки школьников, что в поле, а что в строку?)

 

Таблица «Товар»

 

Код товара Название товара Цена Ед. изм Налог (НДС)
Т001 Компьютер Штука 15%
Т002 Монитор Штука 20%
Т003 Диски DVD Коробка 20%
Т004 Монитор Штука 5%
Т005 Принтер Штука 10%

Таблица «Поставка товаров»

 

№ Договора Код товара Срок поставки Объем поставки
Д001 Т003 1.01.2009
Д001 Т001 5.03.2009
Д002 Т002 7.04.2009
Д003 Т001 20.06.2009

 

Рис. Реляционная БД.

 

Таблица «Договоры»

 


Для однозначного определения каждой записи каждая таблица должна иметь уникальный ключ. Ключ идентифицирует запись и не может иметь одинаковое значение для разных записей в таблице.

Простой ключ состоит из одного поля, а составной из нескольких.

Ключ связи обеспечивается одинаковыми полями в паре таблиц.

Логические связи между таблицами дают возможность объединять данные из разных таблиц. Таким образом, обеспечивается рациональное хранение данных и их объединение.

Достоинства реляционных таблиц: