Класифікація моделей даних.

Ядром БД є модель даних сукупність структур даних і операцій їх обробки.

У моделі даних розрізняють три головні складові:

− структурна частина, яка визначає правила породження допустимих для даної СУБД видів структур даних;

− управляюча частина, яка визначає можливі операції над такими структурами ;

− класи обмежень цілісності даних, які можуть бути реалізовані засобами цієї системи.

Моделювання даних – це процес створення логічного представлення структури бази даних.

На рис. 2.2 показана класифікація моделей даних.

 

Кожному рівню представлення інформації відповідає певна модель.

Інфологічна модель – відображає інформацію про предметну область у вигляді незалежному від СУБД, що використовується. Ця модель відображає інформаційно-логічний рівень абстрагування, який пов'язаний з описом об'єктів предметної області, їх властивостей і взаємозв'язків.

Часто ці моделі ототожнюють з концептуальними моделями предметної області і називають концептуальними інфологічними моделями (внутрішня і зовнішня концептуальні інфологічні моделі).

Даталогічна модель – модель логічного рівня, яка відображає логічні зв'язки між елементами даних безвідносно до їх змісту і середовища збереження. Часто ці моделі ототожнюють з логічними моделями.

Фізична модель – описує те, як дані зберігаються в комп'ютері, представляючи інформацію про структуру записів, їх впорядкованість і про існуючі шляхи доступу до даних.

Модель "сутність-зв'язок" (ER-модель) – описує модель предметної області і складається з множини сутностей, множини звязків між сутностями, а також з атрибутів сутностей і зв'язків. В модель входить обмеження цілісності даних, що пов'язано з двома множинами сутностей і називається залежністю по існуванню. ER-моделі дозволяють графічно представляти моделі предметних областей. Вони є складовою частиною багатьох CASE-продуктів.

Семантична об'єктна модель – описує модель предметної області і являє собою модель даних. Ця модель складається з семантичних об'єктів, що містять сукупність атрибутів. Атрибути групуються у класи. Модель даних володіє більш розвиненими засобами відображення семантики у порівнянні з теоретико-множинними і теоретико-графовими моделями.

 

Фактографічні моделі – містять відомості, які представлені у вигляді спеціальним чином організованих сукупностей формалізованих записів даних.

 

Документальні моделі – передбачають, що в якості одиничного елемента інформації виступає неподільний на менші складові частини документ, а інформація про документ, як правило, не структурується, або структурується в обмеженому вигляді. В цих моделях в основному розглядаються тексти на природній мові, формати документів є вільними.

Теоретико-графова модель – це модель даних, в якій дозволені структури даних можуть бути представлені у вигляді граф загального або спеціального виду, наприклад дерева.

Теоретико-множинна модель – це модель даних, в якій використовується апарат реляційної алгебри, реляційного обчислення, а операції над даними маніпулюються таблицями.

Об'єктно-орієнтована модель – це модель даних, яка базується на понятті об’єкта, тобто сутності, що володіє станом і поведінкою.

Стан об'єкта визначається його атрибутами, а поведінка визначається сукупністю операцій, що визначені для цього об'єкта. Також передбачається можливість підтримки зв'язків між типами об'єктів.

Багатомірна модель – модель даних, яка оперує багатомірним представленням даних ( у вигляді гіперкубу) і орієнтована на підтримку аналіза даних. Передбачається конструювання різноманітних агрегацій даних у межах гіперкубу, побудова різних його проекцій – підмножин гіперкубу, деталізація і обертання даних, а також цілий ряд інших операцій.

 

Дескрипторна модель – описує кожен документ за допомогою дескриптора. Дескриптор має жорстку структуру і являє собою набори деяких лексичних одиниць ( слов, словосполучень, термінів), які потрібні для роботи з документами. Дескриптори між собою не зв'язані.

Тезаурусна модель – описує кожен документ за допомогою дескрипторів, а також змістовних відношень між лексичними одиницями (ціле-частина, род-вид, клас-підклас і т.ін.). Ці моделі дозволяють підвищити ефективність дескрипторних моделей за рахунок більш ефективного відображення предметної області.

Гіпертекстова модель – модель, що заснована на розмітці документа за допомогою спеціальних навігаційних конструкцій, які відповідають змістовим зв'язкам між різними документами, або окремими фрагментами одного документа. Такі конструкції утворюють деяку семантичну мережу в базі документів.

 

Ієрархічна модель дозволяєбудувати БД з деревовидною структурою. У них кожен вузол містить свій тип даних (суть). На верхньому рівні дерева є один вузол – корінь, на наступному рівні розташовуються вузли, пов'язані з цим коренем, потім вузли, пов'язані з вузлами попереднього рівня, і так далі Кожен вузол може мати лише одного предка (мал. 11).

 

 

 

Мал. . Ієрархічна деревовидна структура моделі БД

 

Пошук даних завжди починається з кореня. Потім проводиться|виробляє| спуск з одного рівня на іншій доки|поки| не буде досягнутий шуканий рівень. Переміщення від одного запису до іншої здійснюються за допомогою заслань|посилань|.

Достоїнствами ієрархічної моделі є простота опису ієрархічних структур реального миру|світу|, а також швидке виконання запитів, відповідних структурі даних. Недоліки|нестачі| ієрархічної моделі в тому, що вони часто містять|утримують| надлишкові|надмірні| дані і не завжди зручно кожного разу починати пошук потрібних даних з кореня.

 

У мережевій моделіможливі зв'язки всіх інформаційних об'єктів зі всіма. Наприклад, кожен викладач може виучувати багато студентів і кожний студент може навчатися у багатьох викладачів (мал. ).

 

 

 

 

Операції над даними, виражені в мережній моделі:

- Додавання нових даних;

- Видалення існуючого запису;

- Вибірка даних;

- Зміна вибраного запису;

- Виключити взаємозв’язок;

- Перестановка взаємозв’язків.

Переваги мережної моделі:

- Немає дублювання інформації;

- Відсутні проблеми додавання та видалення записів.

Недоліки мережної моделі:

- Складність реалізації;

- Неможливість виконання нерегламентованих запитів.

Використання ієрархічної і мережевої|мережної| моделей прискорює доступ до інформації, але|та| вимагає значних ресурсів пам'яті, оскільки|тому що| кожен елемент даних містить|утримує| заслання|посилання| на інші елементи. Характерна складність реалізації СУБД.

 

Реляційна модель(РМД) була розроблена на початку 1970-х років Едгаром Ф. Коддом. У ній інформація представляється у вигляді двовимірних таблиць, а операції зводяться до маніпуляцій з таблицями. У 1980-х роках вона набула широкого поширення, а реляційні СУБД стали промисловим стандартом. Причини домінування РМД обумовлені тим, що є:

· розвинена теорія (реляційна алгебра);

· апарат зведення інших моделей даних до РМД;

· спеціальні засоби|кошти| прискореного доступу до інформації;

·стандартизована високорівнева мова|язик| запитів до БД, що дозволяє маніпулювати даними без знання фізичної організації БД.

 

 

 

Основними і фундаментальними правиломи реляційної моделі є:

ü Відсутність стовпчиків-дублікатів;

ü Відсутність впорядкованості рядків;

ü Відсутність впорядкованості атрибутів.

Переваги реляційної моделі:

- Можливість змоделювати майже будь-яку предметну область.

- Наявність простого та могутнього математичного апарату, що грунтується на теорії множин та математичній логіці і забезпечує теоретичний базис реляційного підходу до організації БД.

- Можливість маніпулювання даними без необхідності знання конкретної фізичної організації БД.

Недоліки реляційної моделі:

- Складні структури даних представляються за допомогою великої кількості двомірних реляційних таблиць, що веде до збереження зайвої службової інформації.

- Велика кількість таблиць істотно ускладнює і сповільнює виконання складних трансакцій.

Об'єктно-орієнтована модель почала розроблятися в 1990-і роки з появою об'єктно-орієнтованих мов. Такі БД зберігають методи класів, що дозволяє інтегрувати дані і їх обробку в додатках.

• . В її основу покладено принципи подання даних, які застосовують в об'єктно-орієнтованих системах програмування:

застосування складних та абстрактних типів даних,

ü інкапсуляція даних - поєднання в одному об'єкті значень даних та програм їх опрацювання,

ü застосування класів об'єктів,

ü продукування об'єктів на основі класів,

ü успадкування властивостей та інші принципи.

Для реалізації таких баз даних було розроблено об'єктно-орієнтовані мови опису даних, об'єктно-орієнтовані мови маніпулювання даними та об'єктно-орієнтовані мови запитів. Незважаючи на новизну та прогресивність такого підходу, об'єктно-орієнтовані бази даних не отримали значної підтримки, насамперед, через надто високий рівень абстракції в описі даних та маніпулюванні ними, а також через спротив значної кількості розробників і користувачів систем, створених на основі реляційного підходу.

Перспективними моделями є моделі, які розвивають принципи реляційної - постреляційна, багатовимірна, об'єктно-реляційна.

Постреляційна модель є своєрідним узагальненням та вдосконаленням ре­ляційної моделі, що передбачає застосування в клітинках таблиці неелементарних значень - масивів, множин, груп, таблиць, тощо, а також опрацювання часового фактора при роботі з даними. На сьогодні значна частина систем управління база­ми даних, які позиціонують як реляційні, застосовує певні постреляційні принци­пи і засоби їх реалізації.

Переваги постреляційної моделі:

- Масштабування даної моделі – не потрібна велика кількість таблиць.

- В реальних додатках продуктивність систем, що використовують дану модель у двадцять разів вище реляційних СУБД.