Загальні відомості про проектування БД

База даних – ядро УІС

У інформаційній системі з використанням технології баз даних вирішується завдання інформаційного моделювання якої-небудь наочної області (ПО) або її фрагмента. Основа УЇС, об'єкт її обробки – база даних.

Що таке база даних (БД)? У широкому сенсі слова можна сказати, що БД – це сукупність відомостей про конкретні об'єкти реального миру в якій-небудь наочній області.

Основні риси концепції БД:

· дані відділяються від програм, з'являється спеціальна програмна надбудова для управління даними, звана системою управління базами даних (СУБД); СУБД управляє даною і служить посередником між ними і програмами, вони спрощуються, звільняються від функцій структуризації, зберігання і пошуку даних;

· з'являються стандартизовані дані про фактографічні дані – метадані, керовані СУБД; метадані описують інформаційні параметри і взаємозв'язки фактографічних даних про ПО;

· СУБД спільно з метаданими є стандартизованим інструментальним засобом для моделювання ПО різної природи;

· відбувається централізація (інтеграція) даних, їх багатоаспектне використання для різних застосувань, що скорочує надмірність даних, дозволяє забезпечити вищий рівень достовірності даних і оптимізувати різні процедури ведення і використання БД.

Основними функціями СУБД є:

· управління даними в зовнішній пам'яті;

· управління буферами оперативної пам'яті;

· управління транзакціями;

· журналізація;

· підтримка мов БД.

Процес проектування бази даних виконується поетапно, а етапи в основному відповідають різновидам моделей програмного забезпечення при русі від абстрактніших до конкретнішим з датологической точки зору: концептуальній инфологической моделі і два датологических, логічного рівня і внутрішнього рівня. Побудові цих моделей передує вивчення наочної області.

Таким чином, виділяються наступні чотири етапи проектування:

· обстеження ПО, формування і аналіз вимог;

· инфологическое проектування;

· логічне проектування;

· внутрішнє (фізичне) проектування.

Кожному з етапів відповідають свої принципи, методи, прийоми.

Основний зміст першого етапу: збір відомостей про суть, їх властивості і взаємини в ПО; про процедури, пов'язані з об'єктами ПО; про вимоги по об'ємах інформації в БД, швидкодії, користувачах і тому подібне

Для спеціальних ПО доводиться спілкуватися з фахівцями і експертами, може використовуватися методологія проведення експертних оцінок і обробки їх результатів. Для обстеження і опису ПО існує цілий ряд детально розроблених методик, які пропонують види таблиць, що пропрацювали, для заповнення, запитальники і тому подібне допоміжні засоби. Це полегшує і стандартизує роботу по обстеженню ПО, дозволяє скоротити час вивчення.

На етапі концептуального, инфологического проектування розробляється концептуальна схема БД. Головні проблеми полягають в структуризації інформаційної анархії, отриманої в результаті збору інформації про ПО, у вирішенні питань:

· об'єднання інформації з різних фрагментів ПО;

· виділення об'єктів угрупуванням атрибутів (при цьому семантичні зв'язки розділяються на внутрішні, між атрибутами у складі об'єктів, і зовнішні – між суттю);

· вибору ключів;

· обліку і відображення у складі зв'язків структурних і запитальних зв'язків.

Все це вирішується неоднозначно, але від раціонального вирішення цих питань сильно залежить якість БД. Найчастіше при вирішенні вказаних питань використовується термінологія і прийоми, розроблені в рамках реляційної моделі даних (термінологія відносин, методи нормалізації відносин). Робляться спроби створити в цій сфері автоматизовані системи, подібність САПР.

Існують два підходи до ПО:

· історично перший (як більш простій і швидкий) заснований на інтеграції уявлень про ПО користувачів інформації;

· другою базується на уявленнях про що об'єктивно (незалежно від користувачів) існує ПО, з властивою нею семантикою.

Сучасна точка зору вимагає поєднання обох уявлень. Без урахування другого підходу не буде достатньої гнучкості і здібності до адаптації при коректуванні призначених для користувача потреб.

На першому і другому етапах використовуються такі загальнометодологічні принципи, як прийоми класифікаційного аналізу, принципи системного аналізу, принципи аналізу і синтезу.

При об'єднанні локальних уявлень про фрагменти ПО в єдине концептуальне уявлення використовуються три основні принципи: ідентичності, агрегації, узагальнення.

На третьому етапі, етапі логічного проектування, вибирається логічний тип моделі даних (наприклад з класичних: мережевий, ієрархічний, реляційний) і конкретна СУБД цього типу. Проводиться відображення концептуальної схеми на вибрану модель з урахуванням обмежень конкретною СУБД.

На четвертому етапі, при фізичному проектуванні, вирішуються питання конкретного використання вибраної СУБД для найбільш ефективного виконання запитів. Тут вибирається спосіб організації файлів, методи доступу, способи організації і розміри буферів і блоків, способи індексування і інше. Зазвичай СУБД вирішує ці питання автоматично, за умовчанням, але ці рішення можуть бути змінені за допомогою настройок і спеціальних процедур.