Загальні відомості про проектування БД
База даних – ядро УІС
У інформаційній системі з використанням технології баз даних вирішується завдання інформаційного моделювання якої-небудь наочної області (ПО) або її фрагмента. Основа УЇС, об'єкт її обробки – база даних.
Що таке база даних (БД)? У широкому сенсі слова можна сказати, що БД – це сукупність відомостей про конкретні об'єкти реального миру в якій-небудь наочній області.
Основні риси концепції БД:
· дані відділяються від програм, з'являється спеціальна програмна надбудова для управління даними, звана системою управління базами даних (СУБД); СУБД управляє даною і служить посередником між ними і програмами, вони спрощуються, звільняються від функцій структуризації, зберігання і пошуку даних;
· з'являються стандартизовані дані про фактографічні дані – метадані, керовані СУБД; метадані описують інформаційні параметри і взаємозв'язки фактографічних даних про ПО;
· СУБД спільно з метаданими є стандартизованим інструментальним засобом для моделювання ПО різної природи;
· відбувається централізація (інтеграція) даних, їх багатоаспектне використання для різних застосувань, що скорочує надмірність даних, дозволяє забезпечити вищий рівень достовірності даних і оптимізувати різні процедури ведення і використання БД.
Основними функціями СУБД є:
· управління даними в зовнішній пам'яті;
· управління буферами оперативної пам'яті;
· управління транзакціями;
· журналізація;
· підтримка мов БД.
Процес проектування бази даних виконується поетапно, а етапи в основному відповідають різновидам моделей програмного забезпечення при русі від абстрактніших до конкретнішим з датологической точки зору: концептуальній инфологической моделі і два датологических, логічного рівня і внутрішнього рівня. Побудові цих моделей передує вивчення наочної області.
Таким чином, виділяються наступні чотири етапи проектування:
· обстеження ПО, формування і аналіз вимог;
· инфологическое проектування;
· логічне проектування;
· внутрішнє (фізичне) проектування.
Кожному з етапів відповідають свої принципи, методи, прийоми.
Основний зміст першого етапу: збір відомостей про суть, їх властивості і взаємини в ПО; про процедури, пов'язані з об'єктами ПО; про вимоги по об'ємах інформації в БД, швидкодії, користувачах і тому подібне
Для спеціальних ПО доводиться спілкуватися з фахівцями і експертами, може використовуватися методологія проведення експертних оцінок і обробки їх результатів. Для обстеження і опису ПО існує цілий ряд детально розроблених методик, які пропонують види таблиць, що пропрацювали, для заповнення, запитальники і тому подібне допоміжні засоби. Це полегшує і стандартизує роботу по обстеженню ПО, дозволяє скоротити час вивчення.
На етапі концептуального, инфологического проектування розробляється концептуальна схема БД. Головні проблеми полягають в структуризації інформаційної анархії, отриманої в результаті збору інформації про ПО, у вирішенні питань:
· об'єднання інформації з різних фрагментів ПО;
· виділення об'єктів угрупуванням атрибутів (при цьому семантичні зв'язки розділяються на внутрішні, між атрибутами у складі об'єктів, і зовнішні – між суттю);
· вибору ключів;
· обліку і відображення у складі зв'язків структурних і запитальних зв'язків.
Все це вирішується неоднозначно, але від раціонального вирішення цих питань сильно залежить якість БД. Найчастіше при вирішенні вказаних питань використовується термінологія і прийоми, розроблені в рамках реляційної моделі даних (термінологія відносин, методи нормалізації відносин). Робляться спроби створити в цій сфері автоматизовані системи, подібність САПР.
Існують два підходи до ПО:
· історично перший (як більш простій і швидкий) заснований на інтеграції уявлень про ПО користувачів інформації;
· другою базується на уявленнях про що об'єктивно (незалежно від користувачів) існує ПО, з властивою нею семантикою.
Сучасна точка зору вимагає поєднання обох уявлень. Без урахування другого підходу не буде достатньої гнучкості і здібності до адаптації при коректуванні призначених для користувача потреб.
На першому і другому етапах використовуються такі загальнометодологічні принципи, як прийоми класифікаційного аналізу, принципи системного аналізу, принципи аналізу і синтезу.
При об'єднанні локальних уявлень про фрагменти ПО в єдине концептуальне уявлення використовуються три основні принципи: ідентичності, агрегації, узагальнення.
На третьому етапі, етапі логічного проектування, вибирається логічний тип моделі даних (наприклад з класичних: мережевий, ієрархічний, реляційний) і конкретна СУБД цього типу. Проводиться відображення концептуальної схеми на вибрану модель з урахуванням обмежень конкретною СУБД.
На четвертому етапі, при фізичному проектуванні, вирішуються питання конкретного використання вибраної СУБД для найбільш ефективного виконання запитів. Тут вибирається спосіб організації файлів, методи доступу, способи організації і розміри буферів і блоків, способи індексування і інше. Зазвичай СУБД вирішує ці питання автоматично, за умовчанням, але ці рішення можуть бути змінені за допомогою настройок і спеціальних процедур.