Достовірність інформації
Проблеми реляційного підходу
Можна довести, що будь-яку структуру даних можна перетворити в просту двомірну таблицю. Таке уявлення є найбільш зручним і для користувача, і для машини, - переважна більшість сучасних інформаційних систем працюють саме з такими таблицями, тобто з реляційними базами даних.
Основна ідея реляційного підходу полягає в тому, щоб представити довільну структуру даних у вигляді двомірної таблиці, тобто нормалізувати структуру.
Кожен запис в таблиці повинен мати первинний ключ, тобто ідентифікатор (або адреса), значення якого однозначно визначає цю і лише цей запис. Первинний ключ повинен володіти двома властивостями.
Однозначна ідентифікація запису: запис повинен однозначно визначатися значенням ключа.
Відсутність надмірності: ніяке поле не можна видалити з ключа, не порушуючи при цьому властивості однозначної ідентифікації.
Кожне значення первинного ключа в межах таблиці повинне бути унікальним. Інакше неможливо відрізнити один запис від іншої. Вказівка ключа – це єдиний спосіб відрізнити один запис від іншої. Зазвичай використовують придумані розробником унікальні цифрові значення – код, табельні номери і так далі
Окрім первинного, можуть використовуватися так звані прості (або вторинні) ключі таблиці. Простих ключів може бути множина. Вони використовуються при впорядковуванні (індексуванні) таблиць.
Оскільки первинне заповнення таблиць і введення їх в машину веде людина, помилки в даних є не виключенням, а правилом, і будь-яка ІС повинна мати засіб для діагностики і виправлення помилок.
Порушення логічного взаємозв'язку – це логічні (семантичні) помилки, помилки сенсу, які можуть бути виявлені апаратом формального логічного контролю, побудованим для УЇС. Крім того, конкретна УЇС може мати власні засоби додаткового («нестандартного») контролю, оскільки стандартні засоби не можуть охопити всі можливі випадки. У сучасних СУБД є засоби підтримки цілісності даних. Крім того, в сучасних УЇС можна вказати умови, яким повинні задовольняти значення деяких полів (умови верифікації даних).
Цілісність (від англ. integrity – нетронутость, недоторканність, збереження, цілісність) – розуміється як правильність даних у будь-який момент часу. Але ця мета може бути досягнута лише в певних межах: СУБД не може контролювати правильність кожного окремого значення, що вводиться в базу даних (хоча кожне значення можна перевірити на правдоподібність). Наприклад, не можна виявити, що значення, що вводиться, 5 (що представляє номер дня тижня) насправді повинно бути рівне 3. З іншого боку, значення 9 явно буде помилковим і СУБД повинна його відкинути. Проте для цього їй слід повідомити, що номери днів тижня повинні належати набору (1,2,3,4,5,6,7).
Підтримка цілісності бази даних може розглядатися як захист даних від невірних змін або руйнувань (не плутати з незаконними змінами і руйнуваннями, що є проблемою безпеки). Сучасні СУБД мають ряд засобів для забезпечення підтримки цілісності (так само, як і засобів забезпечення підтримки безпеки).
Виділяють три групи правил цілісності:
· Цілісність по суті.
· Цілісність по посиланнях.
· Цілісність, визначувана користувачем.
Набагато складніше справа йде з помилками в допустимих значеннях даних. Такі помилки умовно називаються арифметичними, хоча це не зовсім точно, оскільки помилково може бути записане значення текстового даного: наприклад, Іванов і.П. замість Іванов а.П. Існує ряд засобів для виявлення арифметичних помилок, проте на призначеному для користувача рівні обмежуються простим візуальним контролем.