Лекція 6. Сутність баз даних і джерела їх формування
Система об'єктивного інформаційного забезпечення менеджменту, як і будь-яка інша інформаційна система, включає як складову частину інформаційну базу.
Інформаційна база, яка є сукупністю певним чином організованої, збережуваної та контрольованої інформації, зафіксованої на різних носіях, і що відображає стан і процеси, які відбуваються на об'єкті управління та його зовнішньому середовищі, включає дві частини:
• позамашинну інформаційну базу;
• машинну інформаційну базу.
Позамашинна інформаційна база – це перша (вхідна) частина інформаційної бази системи, яка являє собою сукупність організованої, збережуваної та контрольованої достовірної і точної інформації (вона зафіксована на різних документах-носіях, що безпосередньо сприймаються людиною) і яка відображає стан і процеси, що відбуваються на об'єкті управління та в зовнішньому середовищі, що впливає на цей об'єкт. Така сукупність інформації призначена для формування машинної інформаційної бази.
Машинна інформаційна база – це друга частина інформаційної бази системи, що являє собою сукупність інформаційних масивів, сформованих на основі даних позамашинної інформаційної бази, які зберігаються на машинних (магнітних та ін.) носіях та в пам'яті ЕОМ.
Масив – це ідентифікована сукупність примірників (однорідних записів) логічно пов'язаних між собою даних, які містяться в зовнішній пам'яті (на магнітних та інших носіях чи в пам'яті ЕОМ) і є доступними для програми.
У системі об'єктивного інформаційного забезпечення менеджменту машинна інформаційна база, до складу якої входить повний набір первинних та інших масивів, являє собою інформаційну модель об'єкта управління.
Відомо, що донедавна при організації обробки інформації на ЕОМ застосовувався підхід, за якого на основі інформації однієї і тієї самої предметної області (наприклад, матеріальних ресурсів) формувалися масиви лінійної структури.
Недоліком таких масивів, які мають лінійну структуру, є те, що інформація одного й того самого об'єкта управління розосереджується поміж багатьма різними масивами (нормативними, плановими та ін.), що неминуче призводить до дублювання деяких реквізитів, ускладнення під час спільної їх обробки тощо, а головне – не дає змоги реалізувати принцип незалежності даних від прикладних програм користувача. Лінійні масиви, сформовані традиційним способом, ефективні, як правило, з позиції одного застосування.
Розширення експлуатаційних можливостей обчислювальної техніки, поява пристроїв запам'ятовування з безпосереднім (прямим) доступом створили передумови для розв'язання проблем незалежності, неузгодженості та надмірності даних, а також сприяли створенню нової концепції організації машинної інформаційної бази – концепції інтеграції даних, що дістала назву автоматизованого банку даних.
Автоматизований банк даних (АБД) – це система інформаційних, математичних, програмних, мовних, організаційних і технічних засобів, які необхідні для інтегрованого нагромадження, зберігання, ведення, актуалізації, пошуку і видачі даних користувачам.
Основними перевагами організації автоматизованого банку даних щодо інших є:
· багаторазовість використання даних — одні й ті самі дані можуть використовуватися для розв'язування різних взаємопов'язаних задач;
· скорочення витрат на створення та введення машинної інформаційної бази: організація даних у такий спосіб характеризується нижчою вартістю створення й меншими витратами на внесення змін до бази, оскільки зміни на фізичному рівні не потребують внесення змін до прикладних програм;
· зменшення надмірності даних. Необхідність розв'язування нових задач забезпечується здебільшого за рахунок наявних масивів у базі даних, а не шляхом створення нових масивів. Дублювання даних у базі даних потрібне лише для забезпечення оперативності пошуку даних і організації зв'язку між масивами. Таке дублювання не є надмірним;
· швидкість обробки непередбачених запитів. Для обробки таких запитів найчастіше не вимагається створення нової програми мовами програмування, оскільки ці процедури виконуються за допомогою спеціальних мовних засобів (мови запитів і мови генерації звітів), які входять до складу системи управління базою даних (СУБД);
· простота і зручність внесення змін за рахунок єдиної системи ведення бази даних, яка підтримується засобами СУБД;
· логічна та фізична незалежність даних від прикладних програм.
Іншими словами, автоматизований банк даних є різновидом інформаційної системи, в якому реалізовані функції централізованого зберігання інформації, що обробляється, організованої в одну або декілька баз даних
Автоматизовані бази даних класифікують за різними ознаками.
1. За призначенням АБД бувають:
• банки даних для вирішення задач об'єктів управління різних сфер діяльності;
• банки даних, що спеціалізуються на окремих специфічних видах діяльності;
• інформаційно-пошукові.
2. За архітектурою обчислювального середовища:
• централізовані;
• розподілені;
• змішані.
3. За видом інформації, що зберігається:
• банки даних;
• банки документів;
• банки знань.
4. За мовою спілкування користувача з базами даних:
• з базовою мовою (відкриті системи);
• з власною мовою (закриті системи).
Зазначимо, що закриті системи, які мають власну мову спілкування, не потребують посередника-програміста для спілкування користувача з базою даних, оскільки самі вони (при відповідній підготовці) зможуть працювати з базою даних.
Складовими компонентамиавтоматизованого банку даних є:
• база даних;
• система управління базою даних.
База даних — це відповідним чином пойменована, структурована сукупність взаємопов'язаних даних, що характеризують окрему предметну область і перебувають під управлінням СУБД. При цьому дані зберігаються на машинних (магнітних та ін.) носіях, не залежать від прикладних програм і можуть використовуватися багатьма користувачами. Структура бази даних відповідає інформаційній моделі предметної області за станом на кожний даний момент.
Під предметною областю в даному разі розуміють інформаційний об'єкт з однорідною інформацією, яка моделюється за допомогою бази даних і використовується для розв'язування різних взаємопов'язаних задач, що належать переважно до цього об'єкта. Це сукупність об’єктів чи предметів реального світу, які розглядаються в рамках деякої теорії чи деякого контексту.
Система управління базою даних (СУБД) забезпечує автоматичне виконання основних функцій бази даних і включає комплекс програмних і певних засобів загального та спеціального призначення, які необхідні для створення та управління базою даних, підтримки її в актуальному стані, підтримки цілісності й захисту даних, маніпулювання даними й організації доступу до них різних користувачів чи прикладних програм в умовах чинної технології обробки даних.
В основі організації бази даних є модель логічного рівня, яка підтримується засобами конкретної СУБД і визначає правила, згідно з якими структуруються дані. Це зовнішній рівень моделювання. За допомогою зазначеної моделі подається велика кількість даних і описуються взаємозв'язки між ними.
Найпоширенішими є такі моделі даних: ієрархічна, мережева, реляційна.
Ієрархічна модель даних будується на основі принципу підпорядкованості елементів даних і є деревоподібною структурою, що складається з вузлів (сегментів) і дуг (гілок).
Дерево в ієрархічній структурі впорядковане за чинними правилами розміщення його сегментів і гілок: на верхньому рівні перебуває один сегмент — кореневий (вихідний); сегмент другого рівня — породжений — залежить від першого, вихідного; доступ до кожного породженого (крім кореневого) відбувається через його вихідний сегмент; кожен сегмент може мати по кілька примірників конкретних значень елементів даних, а кожен елемент породженого сегмента пов'язаний з примірником вихідного і створює один логічний запис; примірник породженого сегмента не може існувати самостійно, тобто без кореневого сегмента; при вилученні примірника кореневого сегмента також вилучаються всі підпорядковані і взаємопов'язані з ним примірники породжених сегментів.
Мережева модель даних являє собою орієнтований граф з пойменованими вершинами та дугами. Вершини графа — записи, що є пойменованою сукупністю логічних взаємопов'язаних елементів даних або агрегатів даних. Під агрегатом даних розуміють пойменовану сукупність елементів даних, які є всередині запису. Для кожного типу записів може бути кілька примірників конкретних значень його інформаційних елементів. Два записи, взаємопов'язані дугою, створюють набір даних. Запис, з якого виходить дуга, називається власником набору, а запис, до якого вона спрямована, — елементом набору.
Реляційна модель даних являє собою набір двовимірних пласких таблиць, що складаються з рядків і стовпців. Первинний документ або лінійний масив являє собою пласку двовимірну таблицю. Така таблиця називається відношенням, кожен стовпець — атрибутом, сукупність значень одного типу (стовпця) — доменом, а рядка — кортежем. Отже, стовпці таблиці є традиційними елементами даних, а рядки — записами. Таблиці (відношення) мають імена. Імена присвоюються також і стовпцям таблиці. Кожний кортеж (запис) відношення має ключ. Ключі бувають прості та складні. Простий ключ — це ключ, який складається з одного атомарного атрибута, значення якого унікальне (не повторюється). Складний ключ складається з двох і більше атрибутів. Для зв'язків відношень одного з одним у базі даних є зовнішні ключі. Атрибут або комбінація атрибута відношення є зовнішнім ключем, якщо він не є основним (первинним) ключем цього відношення, але є первинним ключем для іншого відношення.
Внутрішній рівень пов'язаний з фізичним розміщенням даних у пам'яті ЕОМ. На цьому рівні формується фізична модель бази даних, яка містить структури зберігання даних у пам'яті ЕОМ і включає опис форматів записів, їхнє логічне чи фізичне впорядкування, розміщення за типами пристроїв, а також характеристики і шляхи доступу до даних. Запит оформляється за певною формою та охоплює назву даних, період часу, за який потрібні дані, а також структуру та зміст відео- або документограм.
Від параметрів фізичної моделі залежать такі характеристики бази даних: обсяг пам'яті та час реакції системи. Фізичні параметри бази даних можна змінювати в процесі її експлуатації (не змінюючи при цьому опису інших рівнів) з метою підвищення ефективності функціонування системи.
Для ведення й підтримки бази даних в актуальному стані призначається адміністратор АБД з такими його основними функціями:
• розробка опису бази даних і початкове її завантаження;
• підтримка цілісності бази даних і організація захисту зберігання даних;
• відновлення бази даних при її пошкодженнях або збоях;
• нагромадження статистики щодо роботи бази даних;
• реорганізація та реструктуризація бази даних згідно зі зміною потреб, що виникли на об'єкті управління, ін.
Якщо використовується персональна ЕОМ, то функції адміністратора виконуються користувачем і частково програмістом, який відповідає за супровід даної системи. При цьому користувач відповідає за завантаження бази даних та її підтримку в актуальному стані, програміст — за функції відновлення бази даних у випадках її зруйнування.
Джерелами формування інформаційних масивів баз даних є:
• дані про внутрішній стан і процеси, що відбуваються на даному об'єкті управління;
• вибіркові дані про зовнішнє середовище, пов'язані з даним об'єктом управління.
Дані про внутрішній стан і процеси, що відбуваються на об'єкті управління, фіксуються переважно в первинних документах. Зміст їх — характеристика виробничо-господарської та іншої діяльності об'єкта.
Дані про зовнішнє середовище, що формуються службою маркетингу і потрібні для організації виробництва на об'єкті управління, вибираються з джерел.
Крім того, в Україні використовуються також ось такі конкретні інформаційні джерела:
• Комерційні телевізійні і радіогазети. За допомогою цих видань за відповідну плату можна автоматично одержати дані про різні фірми, товари тощо із записом їх на магнітний носій ПЕОМ.
• Інформаційні центри з мережами. Ці центри, які створюються при різних об'єктах управління і в регіонах, мають різноманітні комерційні дані, інформацію про законодавчі, розпорядчі та інші нормативні й правові акти. Зазначена інформація надається користувачам з записом її на магнітний носій ПЕОМ.
• Проспекти й буклети, які видають самі фірми, газети, журнали тощо. Вони містять інформацію про фірми, їхній виробничо-торговельний потенціал тощо.
• Торговельно-економічна палата України. Вона має інформацію про всі акредитовані при ній фірми, товари тощо.
• Торговельні, фінансові та інші біржі. В них можна одержати інформацію про товари, що продаються й купуються, стан валютного ринку тощо.
• Решта джерел інформації, що характеризують стан зовнішнього середовища.
Наприклад, Інститут проблем реєстрації інформації (ІПРІ) Національної академії наук України розробив і з успіхом запроваджує на території України Автоматизовану систему масового розповсюдження комп'ютерної інформації (АСМРКІ) каналами телебачення. Практичним упровадженням цієї системи стало створення електронної комп'ютерної газети «ВСЕ-ВСІМ», яка виходить 5 разів на тиждень на каналі Українського телебачення УТ-1. Постачальниками інформації для газети є інформаційні структури Верховної Ради, Адміністрації Президента, Кабінету Міністрів, міністерств і відомств, банків, бірж, інститутів, видавництв, підприємств і організацій, а також закордонні банки даних, що надходять через супутниковий зв'язок системи EUTELSAT. Таке інформаційне обслуговування включає організаційно-розпорядчі та нормативні документи України різних владних і відомчих структур, технологічні, інженерні та економічні відомості з різних питань тощо, поширювані як каналами телебачення, так і з допомогою машинних носіїв для банків даних, що використовують персональні IBM-сумісні комп'ютери.
Крім того, інформаційно-аналітичним центром «ЛІГА» розроблено інформаційно-пошукову систему «Законодавчі та нормативні акти України», яка доповнює щойно згадану систему АСМРКІ і функціонує в Україні для передавання оперативної правової інформації за допомогою модемного зв'язку (мережі RELCOM, BBC) як через телегазету «ВСЕ-ВСІМ» на першому каналі телебачення України, так і через дискети. Юридичні документи подаються до центру відповідними структурами Адміністрації Президента, Кабінету Міністрів, Міністерства юстиції, Головної державної податкової інспекції, Державного митного комітету тощо.
Функціонують також інформаційно-пошукові системи «ПРАВО» при інформаційному центрі Верховної Ради України, «ЮІС» (фірма «Юридичні інформаційні системи») тощо.
Слід згадати також інші джерела інформації, які рекламують фірми й товари, що їх вони виробляють або перепродують. Це довідники типу «Жовті сторінки», газети типу «Бізнес», журнали типу «Кто єсть кто на компьютерном рынке Украины» тощо. В них наводяться також адреси фірм, телефони, інша інформація.
Джерелом інформації, яка характеризує міжнародні комерційні та інші чинники, є ось що:
• проспекти і каталоги, які публікують самі фірми. У них наводяться такі основні дані про фірми: їхній правовий статус і структура (за наявності відділень і філій); виробничий і торговельний профіль, збутові мережі та клієнтура; баланс доходів і витрат, фінансові звіти (про стан кредиторської та дебіторської заборгованостей, обсяги продажу, обсяги акціонерного капіталу і нарахованих дивідендів тощо); реклама про окремі товари чи групи товарів тощо;
• міжнародні та національні технічні і комерційні довідники. У них фіксуються дані про виробничу й комерційну діяльність фірм, їхню структуру тощо з наданням адрес, телефонів, іншої інформації;
• відомості про кредитоспроможність фірм. Ці дані видаються за відповідну плату різними закордонними кредитними та довідковими бюро чи конторами. Наприклад, американська кредитно-довідкова фірма «Dun and Bradstreet, inc», яка має свої філії та кореспондентів у багатьох країнах світу;
• довідники про керівний склад фірм. Наприклад, книга «WHO'S WHO», яка щорічно видається і в якій є дані не лише про фірми, а й про їхніх керівників (прізвище, посада, освіта, успіхи в бізнесі й т. ін.);
• різні комерційні банки даних та інформаційні банки з комп'ютерною мережею комерційної інформації. Наприклад, комерційно-виробнича фірма «Вычислительный центр коллективного пользования» об'єднання Совинцентр (Російська федерація), що входить до міжнародної комп'ютерної мережі комерційної інформації «WTC NETWORK» і має змогу підключатися до 160 центрів міжнародної торгівлі й тисяч фірм, розташованих у понад 90 країнах;
• торговельно-виробничі та економічні палати країн. У цих палатах можна дістати різні дані про акредитовані при них фірми, товари тощо;
• інші джерела інформації про комерційні та інші аспекти.
Особливу інформаційну насиченість несе міжнародна глобальна комп 'ютерна мережа Internet, яка широко розповсюджується в Україні. Значна частина зазначених та інших джерел інформації розміщується в мережі Internet.
Питання для самоконтролю:
- Що називається інформаційною базою?
- Які існують види інформаційної бази? Охарактеризувати кожен з них.
- Що називають масивом?
- Вказати характеристики лінійних масивів організації обробки інформації.
- Що називається автоматизованим банком даних?
- Які ви знаєте основні переваги організації автоматизованого банку даних?
- За якими ознаками класифікують автоматизовані банки даних (АБД)?
- Які види АБД відносять до кожної з ознак?
- Які складові має АБД?
- Що називається базою даних?
- Що називається предметною областю?
- Що називається системою управління базами даних (СУБД)?
- Які моделі даних лежать в основі організації БД?
- Охарактеризувати ієрархічну модель представлення даних.
- Охарактеризувати мережеву модель представлення даних.
- Охарактеризувати реляційну модель представлення даних.
- Який вузол (сегмент) називається кореневим, породженим в ієрархічній моделі даних?
- Що називається записом в мережевій моделі даних?
- Що називається агрегатом даних в мережевій моделі даних?
- Що називається набором даних в мережевій моделі даних?
- Що називається власником набору та елементом набору в мережевій моделі даних?
- Що називається відношенням, атрибутом та кортежем в реляційній моделі даних?
- Як називаються елементи реляційної таблиці?
- Для чого використовуються ключі в реляційній БД? Які існують види ключів?
- Які функції виконує адміністратор БД?
- Як відбувається розподіл функцій адміністратора БД, якщо робота з нею здійснюється на ПК?
- Які ви знаєте види джерел формування інформаційних масивів баз даних? Охарактеризувати їх.
- Які інформаційні джерела використовуються в Україні?
- Які ви знаєте джерела інформації, що характеризує міжнародні комерційні та інші чинники?