Модели данных
СУБД
Фактографические ИС
Информационно-поисковые языки
qНедостатки естественного языка (с точки зрения машинной технологии):
· Многообразие средств передачи смысла;
· Семантическая неоднозначность;
· Синонимия;
· Многозначность (полисемия – команда, омонимия - лук);
· Эллипсность (пропуски подразумеваемых слов).
Информационно-поисковым языком (ИПЯ) называется специализированный искусственный язык, предназначенный для описания основного смысла содержания поступающих в систему сообщений, с целью обеспечения возможности последующего поиска.
qИПЯ создается на базе ЕЯ, однако отличается от него компактностью, наличием четких грамматических правил и отсутствием семантической неоднозначности.
ИПЯ принято разбивать на два основных типа:
· Классификационные языки
· Дескрипторные языки
q
qРазница между данными типами – в процедуре построения предложений.
qС помощью языков первого типа производится классификация сообщений.
Например, частным случаем классификационного ИПЯ является рубрикатор.
qРубрикатор формируется группой экспертов, на основании их знаний о предметной области с учетом информационных потребностей пользователей.
qЛексическими единицами являются названия тематических рубрик.
В целом под рубрикатором некоторой предметной области понимается ориентированный граф, состоящий из независимых деревьев.
qЛистья деревьев будем называть рубриками – объектами, инкапсулирующими знания о конкретных фрагментах данной предметной области.
qВсе нелистовые вершины являются классификационными родово-видовыми обобщениями листовых вершин и используются лишь при ведении информационного поиска.
Другой тип языков составляют дескрипторные ИПЯ, в которых ЛЕ заранее не связаны никакими текстуальными отношениями.
qДИПЯ различают с грамматикой и без грамматики. В первом случае имеет смысл порядок формирования синтаксических конструкций:
qИванов владеет автомобилем ---- владеть Иванов автомобиль
lФактографические системы – это системы, которые оперируют фактическими сведениями, представленными в виде специальным образом организованных совокупностей формализованных записей данных.
lОснова ИС, объект ее разработки – база данных.
lБаза данных – это реализованная с помощью компьютера информационная структура (модель), отражающая состояние объектов и их отношения.
lБазой данных называется поименованная структурированная совокупность взаимосвязанных данных, относящихся к конкретной предметной области и находящихся под централизованным управлением.
lСпециальный программный инструментарий, для создания БД, поддержки ее целостности и организации эффективного доступа к содержащейся в ней информации называется системой управления БД (СУБД или DBMS – Data Base Management System).
Общий набор рабочих характеристик БД: l
· Полнота
· Правильная организация
· Актуальность
· Удобство для использования
Жизненный цикл ИС - это период времени, который начинается с момента принятия решения о необходимости создания ИС и заканчивается в момент ее полного изъятия из эксплуатации.
l
lОсновные процессы этого периода: приобретение, поставка, эксплуатация, разработка, сопровождение.
Вспомогательные процессы: документирование, управление конфигурацией, обеспечение качества, верификация, аттестация, совместная оценка, аудит, разрешение проблем.
lОрганизационные процессы: управление, создание инфраструктуры, усовершенствование, обучение.
lИтак, стадии жизненного цикла ИС – это формирование требований, проектирование, реализация, тестирование, ввод в действие, эксплуатация и сопровождение, снятие с эксплуатации.
lВсе данные необходимые для решения практических задач подразделяются на несколько типов, причем понятие тип связывается не только с представлением данных в адресном пространстве, но и со способом их обработки.
Любые данные могут быть отнесены к одному из двух типов:
- основному (простому), форма представления которого определяется архитектурой ЭВМ, или
- сложному, конструируемому пользователем для решения конкретных задач.
Данные простого типа это – символы, числа и т.п. элементы, дальнейшее дробление которых не имеет смысла. Из элементарных данных формируются структуры (сложные типы) данных. Примерами структур данных являются массивы и записи.
Массив – простая совокупность элементов данных одного типа, средство оперирования группой данных одного типа. Отдельный элемент массива задается индексом. Массив может быть одномерным, двумерным и т.д.
lРазновидностями одномерных массивов переменной длины являются структуры типа кольцо, стек, очередь и двухсторонняя очередь.
Запись – совокупность элементов данных разного типа. В простейшем случае запись содержит постоянное количество элементов, которые называют полями.
lСовокупность записей одинаковой структуры называется файлом. (Файлом называют также набор данных во внешней памяти, например, на магнитном диске).
lДля того, чтобы иметь возможность извлекать из файла отдельные записи, каждой записи присваивают уникальное имя или номер, которое служит ее идентификатором и располагается в отдельном поле. Этот идентификатор называют ключом.
Классификация типов данных
Любая модель данных должна содержать 3 компоненты:
l1. Структура данных – описывает точку зрения пользователя на представление данных.
l2. Набор допустимых операций, выполняемых на структуре данных.
l3. Ограничения целостности – механизм поддержания соответствия данных предметной области на основе формально описанных правил.
В процессе исторического развития в СУБД использовалось следующие модели данных:
· lиерархическая,
· lсетевая,
· lреляционная.
lВ последнее время все большее значение приобретает объектно-ориентированный подход к представлению данных.