Характеристики полей.


Особенности функционирования документальных ИС

Для реализации основных функций документальных ИС и работы с их базами данных используются программные средства (пакеты прикладных программ), отличающиеся друг от друга по мощности и гибкости поиска, но реализующие одни и те же функции.

Документальные БД делятся на три главных типа:

· библиографические,

· полнодокументальные

· реферативные.

В свою очередь, эти типы БД могут включать в себя или обращаться к широкому кругу материалов, таких как: журнальные статьи, книги, аудиовизуальные материалы, корреспонденция, заметки, просто записанная информация. В то время как сферы применения информации и её состав широко варьируются, существуют общие для всех документальных БД характеристики, которые позволяют отделить документальные БД от других типов БД.

Большая часть информации в документальных БД состоит из буквенных характеристик. Такие поля, как "автор", "реферат", "ссылка" содержат в основном слова, а не цифры. Даже те поля, которые включают цифры (например, номера страниц) воспринимают цифровую информацию как символьную, а не как цифры, используемые при вычислениях.

Использование текстовой информации отличает такие БД от большинства БД для применения в различных информационных службах. Хотя некоторые вычислительные функции также необходимы в программном обеспечении, созданном для документальных БД, однако мощность информационно-поискового программного обеспечения определяется способностью оперировать строками символов и предлагаемыми специальными поисковыми функциями, работающими с грамматическими структурами.

Документальные БД обычно более объёмны и занимают больше места, чем БД других типов. БД, которые обращаются к определённому текстовому массиву литературы или обеспечивают доступ к полным текстам документов, имеют тенденцию расти из-за того, что новые записи добавляются в массив, а старые продолжают играть важную роль для исследователей.

Анализ особенностей документальных ИС.

Документальные ИС имеют ряд особенностей, которые необходимо учитывать при физической реализации ИС в программных средах.

Записи в документальных БД обычно имеют несколько полей, но текстовая информация, содержащаяся в каждом поле, может иметь различную длину. Например, поле "название" в библиографической БД может включать в себя от всего нескольких до нескольких сотен символов. Аналогично параграфы в полнотекстовой БД могут поддерживать от одного предложения до нескольких сотен слов. Использование программного обеспечения, которое может работать только с полями фиксированной длины, оборачивается в таком случае потерей свободной памяти на жёстком диске, так как при этом определяется и фиксируется максимальная длина поля для работы с информацией большого объёма.

Многие пакеты прикладных программ с фиксированной длиной полей имеют верхнюю границу длины поля (часто – 255 символов, иногда – короче). Этого верхнего ограничения часто недостаточно для вмещения всей информации, которую необходимо ввести в поле.

Длина и содержание каждого поля обычно широко варьируются от записи к записи, а одни и те же поля представлены в каждой из записей. Поля нужны для стандартного библиографического описания и не подвержены сильным изменениям с тех пор, как разработчик БД их ввёл. Такие поля, как "автор", "название" и "год публикации" встречаются почти в каждой записи.