Характеристики реквизита.

Определение данного (реквизита).

Структурные свойства информации.

В ходе создания и развития электронной обработки информации возникла необходимость в структуризации информации, в осознании того, что представляют собой элементарные составляющие информации, по каким законам они обрабатываются, какие проблемы при этом возникают, как обеспечить единообразие в толковании терминов обработки информации. Приведем ряд определений данного (реквизита), как единицы информации.

Реквизит - наименьшая единица данных, имеющая смысл при описании информации, наименьшая единица поименованных данных.

Данное - наименьшая семантическая единица информации.

Данное - элемент некоторого информационного множества.

Синонимы: Реквизит, поле, элемент данных, данное, атрибут, признак, терм.

Реквизит определяет или представляет значения определенных свойств, характеристик объектов, процессов, явлений. В качестве синонима термина “значение” можно использовать термин экземпляр. Например, имеется картотека сотрудников фирмы. Полем в такой картотеке может быть “Фамилия сотрудника”, а значением поля (или экземпляром) будут конкретные фамилии сотрудников фирмы “Петров”, “Сидоров” и т.д.

 

Любой реквизит (поле) как информационный объект имеет ряд характеристик. Рассмотрим их.

1) Наименование поля - название поля, выражающее смысл и содержание поля.

Наименование поля используется при проектировании и эксплуатации информационных систем, общении специалистов в процессе обработки информации.

Примеры:

В базе данных “Сотрудники” содержатся следующие поля:

“Табельный номер”,

“Фамилия, имя, отчество”,

“Дата рождения”,

“Оклад”,

”Код подразделения”,

“Признаки обработки”.

 

 

2) Идентификатор (имя) - это метка поля, используемая в языках программирования, описаниях полей в СУБД, языках запросов и других средствах и образованная в соответствии с правилами языка.

Примеры:

Описание поля в СУБД IMS:

FIELD NAME=FIO,BYTES=25,START=1,TYPE=C

В приведенном описании поля идентификатором является метка “FIO”, размер поля 25 байт, тип поля - символьный и поле начинается с 1-й позиции записи.

Описание поля на языке программирования PASCAL:

FioSt : string[45]; {Фамилия, имя, отчество сотрудника}

В этом описании поля идентификатором является метка “FioSt”, размер поля 45 байт, поле имеет строковый тип (содержит строку символов). Наименование поля приведено в комментарии в фигурных скобках.

 

3) Тип поля - вид значений, которые может принимать это поле. Является одной из важнейших структурных характеристик поля.

Типы поля могут быть:

а) числовое,

б) текстовое,

в) битовое,

г) логическое,

д) образ (изображение, звук).

Кроме перечисленных типов данных могут быть и другие. Например, перечислимый тип, значениями которого являются элементы некоторого множества; ссылочный тип, значениями которого являются указатели, адреса, ссылки на другие данные, и т.д.

3.1.Числовое поле выражает количественные характеристики объектов и явлений. В зависимости от конкретной реализации поля в вычислительной среде форматы представления числовых полей могут быть следующими:

- целое;

- вещественное (с плавающей точкой, с фиксированной запятой);

- десятичное;

- шестнадцатеричное;

- восьмеричное;

- двоичное.

3.2.Текстовый тип поля выражает свойства объектов и явлений в виде текста. Текстовые поля могут быть алфавитными (значения поля содержат только буквы алфавита) и алфавитно-цифровыми (буквы, цифры и другие знаки может содержать значение поля).

Например, текстовое поле “Фамилия” содержит алфавитную информацию, а текстовое поле “Адрес” содержит алфавитно-цифровую.

3.3.Битовый тип поля выражает состояние объектов и явлений по принципу “да/нет” и отображается в ЭВМ некоторым набором бит.

3.4.Логическое поле выражает состояние свершения некоторого события в терминах логики, а именно двух состояний “истина” и “ложь”.

3.5.Тип поля “образ” (изображение, звук) содержит значения, которые позволяют воспроизвести некоторый образ (изображение) с помощью СВТ, например, изображение пиктограмм. Аналогично, в качестве значения можно использовать “звук”, т.е. цифровые значения, преобразуемые в звук. В ряде СУБД, например, “Interbase” появился термин BLOB (binary large object) для такого типа полей. Обычно этот тип поля представлен двоичным числом большой длины от нескольких байт до сотен и тысяч байт.

Тип поля важнейшая характеристика в обработке данных, от которой зависят эксплуатационные параметры информационных систем. При определении типа поля необходимо учитывать возможные последствия выбора того или иного типа и проблемы преобразования типов полей в информационной системе.

 

4) Размер поля - это величина поля, выраженная в количестве знаков, которое может в нем разместиться (длина поля).

Размер поля является важнейшей характеристикой, от которой многое зависит, в том числе:

- объемы хранимой информации;

- эффективность поисковых работ в системе;

- общее время обработки информации;

- и другие показатели информационной системы.

Поэтому, при определении размера поля необходимо стремиться к выбору минимального размера поля для обеспечения эффективности информационной системы.

Размер поля может быть фиксированным, переменным или неопределенным. Фиксированный размер - это когда под поле отводится постоянное количество байт. Поле переменной длины состоит из числового поля, в которое записывается текущая длина поля, и собственно значения поля, которое может занимать любое количество байт в пределах от некоторой минимальной до максимальной величины поля. Переменное поле позволяет экономить память, например, для текстовых полей. Поле неопределенной длины - это поле, которое может занимать любое количество байт в пределах от некоторой минимальной величины до максимальной, а конец поля обозначается (определяется) специальным символом. Например, байт “00” или “FF” в шестнадцатеричном изображении, которым заканчивается поле. Для полей переменной и неопределенной длины обычно указывают минимальную и максимальную границу размера поля и средний размер поля.

 

5) Класс значений - множество значений, которое может принимать поле.

Например, числовое поле номер месяца может принимать значения в диапазоне от 1 до 12; оклады сотрудников учебного заведения находятся в диапазоне от 100 до 1200 рублей и т.д.

 

6) Свойство ограничения - это некоторое внутреннее свойство данных принимать определенные значения в зависимости от других свойств объекта. Например, в организации может быть установлено правило, что заработная плата руководителя всегда должна быть выше заработной платы подчиненных. В зависимости от соотношения подчиненности сотрудников можно определить соотношение величин их заработной платы, причем у начальника она будет больше.

Другими словами, свойство ограничения можно рассматривать как совокупность требований принимать значения в рамках определенных правил.

 

7) Свойство интерпретации - это семантически значимая оценка данных, определенный аспект использования данных. Например, сведения о студентах могут иметь различную интерпретацию. Если рассматривается учебный процесс, то студент оценивается по выполнению учебного плана, в медицинских приложениях студент рассматривается как пациент, а в спортивных приложениях как спортсмен. Свойство интерпретации - это истолкование данного и его значений.

 

8) Структура поля (описание значений поля в зависимости от частей поля).

Пример. Дата рождения, формат ГГГГ.ММ.ДД. Поле может принимать значения, где первые четыре цифры - год, вторые две - месяц, последние две - день месяца. Например, 1976.06.06.

Структура поля может быть задана в виде некоторого шаблона, например, “А(5)Х(3)9(2)”, где на месте, обозначенном буквой А могут быть только буквы алфавита, вместо Х может быть любой символ, а на месте 9 только цифры. Цифры в скобках указывают количество символов указанного типа.

 

9) Используемый алфавит.

Алфавит - множество символов, принятых в рамках некоторого языка.

В информационных системах может быть использовано несколько языков. В России используется, как правило, русский язык. При использовании разных языков в информационной системе могут возникнуть существенные проблемы, например, при отображении информации, при сортировке данных и т.д.

Размер алфавита влияет на информационную емкость системы.

В информационной системе используется понятие допустимого алфавита, когда из всего множества символов алфавита выбирается некоторое подмножество. Например, подмножество прописных букв.

Алфавит может отображаться в ЭВМ различными способами. Разработан ряд стандартов (ДКОИ-8, КОИ-8, КОИ-7, МТК, ASCII, EBCDIC, Unicode и др.) как в России, так и за рубежом на отображение символов в ЭВМ. Для разных устройств вычислительной техники и связи могут применяться разные наборы символов и их кодовые значения. В технических руководствах на устройства указываются применяемые стандарты для кодов. При работе в разнородных вычислительных сетях, распределенных информационных системах может потребоваться преобразование кодов, например, кодов ASCII в коды EBCDIC и обратно, машинных слов одной ЭВМ в машинные слова другого типа ЭВМ.

 

10) Атрибуты поля.

Атрибуты поля - это некоторые свойства (признаки) поля, приписываемые или налагаемые на поле в составе информационной системы.

Например.

Поле - ключевое, т.е. имеющее определенную смысловую нагрузку и выделяемое по этому признаку среди других полей.

Поле - индексируемое, т.е. по этому полю строится индекс базы, сортируется файл и т.п.

Поле - защищаемое, т.е. имеющее некоторые признаки, определяющие полномочия пользователя при работе с этим полем (например, “замок защиты”).

Индикатор существования значения поля и другие атрибуты.

 

Схема (шаблон) поля: принятое в языке или системе описание поля, отражающее его характеристики.