Характеристики реквизита.
Определение данного (реквизита).
Структурные свойства информации.
В ходе создания и развития электронной обработки информации возникла необходимость в структуризации информации, в осознании того, что представляют собой элементарные составляющие информации, по каким законам они обрабатываются, какие проблемы при этом возникают, как обеспечить единообразие в толковании терминов обработки информации. Приведем ряд определений данного (реквизита), как единицы информации.
Реквизит - наименьшая единица данных, имеющая смысл при описании информации, наименьшая единица поименованных данных.
Данное - наименьшая семантическая единица информации.
Данное - элемент некоторого информационного множества.
Синонимы: Реквизит, поле, элемент данных, данное, атрибут, признак, терм.
Реквизит определяет или представляет значения определенных свойств, характеристик объектов, процессов, явлений. В качестве синонима термина “значение” можно использовать термин экземпляр. Например, имеется картотека сотрудников фирмы. Полем в такой картотеке может быть “Фамилия сотрудника”, а значением поля (или экземпляром) будут конкретные фамилии сотрудников фирмы “Петров”, “Сидоров” и т.д.
Любой реквизит (поле) как информационный объект имеет ряд характеристик. Рассмотрим их.
1) Наименование поля - название поля, выражающее смысл и содержание поля.
Наименование поля используется при проектировании и эксплуатации информационных систем, общении специалистов в процессе обработки информации.
Примеры:
В базе данных “Сотрудники” содержатся следующие поля:
“Табельный номер”,
“Фамилия, имя, отчество”,
“Дата рождения”,
“Оклад”,
”Код подразделения”,
“Признаки обработки”.
2) Идентификатор (имя) - это метка поля, используемая в языках программирования, описаниях полей в СУБД, языках запросов и других средствах и образованная в соответствии с правилами языка.
Примеры:
Описание поля в СУБД IMS:
FIELD NAME=FIO,BYTES=25,START=1,TYPE=C
В приведенном описании поля идентификатором является метка “FIO”, размер поля 25 байт, тип поля - символьный и поле начинается с 1-й позиции записи.
Описание поля на языке программирования PASCAL:
FioSt : string[45]; {Фамилия, имя, отчество сотрудника}
В этом описании поля идентификатором является метка “FioSt”, размер поля 45 байт, поле имеет строковый тип (содержит строку символов). Наименование поля приведено в комментарии в фигурных скобках.
3) Тип поля - вид значений, которые может принимать это поле. Является одной из важнейших структурных характеристик поля.
Типы поля могут быть:
а) числовое,
б) текстовое,
в) битовое,
г) логическое,
д) образ (изображение, звук).
Кроме перечисленных типов данных могут быть и другие. Например, перечислимый тип, значениями которого являются элементы некоторого множества; ссылочный тип, значениями которого являются указатели, адреса, ссылки на другие данные, и т.д.
3.1.Числовое поле выражает количественные характеристики объектов и явлений. В зависимости от конкретной реализации поля в вычислительной среде форматы представления числовых полей могут быть следующими:
- целое;
- вещественное (с плавающей точкой, с фиксированной запятой);
- десятичное;
- шестнадцатеричное;
- восьмеричное;
- двоичное.
3.2.Текстовый тип поля выражает свойства объектов и явлений в виде текста. Текстовые поля могут быть алфавитными (значения поля содержат только буквы алфавита) и алфавитно-цифровыми (буквы, цифры и другие знаки может содержать значение поля).
Например, текстовое поле “Фамилия” содержит алфавитную информацию, а текстовое поле “Адрес” содержит алфавитно-цифровую.
3.3.Битовый тип поля выражает состояние объектов и явлений по принципу “да/нет” и отображается в ЭВМ некоторым набором бит.
3.4.Логическое поле выражает состояние свершения некоторого события в терминах логики, а именно двух состояний “истина” и “ложь”.
3.5.Тип поля “образ” (изображение, звук) содержит значения, которые позволяют воспроизвести некоторый образ (изображение) с помощью СВТ, например, изображение пиктограмм. Аналогично, в качестве значения можно использовать “звук”, т.е. цифровые значения, преобразуемые в звук. В ряде СУБД, например, “Interbase” появился термин BLOB (binary large object) для такого типа полей. Обычно этот тип поля представлен двоичным числом большой длины от нескольких байт до сотен и тысяч байт.
Тип поля важнейшая характеристика в обработке данных, от которой зависят эксплуатационные параметры информационных систем. При определении типа поля необходимо учитывать возможные последствия выбора того или иного типа и проблемы преобразования типов полей в информационной системе.
4) Размер поля - это величина поля, выраженная в количестве знаков, которое может в нем разместиться (длина поля).
Размер поля является важнейшей характеристикой, от которой многое зависит, в том числе:
- объемы хранимой информации;
- эффективность поисковых работ в системе;
- общее время обработки информации;
- и другие показатели информационной системы.
Поэтому, при определении размера поля необходимо стремиться к выбору минимального размера поля для обеспечения эффективности информационной системы.
Размер поля может быть фиксированным, переменным или неопределенным. Фиксированный размер - это когда под поле отводится постоянное количество байт. Поле переменной длины состоит из числового поля, в которое записывается текущая длина поля, и собственно значения поля, которое может занимать любое количество байт в пределах от некоторой минимальной до максимальной величины поля. Переменное поле позволяет экономить память, например, для текстовых полей. Поле неопределенной длины - это поле, которое может занимать любое количество байт в пределах от некоторой минимальной величины до максимальной, а конец поля обозначается (определяется) специальным символом. Например, байт “00” или “FF” в шестнадцатеричном изображении, которым заканчивается поле. Для полей переменной и неопределенной длины обычно указывают минимальную и максимальную границу размера поля и средний размер поля.
5) Класс значений - множество значений, которое может принимать поле.
Например, числовое поле номер месяца может принимать значения в диапазоне от 1 до 12; оклады сотрудников учебного заведения находятся в диапазоне от 100 до 1200 рублей и т.д.
6) Свойство ограничения - это некоторое внутреннее свойство данных принимать определенные значения в зависимости от других свойств объекта. Например, в организации может быть установлено правило, что заработная плата руководителя всегда должна быть выше заработной платы подчиненных. В зависимости от соотношения подчиненности сотрудников можно определить соотношение величин их заработной платы, причем у начальника она будет больше.
Другими словами, свойство ограничения можно рассматривать как совокупность требований принимать значения в рамках определенных правил.
7) Свойство интерпретации - это семантически значимая оценка данных, определенный аспект использования данных. Например, сведения о студентах могут иметь различную интерпретацию. Если рассматривается учебный процесс, то студент оценивается по выполнению учебного плана, в медицинских приложениях студент рассматривается как пациент, а в спортивных приложениях как спортсмен. Свойство интерпретации - это истолкование данного и его значений.
8) Структура поля (описание значений поля в зависимости от частей поля).
Пример. Дата рождения, формат ГГГГ.ММ.ДД. Поле может принимать значения, где первые четыре цифры - год, вторые две - месяц, последние две - день месяца. Например, 1976.06.06.
Структура поля может быть задана в виде некоторого шаблона, например, “А(5)Х(3)9(2)”, где на месте, обозначенном буквой А могут быть только буквы алфавита, вместо Х может быть любой символ, а на месте 9 только цифры. Цифры в скобках указывают количество символов указанного типа.
9) Используемый алфавит.
Алфавит - множество символов, принятых в рамках некоторого языка.
В информационных системах может быть использовано несколько языков. В России используется, как правило, русский язык. При использовании разных языков в информационной системе могут возникнуть существенные проблемы, например, при отображении информации, при сортировке данных и т.д.
Размер алфавита влияет на информационную емкость системы.
В информационной системе используется понятие допустимого алфавита, когда из всего множества символов алфавита выбирается некоторое подмножество. Например, подмножество прописных букв.
Алфавит может отображаться в ЭВМ различными способами. Разработан ряд стандартов (ДКОИ-8, КОИ-8, КОИ-7, МТК, ASCII, EBCDIC, Unicode и др.) как в России, так и за рубежом на отображение символов в ЭВМ. Для разных устройств вычислительной техники и связи могут применяться разные наборы символов и их кодовые значения. В технических руководствах на устройства указываются применяемые стандарты для кодов. При работе в разнородных вычислительных сетях, распределенных информационных системах может потребоваться преобразование кодов, например, кодов ASCII в коды EBCDIC и обратно, машинных слов одной ЭВМ в машинные слова другого типа ЭВМ.
10) Атрибуты поля.
Атрибуты поля - это некоторые свойства (признаки) поля, приписываемые или налагаемые на поле в составе информационной системы.
Например.
Поле - ключевое, т.е. имеющее определенную смысловую нагрузку и выделяемое по этому признаку среди других полей.
Поле - индексируемое, т.е. по этому полю строится индекс базы, сортируется файл и т.п.
Поле - защищаемое, т.е. имеющее некоторые признаки, определяющие полномочия пользователя при работе с этим полем (например, “замок защиты”).
Индикатор существования значения поля и другие атрибуты.
Схема (шаблон) поля: принятое в языке или системе описание поля, отражающее его характеристики.