Технологии документирования информационных ресурсов - ODA.
Разнообразие форматов представления слабоструктурированных учрежденческих документов и необходимость обмена документированной информацией как внутри, так и между различными АСУ побудили международные организации по стандартизации предпринять усилия к разработке общей модели документа, которая могла бы учитывать и поддерживать следующие базовые процессы обработки документов:
§ процесс редактирования документов, состоящий в преобразовании структуры и содержания документа;
§ процесс макетирования, т.е. отображение содержания и структуры документа в виде, предназначенном для последующего воспроизведения;
§ процесс воспроизведения документа на бумаге или экране дисплея для его восприятия человеком;
§ процесс обмена документами с использованием каналов связи.
В результате была разработана общая модель документа, которая стала основой нескольких взаимоувязанных международных стандартов и получила наименование office document architecture (ODA) — архитектуры учрежденческих документов (АУД). Документы, представленные в соответствии с требованиями указанных стандартов, доступны для восприятия их человеком и пригодны для передачи по каналам связи и автоматизированной обработки. Общая модель документа может быть представлена в виде иерархической структуры.
В АУД документ представляется в терминах двух структур: логической структуры и макетной структуры.
Логическая структура документа определяет смысловые составные компоненты и их соотношения в понятиях, свойственных естественному взгляду людей на документы как на смысловые структуры. Например, к основным смысловым компонентам относятся:
• авторские данные;
• аннотация;
• оглавление;
• разделы;
• подразделы;
• пункты;
• рисунки;
• сноски;
• приложения.
Компоненты логической структуры могут быть как уникальными, так и повторяющимися (заголовок раздела, пункт, рисунок, подрисуночная подпись).
Макетная структура документа содержит описание содержания документа в терминах физических единиц: страниц, полос, колонок, рамок для рисунков и т.п. Каждый элемент макетной структуры определяет физическую область для размещения соответствующего реквизита документа и правила его отображения в этой области.
АУД поддерживает классы документов, имеющие общий набор характеристик (отчеты, счета-фактуры, служебные письма и т.д.), и С0держит правила их определения. Общие логические и макетные свойства документов, принадлежащих одному классу, определяются в терминах обобщенной логической и обобщенной макетной структур. Эти классы могут применяться при формализации методов генерации документов, формально-логическом контроле и структуризации документов.
В АУД документ состоит из профиля документа и тела документа.
Профиль документа характеризует документ в целом и содержит данные о структуре документа и типах его содержания. Профиль может быть отделен от документа и обработан независимо от него, например, с целью принятия решения о дальнейшей обработке документа.
Тело документа состоит из фактического содержания документа и пяти компонентов, характеризующих модель документа. Этими компонентами являются:
§ обобщенная логическая структура. Характеризует общие аспекты определенного класса документов (например, класс «служебные письма», «докладные записки», «отчеты»);
§ обобщенная макетная структура. Определяет общие аспекты класса документов, связанные с его макетным представлением (например, представление адресной части в письме);
§ специфическая (конкретная) логическая структура. Определяет отношения (связи) между содержанием документа и логическими объектами (например, такими, как подписи, пункты, примечания и т.п.). Определение прикладных логических структур возлагается на пользователя, эти объекты не стандартизуются в АУД. Получатель может модифицировать содержание и структуру документа, т.е. представить документ в своей структуре;
§ специфическая макетная структура. Содержание документа организуется в соответствии с макетными объектами (атрибутами), такими, как страницы, колонки, блоки текста и др.Если эта структура может быть передана для обмена в линию связи, то получатель может отображать документ, но не может обработать его на логическом уровне;
§ стиль документа. Определяет набор атрибутов и состоит из двух аспектов: стиль текста и стиль представления. Макет определяет граничные условия (например, условие, что иллюстрация и соответствующая текстовая ссылка должны размещаться на одной странице). В стиле представления определяются все атрибуты, специфичные для представления конкретного содержания. Например, типы шрифтов для заголовков, примечаний, формул, текстовых пунктов. Изменяя документа, его можно представить в различных макетах и этом сохранить структуру документа. Возможности представления документов в АУД достаточно широкие, но они не охватывают всех требований к полиграфическим изданиям и по этой причине не предназначены для автоматизации издательской деятельности.
Контрольные вопросы:
1. Приведите определение понятия гипертекст и его основных элементов.
2. Охарактеризуйте архитектуру гипертекстовой системы.
3. Поясните смысл технологии разметки документов.
4. Перечислите языки разметки документов и приведите их возможности.
5. Назовите базовые процессы обработки документов
6. Что такое архитектура учрежденческих документов (АУД).
7. Приведите структуру АУД.