Технологии документирования информационных ресурсов - ODA.

Разнообразие форматов представления слабоструктурированных учрежденческих документов и необходимость обмена документированной информацией как внутри, так и между различными АСУ побудили международные организации по стандартизации предпринять усилия к разработке общей модели документа, которая могла бы учитывать и поддерживать следующие базовые процессы обработки документов:

§ процесс редактирования документов, состоящий в преобразовании структуры и содержания документа;

§ процесс макетирования, т.е. отображение содержания и структуры документа в виде, предназначенном для последующего воспроизведения;

§ процесс воспроизведения документа на бумаге или экране дисплея для его восприятия человеком;

§ процесс обмена документами с использованием каналов связи.

В результате была разработана общая модель документа, которая стала основой нескольких взаимоувязанных международных стандартов и получила наименование office document architecture (ODA) — архитектуры учрежденческих документов (АУД). Документы, представленные в соответствии с требованиями указанных стандартов, доступны для восприятия их человеком и пригодны для передачи по каналам связи и автоматизированной обработки. Общая модель документа может быть представлена в виде иерархической структуры.

В АУД документ представляется в терминах двух структур: логической структуры и макетной структуры.

Логическая структура документа определяет смысловые составные компоненты и их соотношения в понятиях, свойственных естественному взгляду людей на документы как на смысловые структуры. Например, к основным смысловым компонентам относятся:

• авторские данные;

• аннотация;

• оглавление;

• разделы;

• подразделы;

• пункты;

• рисунки;

• сноски;

• приложения.

Компоненты логической структуры могут быть как уникальными, так и повторяющимися (заголовок раздела, пункт, рисунок, подрисуночная подпись).

Макетная структура документа содержит описание содержания документа в терминах физических единиц: страниц, полос, колонок, рамок для рисунков и т.п. Каждый элемент макетной структуры определяет физическую область для размещения соответствующего реквизита документа и правила его отображения в этой области.

АУД поддерживает классы документов, имеющие общий набор характеристик (отчеты, счета-фактуры, служебные письма и т.д.), и С0держит правила их определения. Общие логические и макетные свойства документов, принадлежащих одному классу, определяются в терминах обобщенной логической и обобщенной макетной структур. Эти классы могут применяться при формализации методов генерации документов, формально-логическом контроле и структуризации документов.

В АУД документ состоит из профиля документа и тела документа.

Профиль документа характеризует документ в целом и содержит данные о структуре документа и типах его содержания. Профиль может быть отделен от документа и обработан независимо от него, например, с целью принятия решения о дальнейшей обработке документа.

Тело документа состоит из фактического содержания документа и пяти компонентов, характеризующих модель документа. Этими компонентами являются:

§ обобщенная логическая структура. Характеризует общие аспекты определенного класса документов (например, класс «служебные письма», «докладные записки», «отчеты»);

§ обобщенная макетная структура. Определяет общие аспекты класса документов, связанные с его макетным представлением (например, представление адресной части в письме);

§ специфическая (конкретная) логическая структура. Определяет отношения (связи) между содержанием документа и логическими объектами (например, такими, как подписи, пункты, примечания и т.п.). Определение прикладных логических структур возлагается на пользователя, эти объекты не стандартизуются в АУД. Получатель может модифицировать содержание и структуру документа, т.е. представить документ в своей структуре;

§ специфическая макетная структура. Содержание документа организуется в соответствии с макетными объектами (атрибутами), такими, как страницы, колонки, блоки текста и др.Если эта структура может быть передана для обмена в линию связи, то получатель может отображать документ, но не может обработать его на логическом уровне;

§ стиль документа. Определяет набор атрибутов и состоит из двух аспектов: стиль текста и стиль представления. Макет определяет граничные условия (например, условие, что иллюстрация и соответствующая текстовая ссылка должны размещаться на одной странице). В стиле представления определяются все атрибуты, специфичные для представления конкретного содержания. Например, типы шрифтов для заголовков, примечаний, формул, текстовых пунктов. Изменяя документа, его можно представить в различных макетах и этом сохранить структуру документа. Возможности представления документов в АУД достаточно широкие, но они не охватывают всех требований к полиграфическим изданиям и по этой причине не предназначены для автоматизации издательской деятельности.

Контрольные вопросы:

1. Приведите определение понятия гипертекст и его основных элементов.

2. Охарактеризуйте архитектуру гипертекстовой системы.

3. Поясните смысл технологии разметки документов.

4. Перечислите языки разметки документов и приведите их возможности.

5. Назовите базовые процессы обработки документов

6. Что такое архитектура учрежденческих документов (АУД).

7. Приведите структуру АУД.