Технологии электронного документооборота.

Трудно представить область человеческой деятельности, которая не связана с созданием и обращением бумажных документов. Поиск нужного письма, копирование деловых документов, их сохранность, обеспечение коллективной работы с бумажными и электронными документами приводят часто к прямым финансовым потерям.

Переход к электронному документообороту радикально повышает производительность труда информационных работников, позволяя сотрудникам, взаимодействующим внутри подразделений предприятия, избежать дублирования функций.

Первые системы электронного документооборота (СЭД) состояли из трех частей: системы управления документами, системы массового ввода бумажных документов, системы автоматизации деловых процессов.

Система управления документами обеспечивает интеграцию с приложениями, хранение данных на разных устройствах, распределенную обработку данных, поиск, индексацию электронных документов, коллективную работу с электронными документами.

Разнообразие электронных документов на предприятии порождают используемые приложения: общего назначения (word, excel, access и др.) и предметные (бухгалтерский учет, расчеты с поставщиками, финансовый анализ и др.). Интеграция с ними осуществляется на уровне операций с файлами, то есть операции приложения - открытие, закрытие, создание, сохранение и другие - замещаются соответствующими операциями системы управления документами. Интеграция выполняется автоматически. Ее достоинство в том, что сохраняются принятые в организации виды документов.

Следующей задачей является обеспечение хранения электронных документов на разных носителях (серверах, оптических дисках, библиотеках - автоматах и т. д.). К тому же надо обеспечить быстрый поиск и доступ к различным устройствам хранения информации, чтобы факторы доступности и стоимости хранения всегда были в оптимальном соотношении в зависимости от важности и актуальности информации. Для этого используют технологии информационных хранилищ HSM и Data Migration - автоматической миграции документов.

Для обеспечения распределенной обработки данных в режиме реального времени (on-line) можно по сети посредством запросов, объединенных в транзакции, получить данные из информационного хранилища. Можно посредством Web-сервера предприятия подсоединиться к интернет и тем самым получить доступ к удаленным данным. Можно в почтовом режиме (off-line) по электронной почте послать запрос в информационное хранилище, задав критерии выбора данных. По этим критериям будет сформирован список документов и переправлен пользователю. Этим способом коммерческая служба может оказывать информационные услуги.

Для организации быстрого поиска документов используется их индексация. Система индексации может быть атрибутивной или полнотекстовой.

При атрибутивной индексации электронному документу присваивается некий набор атрибутов, представленных текстовыми, числовыми или иными полями, по которым выполняются поиск и доступ к искомому документу. Обычно это выглядит как карточка в каталоге библиотеки, на которой записаны имя автора, дата, тип документа, несколько ключевых слов, комментарии. Поиск ведется по одному или нескольким атрибутам (полям), либо по всей совокупности.

При полнотекстовом индексировании все слова, из которых состоит документ, за исключением предлогов и незначительных для поиска слов, заносятся в индекс. Тогда поиск возможен по любому входящему слову или их комбинации. Возможна комбинация методов, что усложняет систему, но упрощает пользователю работу с ней.

Заметим, что поиск в Интернете организован аналогично.

Ряд проблем возникает при коллективной работе с документами. Для предотвращения одновременного редактирования документа двумя или более пользователями приоритет отдается пользователю, первому открывшему документ. Все остальные пользователи работают с документом в режиме “только для чтения“.

Так как многие пользователи могут редактировать и вносить изменения в документ, им выдаются полномочия на редактирование документа, все изменения протоколируются, чтобы дать возможность Администратору отследить этапы прохождения документа через инстанции и его эволюцию.

Каждому сотруднику назначается пароль и право доступа. Права доступа также разделяются. Одни могут выполнять полное редактирование и уничтожение документа, другие - только просматривать. Третьим разрешен доступ к отдельным полям документа.

Если приходится иметь дело с документом не в текстовом формате, а в виде факсимильного изображения (например, фото), то его редактирование невозможно, перевод в текстовый формат не рационален. Тогда как бы накладывается второй, “прозрачный“, слой с комментариями и изменениями. При этом комментарии поддаются редактированию обычным образом.

Для реализации большинства функций управления документами используют EDMS –сервер (Electronic Document Management System). Примером системы управления документами является DOCS OPEN корпорации PC DOCS.

Вторую часть электронного документооборота составляет система массового ввода бумажных документов. Эта система предназначена для массового ввода бумажных документов архива посредством сканера и перевода их в электронный вид посредством выполнения операций выравнивания изображений, чистки, подготовки документа к распознаванию, распознавания, формирования задания.

Для выполнения операции сканирования сканер должен обеспечивать приемлемое разрешение при высокой скорости сканирования и наличии системы автоподачи документов.

В случае перекосов, возникающих при сканировании, применяется операция выравнивания изображения документа.

Многие бумажные документы содержит пятна, шероховатости, линии сгиба и другие дефекты, которые глаз не замечает. Они переходят в электронный образ документа и мешают при электронной обработке. Поэтому выполняется операция чистки изображения. Кроме того, зачастую документы имеют фон, одноцветный или разноцветный (например, на ценных бумагах), который необходимо снять посредством фильтрации и выделения.

В контексте обработки документы делятся на две группы — просто документы и формы. Формы, в отличие от просто документов, содержат массу избыточной, с точки зрения электронной обработки, информации. К ней относятся пиктограммы, графление, подписи и т.д. Также возникают трудности, когда элементы букв пересекаются с элементами форм. В этих случаях выполняют операцию подготовки документа к распознаванию. Элементы форм удаляют так, чтобы не пострадал текст.

Для выполнения операции распознавание разработано большое число систем распознавания, которые можно разделить на два класса: системы оптического распознаванияOCR, которые работают только с полиграфическим текстом, и интеллектуальные системы распознаванияICR, работающие с рукописным текстом. Системы ICR распознают также штрих-коды, специальные метки. Системы распознавания относятся к транзакционным OLTP системам. В последнее время системы массового ввода печатных документов получили название OCR систем.

Для каждого документа, прошедшего систему массового ввода, создается задание. Задания размещаются на сервере баз данных. Они содержат информацию, позволяющую управлять движением документа и выполнением действий над ним.

После того как документ распознан, он поступает в систему управления документами, где проводится его индексация.

Часть операций системы массового ввода реализуется программно, другая — сервером. Для обеспечения перечисленных операций выделяют сервер приложений, сервер сканирования и предварительной обработки изображений, сервер обработки изображений и распознавания (OCR-сервер или ICR-сервер). Число серверов может быть различным, для их координации используются серверы баз данных.

Во многих системах функции управления документами и массового ввода совмещены. Примером такой системы является система Ефрат корпорации Cognitive Technologies.

Третья часть электронного документооборота — автоматизацияделовых процессов (АДП). Она предназначена для моделирования деятельности каждого сотрудника, работающего с электронными документами. Состоит из графического редактора, модуля преобразования карт деловых процессов в конкретное АДП – приложение, модуля управления деловыми процессами.

Введем ряд определений. Для описания деятельности сотрудников предприятия используются методы моделирования, способные учесть большинство ситуаций, которые могут возникнуть в реальной жизни. Моделирование означает метод исследования процессов и явлений на их моделях. Для описания сложных деловых процессов (бизнес - процессов) разрабатывают модель бизнеса. Модель бизнеса дает образ основных хозяйственных процессов (бизнес-процессов) предприятия, рассматриваемых в их взаимодействии с информационной средой. Бизнес – процесс определяет деловые операции и информационные потоки в процессе обработки электронного документа одним сотрудником.

Бизнес - процессы не имеют жесткой структуры и меняются по самым разным причинам - внешним и внутренним. Внутренние причины обусловлены желанием оптимизировать деловые процессы с целью высвобождения ресурсов и экономии средств. Внешние - определяются рынком, законами, конкуренцией и т.д.

Есть разные методы описания бизнес - процессов. Наиболее используемая - методология направленного графа. Для каждого бизнес-процесса разрабатывается модель, аналогичная гипертекстовой модели. В вершинах графа (узлах) указываются имена бизнес-прцессов, ребра служат указателями бизнес-процессов из задания. Для обработки моделей разработаны графические редакторы. Графический редактор обрабатывает задания, формирует и размещает карты деловыхпроцессов в базу карт деловых процессов.

Задания содержат их статус, параметры, маршрут движения документа (workflow). Изменение статуса задания означает переход к выполнению следующей операции: задание выбрано на исполнение, ожидает, получено адресатом, прочитано, активно, завершено и другие. Совокупность операций обработки задания оформляется как транзакция к серверу баз данных.

Параметры задают роль сотрудника, его полномочия и права, срок исполнения задания, данные для контроля исполнения задания, применяемые бизнес – процессы (деловые операции и информационные потоки) и т.д.

Маршрут движения содержит набор сведений о документе: перечень сотрудников, участвующих в его обработке, указатели бизнес-процессов (гиперссылки), или последовательный список исполнителей, сроки исполнения документа, штрафные санкции в случае нарушения сроков исполнения, бизнес-операции (действия), выполняемые в ходе делового процесса и т.д.

Модуль преобразования обрабатывает карты деловых процессов и формирует конкретное АДП – приложение. АДП – приложение моделирует деятельность (деловой процесс) одного сотрудника и ориентировано не на конкретного сотрудника, а на роль, которую он исполняет. Это дает возможность динамически переназначать сотрудников на роли, вводить новые, удалять ненужные, что позволяет гибко реагировать на изменения, происходящие на предприятии, управлять заданиями, направляя их определенной ролевой категории сотрудников.

Сформированные АДП - приложения поступают на выполнение. Работает модуль управления деловыми процессами. Он запускает на выполнение АДП – приложения и управляет их работой. АДП - приложение создает рабочее пространство сотрудника и его интерфейс: окно входящих заданий и окно исходящих заданий. Для каждого задания показываются его параметры и статус. АДП приложение обеспечивает сотруднику выполнение его рабочих функций, при этом сотрудник может не знать местонахождение электронного документа, порядка прохождения его по инстанциям, этапов жизненного цикла документа, применяемых бизнес – операций и многого другого. В процессе своей деятельности сотрудник может использовать любые офисные и предметные приложения, работать одновременно с несколькими базами данных, строить или изменять маршрут движения (workflow), редактировать электронные документы, выполнять деловые операции. При этом обеспечивается контроль исполнительской дисциплины и уведомление о штрафных санкциях.

Модуль управления деловыми процессами обеспечил возможность планирования и распределения работ между сотрудниками, отслеживания исполнения бизнес - процессов, назначения штрафных санкций в случае неисполнения работы в указанный срок, планирования производственных совещаний, встреч и других деловых мероприятий. Тем самым он реализует исполнительскую управляющую систему ЭИС на уровне каждого сотрудника предприятия. Он автоматизирует разделение работ между сотрудниками на основании бизнес – процессов, автоматизирует маршрутизацию электронных документов, контролирует исполнение деловых операций сотрудниками, сокращает циркуляцию бумажного потока на предприятии. Тем самым модуль управления деловыми процессами автоматизирует управление работой всей организации.

Так как в основе модуля управления деловыми процессами лежат алгоритмы маршрутизации, он получил название Workflow-системы. Примерами могут служить системы Action Workflow корпорации Action Technologies, StaffWare. Они ориентированы на технологию клиент-сервер. Для связи с сетью интернет разработаны инструменты Staffware Workflow on World Wide Web, Action Workflow Metro и другие.

Эксплуатация систем электронного документооборота, основанных на информационных хранилищах, привела к пониманию, что в документах содержится неструктурированная информация, представляющая до 80% корпоративных знаний. При этом информационные хранилища выполняют преобразование скрытых знаний в явные, то есть выявляют скрытые закономерности, характеризующие процесс управления организацией. Накопление ретроспективных данных (данных за прошлые годы) в информационных хранилищах снижает стоимость их хранения по сравнению с хранением в базах данных. Хранение в информационном хранилище аналитических данных способствует принятию обоснованных решений.

Возможность получения знаний привело к появлению технологий управления знаниями, базирующихся на информационных хранилищах и алгоритмах управления деловыми процессами систем электронного документооборота. Произошла конвергенция двух направлений: обработки информации и знаний. Системы управления знаниями и базами знаний до этого существовали самостоятельно в силу специфического представления и назначения знаний. Появились предпосылки создания технологий интеллектуального анализа данных.

В контексте излагаемого знания - это интеграция идей, опыта, интуиции, мастерства, обладающая потенциалом для повышения ценности предприятия, его персонала, продукции и услуг в глазах потребителей, клиентов и акционеров благодаря принятию информационно – обоснованных решений и эффективному функционированию организации. Информационные хранилища имеют средства хранения знаний (скрытых закономерностей и зависимостей), извлеченных из баз данных. Системы управления деловыми процессами Workflow обеспечивают автоматизацию выполнения бизнес-процессов и управление маршрутами движения документов и работ.

Управление знаниями подразумевает: идентификацию и анализ доступных и необходимых знаний, а также вытекающее из такого анализа планирование и управление действиями по созданию интеллектуального капитала, обеспечивающего достижение целей организации. Речь идет о реализации поговорки “Знание – сила”. Технологический процесс производства интеллектуального капитала заключается в преобразовании существующих в информации знаний в новые по форме и содержанию для использования их в системах поддержки принятия решений.

Некоторая часть таких преобразований может быть исполнена только людьми, другая – программными системами. Для создания технологий интеллектуального анализа данных к функциям электронного документооборота добавляются функции, свойственные именно управлению знаниями.

К традиционным функциям систем электронного документооборота относятся:

  • библиотечные службы (хранение содержимого и атрибутов документов, регистрация изменений, обеспечение поиска, средства безопасности);
  • управление деловыми процессами (разработка маршрутов движения документов, автоматизация выполнения бизнес - процессов, контроль исполнения документов);
  • работа с составными документами (определение структуры, формирование содержания, опубликование);
  • интеграция с внешними приложениями (офисными и предметными приложениями, электронной почтой).

К ним добавляются функции управления знаниями:

  • автоматизация жизненного цикла документов,
  • поддержка принятия решений.

Жизненный цикл представляет собой описание стадий использования документа в ходе делового процесса (история жизни документа) в целях управления этим процессом. Примерами стадий существования документа являются: создание документа, согласование, использование, редактирование, уничтожение, хранение в архиве и др. Для каждой стадии жизненного цикла указываются бизнес – процессы и критерии перехода документа из одной стадии в другую.

 

Заметим, что жизненный цикл документа и маршрут движения (workflow) – принципиально разные, хотя и тесно связанные между собой понятия. Маршрут движения показывает кто, что, в каком порядке делает в процессе движения документа. Например, на стадии жизненного цикла – согласование документа – могут применяться разные маршруты движения. В то же время в ходе исполнения единственного маршрута документ может пройти несколько стадий своего жизненного цикла.

Технологии интеллектуального анализа данных и поддержки принятия решений реализуют модуль управления жизненным циклом документа и модуль поддержки принятия решений.

Модуль управления жизненнымциклом документа содержит объекты и инструментальные средства, используемые для описания всех стадий жизненного цикла документа и управления его “взрослением”, начиная с момента его создания, применения, устаревания до архивного хранения.

Модуль поддержки принятия решений реализует деловые интеллектуальные технологии получения аналитических данных (Business Intelligence Services – BIS), необходимых для принятия обоснованных решений. Они базируются на поиске и извлечении закономерностей и зависимостей данных в базе посредством методов построения деревьев решений, нейронных сетей, статистических методов, искусственного интеллекта, генетических алгоритмов, а также методов отображения полученных знаний. Смысл использования сложного анализа данных сводится к формулировке «получение новой информации из данных». Знания (аналитические данные), извлеченные посредством технологии BIS, хранятся в информационном хранилище. Подробнее о способах хранения аналитических данных изложено в пункте 4.3.

Технологии интеллектуального анализа данных обеспечивают:

  • извлечение и накопление информации из внешних источников (файл-серверов, серверов баз данных, почтовых систем, Web-серверов, принадлежащих различным информационным службам университетов, правительственных органов и даже конкурентов, доступным по Интернету);
  • анализ собранной информации с целью определения ее надежности и соответствия бизнесу на основании собственных внутренних баз данных;
  • формирование и предоставление интеллектуального капитала (аналитических данных) сотрудникам предприятия в нужное время в требуемом формате и в соответствии с их ролями и задачами в контексте бизнеса для принятия решений.

Модуль поддержки принятия решений BIS состоит из графического редактора, системы обеспечения жизненного цикла документов, инструментов извлечения аналитических данных, средств визуального программирования и др.

Для реализации большинства перечисленных функций разработаны специальные серверы, например, EDMS-сервер (Electronic Document Management System).

Использование технологий электронного документооборота и деловых интеллектуальных технологий выбора данных позволили создать приложения по следующим направлениям:

  • маркетинг и сбыт продукции;
  • управление качеством;
  • управление исследованиями;
  • управление финансовыми рисками;
  • управление проектами и командами разработчиков и др.

Во всех перечисленных направлениях работ требуется сбор и анализ «внешней» информации, чтобы определить спрос, конкурентов, поставщиков, ресурсы, заказчиков, состояние исследований и новых разработок у конкурентов и т.д. Этим занимаются специальные службы организации.

В то же время модуль поддержки принятия решений BIS позволяет получить требуемую информацию из внешних источников, сравнить ее с внутренней информацией организации (производственные мощности, финансовые возможности, наличие складов, конкурентная способность продукции и т.д.) и передать аналитическую информацию соответствующим службам для принятия обоснованных решений. Этим и объясняется расширение круга новых задач, решаемых с использованием технологий управления знаниями.

Автоматизация процессов сбора и распространения знаний внутри организаций и между ними позволяет глобальным компаниям значительно повышать конкурентоспособность и быстро извлекать выгоду из возможностей, предоставляемых рынком.