Математическое обеспечение комплекса задач “Автоматизированная система документооборота учереждения
Комплексный дипломный проект на тему "Математическое обеспечение комплекса задач “Автоматизированная система документооборота учереждения” содержит следующие разделы:
В первой главе проведен системный анализ и синтез системы и разработана ее архитектура.
Во второй главе рассмотрены аспекты проведенной работы по проектированию комплекса задач “Автоматизированная система документооборота учереждения”.
В третьей главе разрабатываются указания по защите аппаратуры (ЭВМ) от электромагнитного импульса воздушного ядерного взрыва, программное обеспечение прикладной задачи по курсу “Экономика” и обучающей системы по курсу «Охрана труда».
Комплексный дипломный проект содержит 122 страницы, 2 рисунка и 5 таблиц. Список литературы содержит 10 наименований.
СПИСОК СОКРАЩЕНИЙ
АРС
- автоматизированная расчетная система
АС
- автоматизированная система
БД
- база данных
БЗ
- база знаний
ВЗУ
- внешнее запоминающее устройство
ВОС
- взаимодействие открытых систем
ВТ
- вычислительная техника
ВУ
- внешнее устройство
ГВС
- глобальная вычислительная сеть
ГК
- главный конструктор
ГО
- гражданская оборона
ГОСТ
- государственный стандарт
ДП
- дипломный проект
ДДЭА
- делопроизводство, документооборот и электронный архив
ИА
- интеллектуальный анализ
ИО
- информационное обеспечение
ИПС
- информационно-поисковая система
КЗСФ
- коэффициент значимости СФ
КДП
- комплексный дипломный проект
КЗ
- комплексная задача
ККП
- комплексный курсовой проект
КСА
- комплекс средств автоматизации
ЛВС
- локальная вычислительная сеть
ЛО
- лингвистическое обеспечение
М
- модем
МИРЭА
- Московский институт радиотехники, электроники и автоматики
МО
- математическое обеспечение
МОС
- Международная организация по стандартизации
МТО
- материально-техническое обеспечение
ООД
- оборудование обработки данных
ОП
- оперативная память
ОС
- операционная система
СУБД
- система управления БД
СУД
- система управления документами
СФ
- словоформа
ПО
- программное обеспечение
ПП
- программный продукт
ПЭВМ
- персональная ЭВМ
РФ
- Российская Федерация
ЭА
- электронный архив
ЭВМ
- электронная вычислительная машина
ОГЛАВЛЕНИЕ
РЕФЕРАТ
СПИСОК СОКРАЩЕНИЙ
ВВЕДЕНИЕ
ГЛАВА 1. СИСТЕМНЫЙ АНАЛИЗ И СИНТЕЗ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ
1.1. Анализ замысла, целей, направлений и этапов разработки системы
1.1.1. Замысел и цели разработки системы
1.1.2. Направления и этапы разработки системы
1.2. Министерство торговли как объект информатизации
1.2.1. Министерство торговли как потребитель и источник информации
1.2.2. Комплекс прикладных задач "Делопроизводство, документооборот и электронный архив"
1.3. Архитектура разрабатываемой системы
1.4. Организация взаимодействия исполнителей
1.5. Обоснование выбора программных средств
1.5.1. Операционная среда
1.5.2. Инструментальные средства разработки
1.5.3. Оргнизация взаимодействия исполнителей
Выводы по главе 1
ГЛАВА 2. МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КОМПЛЕКСА ЗАДАЧ "СИСТЕМА ДОКУМЕНТООБОРОТА УЧЕРЕЖДЕНИЯ”
2.1. Постановка задачи и её спецификация
2.1.1. Общие требования к системе документооборота
2.1.2. Задачи, решаемые системами документооборота
2.1.3. Проблема поиска документов
2.1.3.1. Организация поиска документов
2.1.4. Проблема индексации документов
2.1.4.1. Индексация по ключевым словам
2.1.4.2. Полнотекстовая индексация
2.1.4.3. Индексация по реквизитам
2.1.4.4. Построение запросов
2.1.5. Методы индексации документов
2.1.6. Архивирование документов
2.1.6.1. Задачи статических архивов
2.1.6.2. Дополнительная функциональность динамических архивов
2.1.6.3. Структура архива данных
2.1.6.4. Устройства хранения
2.2. Обоснование проектных решений
2.2.1. Математическая модель применяемого метода
2.2.3. Блок схема алгоритма
2.3. Программная реализация
2.3.1. Выбор средств программирования
2.3.2. Описание программного продукта
2.3.3. Разработка программной документации
2.3.4. Результаты опытной эксплуатации КЗ “СИСТЕМА ДОКУМЕНТООБОРОТА УЧЕРЕЖДЕНИЯ” и технические предложения по ее развитию
Выводы по главе 2
ГЛАВА 3. МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРИКЛАДНЫХ ЗАДАЧ
3.1. Деловая игра по курсу "Гражданская оборона"
3.1.1. Постановка задачи и ее спецификация
3.1.2. Характеристика воздействия ядерного оружия
3.1.2.1. Механическое воздействие ударной волны
3.1.2.2. Методика оценки воздействия поражающих факторов ядерного взрыва
3.1.3. Выработка рекомендаций по защите
3.2. Автоматизированная система по курсу «Экология и охрана труда»
3.2.1. Постановка задачи и ее спецификации
3.2.1.1. Постановка задачи оценки степени загрязнения атмосферы выбросами из низких источников
3.2.2. Обоснование проектных решений
3.2.2.1. Математическая модель определения степени загрязнения атмосферы
3.2.3. Разработка программной документации
3.2.4. Результаты опытной эксплуатации системы и технические предложения по её развитию
3.3.2. Обоснование проектных решений
3.3.4. Результаты опытной эксплуатации игры и технические предложения по ее развитию
3.3. Автоматизированная система по курсу «Экономика»
3.3.1. Постановка задачи и ее спецификации
3.3.2. Обоснование проектных решений
3.3.2.1. Анализ при постоянной интенсивности наращения
3.3.2.2. Анализ при переменной интенсивности наращения
3.3.3. Разработка программной документации
3.3.4. Результаты опытной эксплуатации системы и технические предложения по её развитию
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ 1. Акт внедрения
ВВЕДЕНИЕ
Целью настоящего дипломного проекта является разработка математического и программного обеспечения модулей поиска и архивации информации в системе документооборота учереждения.
Наиболее интересной в плане разработки в данном дипломном проекте является проблема реализации функции поиска. Проблема существует с момента возникновения первых систем управления документами (СУД). К решению проблемы применяется множество разнообразных подходов, все они подробно рассмотрены в главе 2. Тем не менее хотелось бы коснуться ее основных моментов.
Итак, основным критерием успешности поиска документа является эффективность поиска. Что считать эффективным поиском? Для того чтобы понять это, рассмотрим модели поиска. Здесь существует два подхода. Первый состоит в том, что в процессе поиска вы ищете документ, который точно существует в системе, и ваша задача - свести процесс к его нахождению. Второй подход состоит в том, что вы ищете все документы, которые могут относиться к интересующему вас вопросу. Для этого подхода характерны такие термины, как полнота поиска - соответствие между найденными документами по данному запросу и действительному списку документов; шум при поиске - соотношение (соответствие) соответствующих и несоответствующих запросу документов.
Так в общих чертах выглядит проблема поиска документов. Далее о типах поиска. Существует два основных типа: атрибутивный, когда каждому документу присваивается набор определенных атрибутов (полей). При сохранении документа в архив поля заполняются определенными значениями, в дальнейшем при поиске проверяется совпадение значений этих полей запросу. Второй тип поиска носит название полнотекстовый. В этом случае автоматически обрабатывается все содержание, как правило предварительно проиндексированного, документа, и затем его можно найти по любому входящему в него слову. Оба вышеперечисленных вида поиска реализованы в данном дипломном проекте.
Поиск документа более полный, если в результате запроса будут найдены не только документы, которые точно соответствуют слову в запросе, но и те, в которых присутствуют различные его словоформы. Данная технология носит название нормализации. Причем эффективность поиска зависит от применяемого алгоритма. Для русского языка наиболее эффективен применяемый в данном дипломном проекте словарный метод, когда слово нормализуется на основе словарей, в которых содержатся основы слов.
ГЛАВА 1. СИСТЕМНЫЙ АНАЛИЗ И СИНТЕЗ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ
1.1. Анализ замысла, целей, направлений и этапов разработки системы
1.1.1. Замысел и цели разработки системы
Настоящая глава является частью "Технического предложения", разработанного в соответствии с "Соглашением о намерениях по взаимодействию в области создания Системы внешнеторговой информации между Министерством торговли Российской Федерации и НИИ автоматической аппаратуры им. академика В.С. Семенихина", подписанного Министром торговли и Директором НИИ АА 12 октября 1998 г. Соглашение предусматривало инициативное проведение информационного обследования Минторга России специалистами НИИ АА и разработку "Технического предложения" по информатизации Министерства. В результате выполнения работы необходимо было получить ответы на вопросы:
* существует ли проблема информатизации Министерства торговли РФ;
* если существует, то каким образом ее можно решить.
1.1.2. Направления и этапы разработки системы
Работы проводились в соответствии с государственным стандартом ГОСТ 34.601 - 90 "Автоматизированные системы. Стадии создания", который предусматривает следующую последовательность выполнения работ:
1. Проведение обследования объекта и формирование требований к автоматизированной системе.
2. Разработка концепции автоматизированной системы.
3. Техническое задание.
4. Эскизный проект.
5. Технический проект.
6. Рабочая документация.
7. Ввод в действие.
8. Сопровождение АС.
Задача специалистов НИИ АА, проводивших обследование, состояла в получении и отражении в материалах отчета информации по следующим вопросам организационного построения и деятельности каждого из структурных подразделений министерства (департаментов, управлений и т.д.):
* Организационно-функциональная структура Подразделения; схема информационного взаимодействия между его структурными единицами и отдельными функционерами.
* Система делопроизводства, разработки и хранения документов.
* Функции, задачи и процессы деятельности Подразделения.
* Описание и анализ реализуемых Подразделением основных механизмов государственного управления (регулирования) внешнеторговой и внутриторговой деятельностью.
* Предложения по решению задач на ПЭВМ; краткие постановки таких задач.
* Расширенные постановки нескольких наиболее проработанных и эффективных задач, для реализации их на опытном участке системы.
* Информационные ресурсы Подразделения (как поставленные на ЭВМ, так и ведущиеся вручную): состав и структура баз данных (картотек), используемые словари и классификаторы.
* Услуги, которые Подразделение может предоставить субъектам внешнеэкономической деятельности (российским и др.); возможные коммерческие проекты.
* Использование мировых и российских баз данных (сейчас и в перспективе).
* Подразделения Минторга России, федеральные органы исполнительной власти РФ, международные организации, субъекты внешнеторговой деятельности и т.д., с которыми Подразделение должно взаимодействовать в соответствии с Положением.
* Характеристика каждого направления взаимодействия: регламент, структура документов, информационные потоки и вид взаимодействия (электронная почта, онлайн, офлайн); проблемы, возникающие при взаимодействии.
* Характеристика обрабатываемой, хранящейся и передаваемой информации по уровню конфиденциальности (служебная, открытая).
* Используемые средства связи (телефон, телефакс и т.д.).
* Необходимость доступа сотрудников Подразделения к информационным ресурсам сети Интернет (если можно, конкретизировать к каким именно).
* Информация Подразделения, которую целесообразно разместить на Web-сервере Минторга России в сети Интернет.
* Оснащенность Подразделения средствами вычислительной техники (ВТ), используемые программные продукты.
* Предложения по дооснащению средствами ВТ (ПЭВМ, принтеры и т.д.).
* Характеристика размещения средств ВТ в помещениях Подразделения.
* Оценка степени подготовленности пользователей и актуальности автоматизации.
Следует отметить, что, по тем или иным причинам (как объективным, так и субъективным), не для всех обследованных подразделений удалось получить полную информацию по сформулированным выше вопросам.
Результаты проведенного информационно-технологического обследования, показали, что проблема информатизации Минторга России существует и заключается в несоответствии уровня информатизации министерства уровню, требуемому для его эффективного функционирования в современных условиях.
Можно утверждать, что необходимое повышение эффективности деятельности Минторга невозможно без использования в повседневной практике работы современных информационных технологий, т.е. без информатизации.
Информатизация - это организационный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей органов государственной власти, на основе формирования и использования информационных ресурсов.
Чтобы создать оптимальные условия для удовлетворения информационных потребностей Минторга России, т.е. решить проблему его информатизации, необходимо:
* создать инфраструктуру, поддерживающую формирование и использование информационных ресурсов, на базе современных компьютерных и телекоммуникационных технологий;
* разработать и внедрить на этой инфраструктуре программные средства автоматизации основных видов деятельности;
* наполнить информационные базы данных Министерства и обеспечить оперативный доступ сотрудников к информационным ресурсам Федеральных и региональных органов государственной власти России, общедоступным и коммерческим ресурсам сети "Интернет".
Концепция решения этой проблемы путем создания Автоматизированной информационной системы Министерства торговли Российской Федерации (АИС МТ РФ), разработанная специалистами НИИ автоматической аппаратуры им. академика В.С. Семенихина.
Как при обследовании, так и при разработке концепции исследовались и учитывались все три аспекта информатизации:
* состояние инфраструктуры информатизации;
* состояние автоматизации деятельности сотрудников министерства;
* состояние информационных ресурсов.
В период с 11.03.99 г. по 07.05.99 г. материалы данного КДП были рассмотрены в департаментах и управлениях Центрального аппарата Минторга и в "Объединении "ИнформВЭС". Замечания и предложения, сформулированные в результате этого рассмотрения, были обсуждены на заключительном заседании Рабочей группы по проведению совместных работ по информационно-технологическому обследованию Минторга и полностью учтены разработчиками при подготовке окончательной редакции настоящего документа.
1.2. Министерство торговли как объект информатизации
1.2.1. Министерство торговли как потребитель и источник информации
Министерство торговли РФ является весьма крупным потребителем и источником информации о чем свидетельствуют приводимые ниже потоки входящих и исходящих документов, а также оценки объемов хранимой информации, необходимой в повседневной работе.
Оценка общего количества документов за 1998 год, прошедших через Канцелярию УД Министерства и службы делопроизводства департаментов (управлений):
* входящие - свыше 30000;
* исходящие - свыше 12000.
Объемы информации, необходимой центральному аппарату Министерства в повседневной работе (статистическая и конъюнктурная информация, нормативно-правовые акты, исполняемые и разрабатываемые документы и т.п.) оцениваются следующими величинами:
* текущая (актуальная) информация - 2 - 3 миллиона условных машинописных страниц (что, при переводе в машинные форматы представления, соответствует объемам хранения примерно 200 - 300 гигабайт);
* информационная предыстория за 7 - 10 лет (в основном это статистическая информация прошлых периодов, которую необходимо хранить для получения сравнительных оценок, переписка, разрешительные документы и т.п.) - 10 - 15 миллионов условных машинописных страниц (что, при переводе в машинные форматы представления, соответствует объемам хранения примерно 1 - 1,5 терабайта).
Из-за большого объема документооборота, в Министерстве торговли имеет место отход от технологии делопроизводства, определенной государственными стандартами, инструкциями и наставлениями, в сторону комбинированной вертикально-горизонтальной технологии - правом внешней переписки обладают и начальники департаментов (управлений). Определенный объем переписки имеется также непосредственно между департаментами Министерства (минуя уровень Министра и его заместителей) и между отделами различных департаментов. Фактически система делопроизводства и документооборота Министерства представляет собой распределенную систему делопроизводства, состоящую из множества взаимодействующих между собой участков делопроизводства, причем один из них (Канцелярия Управления делами) играет по отношению к остальным координирующую и контролирующую роль. Каждый из таких участков в зоне своей ответственности использует строго вертикальную технологию движения документов. Движение документов между участками делопроизводства имеет вертикально-горизонтальный характер, определяемый как их относительным положением в организационно-штатной структуре центрального аппарата Министерства, так и рангом их внешних корреспондентов и адресатов.
В настоящее время в центральном аппарате Министерства с помощью средств вычислительной техники обрабатывается лишь ничтожная часть всей этой информации (порядка 1-2 %).
В данных Технических предложениях рассматривается ряд первоочередных, на наш взгляд, задач автоматизированной информационной поддержки деятельности центрального аппарата Министерства и некоторых входящих в его систему учреждений и организаций.
Министерство торговли как субъект аналитической обработки информации
Анализ задач и функций, предписанных Министерству в соответствии с Положением о нем, показывает, что основные направления его деятельности связаны с глубоким анализом огромных объемов статистического, конъюнктурного, нормативно-правового и другого материала в контексте сложных и многомерных экономических, социальных, внутри- и внешнеполитических целей, устанавливаемых Правительством РФ.
В настоящее время в центральном аппарате Министерства не используется каких-либо средств поддержки аналитической обработки информации.
Вместе с тем в арсенале современных информационных технологий имеется ряд методов и средств аналитической обработки как структурированной, так и неструктурированной информации, а также технологий решения сложных многомерных количественно-качественных проблем, для которых характерно отсутствие аналитических зависимостей между определяющими их факторами.
В данных Технических предложениях рассматривается несколько прикладных задач аналитической обработки информации, которые, на наш взгляд, будут полезны в качестве средств поддержки аналитической работы специалистов центрального аппарата Министерства и некоторых входящих в его систему учреждений и организаций.
Основные проблемы, которые необходимо решить для развертывания полномасштабной системы аналитической обработки информации:
* Получение необходимой Министерству информации от федеральных и региональных органов
* Внедрение единой системы классификации и кодирования элементов данных.
* Разработка единой для взаимодействующих министерств и ведомств системы представления информации об объектах учета (уровень агрегирования информации, состав представляемых элементов данных, форматы данных и т.п.).
* Придание электронным документам юридической силы.
* Общесистемные прикладные задачи информатизации Министерства торговли
В рамках предлагаемой системы информатизации Министерства имеется ряд системных и прикладных задач, которые необходимы каждому (или большинству) из рассматриваемых подразделений. К таким задачам относятся:
? Автоматизированная система делопроизводства и документооборота.
? Контроль исполнения поручений.
? Разработка и согласование документов.
? Справочная информация по министерству.
? Справочная информация по органам государственной власти и управления РФ.
? Внутриминистерская электронная почта.
? Внешняя электронная почта.
? Информационные ресурсы Internet.
? База нормативных и правовых документов федерального уровня.
? Система внешнеторговой информации (СВТИ).
Доступ к функциям этих задач должен обеспечиваться с каждого автоматизированного рабочего места (АРМ) будущей системы (разумеется, в пределах прав и полномочий, определяемых статусом и должностными функциями пользователей АРМ).
1.2.2. Комплекс прикладных задач "Делопроизводство, документооборот и электронный архив"
Этот комплекс задач является одним из основных общесистемных прикладных комплексов. Анализ показал, что суммарный поток входящих и исходящих документов на уровне Министерства и его департаментов (управлений) превышает 40000 единиц в год. Существующая система автоматизации делопроизводства охватывает только канцелярию Управления делами, функционально не удовлетворяет потребностям морально и физически устарела.
При таком объеме документооборота можно ожидать, что эффект от реализации единой автоматизированной системы делопроизводства Министерства будет весьма значительным.
Реализация и внедрение данного комплекса задач должно постепенно перевести делопроизводство и документооборот в Министерстве торговли РФ на уровень, соответствующий современному состоянию информационных технологий.
Общие требования к комплексу задач ДДЭА
Комплекс задач "Делопроизводство, документооборот и электронный архив" (ДДЭА) должен обеспечивать соблюдение требований российских стандартов, инструкций и наставлений в области делопроизводства и документооборота. Кроме того, он должен сохранять полезные традиции и технологии делопроизводства, выработанные за долгую предысторию Министерства.
Поскольку в настоящее время действующие стандарты и инструкции определяют лишь бумажную форму документа, то на данном этапе комплекс задач должен выполнять в основном функции сопровождения бумажного документооборота, обеспечивая снижение трудоемкости рутинных операций делопроизводства за счет автоматизации процессов регистрации документов, учета резолюций руководителей на документах, отслеживания движения документов и контроля исполнения резолюций.
Вместе с тем, комплекс задач с момента ввода его в эксплуатацию должен начать выполнять функцию "мостика" для постепенного перехода от бумажных к "электронным" документам, обеспечивая разработку документов на ПЭВМ с помощью современных программных средств, ведение архивов подготовленных электронных документов, поиск документов в таких архивах, ведение внутриминистерской переписки в электронном виде (по крайней мере - частично).
В соответствии с принятой в Министерстве смешанной вертикально-горизонтальной технологией делопроизводства и документооборота (см. Приложение к данным Техническим предложениям "Результаты обследования потребностей Министерства торговли РФ в информатизации"), программные средства комплекса прикладных задач ДДЭА должны обеспечивать формирование в рамках центрального аппарата Министерства совокупности взаимодействующих "локальных" систем (или участков) делопроизводства и документооборота.
Такая совокупность взаимодействующих "локальных" систем делопроизводства и документооборота в рамках единой технологии должна охватывать уровни:
* Министерства
* Департаментов (управлений) или самостоятельных отделов
* Отделов в составе департаментов (управлений)
Для системы делопроизводства и документооборота, соответствующей уровню Канцелярии Управления делами Министерства, должна обеспечиваться возможность выполнения координирующих и контролирующих функций по отношению к остальным участкам делопроизводства. Каждый из формируемых участков делопроизводства в зоне своей ответственности использует строго вертикальную технологию движения документов. Движение документов между участками делопроизводства имеет вертикально-горизонтальный характер, определяемый как их относительным положением в организационно-штатной структуре центрального аппарата Министерства, так и рангом их внешних корреспондентов и адресатов.
В пределах центрального аппарата Министерства взаимодействие между участками делопроизводства должно осуществляться через систему внутренней электронной почты (на начальном этапе информатизации - для подразделений Министерства, расположенных в одном здании). По мере развития уровня информатизации Министерства, обретения электронным документооборотом юридической силы, а также по мере готовности внешних адресатов и корреспондентов, должен обеспечиваться постепенный переход на взаимодействие участков делопроизводства через систему электронной почты и с внешними учреждениями и организациями, а также с территориально-удаленными учреждениями, входящими в систему Министерства (управления уполномоченных Минторга в субъектах Федерации и регионах РФ, торговые представительства РФ за рубежом и др.).
Программные средства комплекса задач должны обеспечивать его адаптацию к изменениям организационно-штатной структуры Министерства и его подразделений.
Программно-аппаратные средства комплекса задач должны обеспечивать функции разграничения доступа и защиты учетно-регистрационных данных делопроизводства и документов, хранимых в электронном виде, в соответствии с действующими в Министерстве инструкциями.
Комплекс задач ДДЭА должен обладать следующими функциональными возможностями, поддерживающими основные задачи и функции делопроизводства:
* Учетной обработки документов
* Доведения документов до должностных лиц
* Рассылки документов
* Контроля исполнения резолюций
* Подготовки отчетных документов делопроизводства
* Архивирования документов и поиска их в архивах
* Ведения и использования разнообразных справочников, классификаторов и шаблонов, необходимых в делопроизводстве
К функциям делопроизводства и документооборота тесно примыкает (хотя и не относится к ним) функция поддержки разработки документов в подразделениях Министерства. Будучи важной составной частью общего процесса документационного обеспечения управления, эта функция также рассматривается в рамках комплекса задач поддержки делопроизводства и документооборота.
Можно предложить классификацию информационных ресурсов министерства по критерию открытости, приведенную на рис. 1.1:
рис. 1.1 Классификация информационных ресурсов министерства
Документы (или их проекты), разрабатываемые в Министерстве в служебном порядке (служебные документы) могут быть:
конфиденциальными (документы, содержащие информацию, доступ к которой ограничивается в соответствии с законодательством Российской Федерации и или по решению лиц, уполномоченных Министром торговли);
открытыми регламентными документами (документы, не отнесенные к категории ограниченного доступа, но для распространения которых требуется разрешение соответствующего должностного лица).
В результате разрешения соответствующего должностного лица регламентные документы министерства могут стать либо общедоступными, либо платными, либо массовыми. Не обязательно получать разрешение на каждый конкретный документ, поскольку на некоторые группы документов в Минторге может быть установлен регламент, позволяющий без обращения к должностному лицу относить документы к той или иной категории открытости. Служебные документы ограниченного распространения должны иметь пометку "Для служебного пользования" или "Коммерческий". Необходимость проставления пометок на документах и изданиях, содержащих служебную информацию ограниченного распространения, определяется исполнителем и должностным лицом, подписывающим, или утверждающим документ.
Доступ к открытым информационным ресурсам законодательством РФ не ограничен. Однако часть из них (открытые платные ИР), в связи с необходимостью поддержания этих ресурсов в актуальном состоянии, затратами, связанными с их хранением и распространением и т.д. предоставляются пользователям за плату.
Современное состояние информатизации Минторга
Центральный аппарат при численности 939 человек, имеет 524 компьютера. Из них 337 компьютеров безнадежно устаревших моделей, требуют списания. 187 компьютеров могут быть использованы (с определенными ограничениями) в дальнейшем. Неплохо оснащены департаменты ВТС и ДФБУ. Компьютеры, как правило, используются автономно. Дополнительно требуется 350 современных компьютеров, объединение всех их в единую локальную вычислительную сеть (ЛВС) и использование в соответствии с системной идеологией.
Управления и представительства уполномоченных в регионах (79 представительств) имеют 217 маломощных устаревших компьютера. Работоспособные компьютеры могут продолжать ограниченно использоваться. Для целей информатизации требуется приобретение 200 современных компьютеров и создание ЛВС в некоторых управлениях.
Госторгинспекции в регионах (80 инспекций) оснащены достаточно неплохо. Имеют 45 устаревших и 121 достаточно современных компьютера. Требуется дооснащение 50 компьютерами.
Торговые представительства в иностранных государствах (86 ТП и АТС) имеют 161 устаревший и 94 современных компьютера. 26 ТП и АТС подключены к международным сетям передачи данных. Требуется дооснащение 100 компьютерами и развертывание ЛВС в ряде ТП.
Примечание. Оценки потребностей в оснащении компьютерами являются экспертными. Они будут уточнены на стадии технического проектирования.
Автоматизации основных видов деятельности. На большинстве компьютеров осуществляется набор и распечатка текстов подготавливаемых документов (интеллектуальная пишущая машинка). В некоторых отделах ведутся отраслевые базы данных, доступные, как правило, незначительному числу сотрудников отдела. Осуществляется анализ достаточно ограниченных объемов статистических данных. Ввод данных часто производится (например, в департаментах внутренней торговли) вручную с бумажных носителей. В департаменте ДФБУ используется бухгалтерская система. В УД используется морально устаревшая система ведения делопроизводства, а в УКГС - кадровая система. В ближайшее время предполагается создание комплекса средств автоматизации для обеспечения выдачи экспортных сертификатов по текстилю за счет финансирования по программе TASIS (ДГРВЭД).
Телекоммуникационные сети и каналы связи для обмена данными между подразделениями Минторга, с органами исполнительной власти и взаимодействующими организациями используются весьма ограниченных масштабах.
Доступ к информационным ресурсам. Внутренние информационные ресурсы Минторга доступны, в основном, сотрудникам отделов, создающих эти ресурсы.
С получением данных из Федеральных исполнительных органов (ГТК, Госкомстат и т.д.) связаны большие трудности, информация, как правило, не удовлетворяет сотрудников министерства ни формой представления, ни составом, ни качеством. Необходимо на правительственном уровне решить проблему получения информации из ГТК, Госкомстата, Минэкономики и ряда других министерств и ведомств. Информация должна поступать своевременно, быть достаточно детальной, точной и полной.
В департаментах внутренней торговли необходимая для анализа информация из регионов добывается часто за счет личных связей с сотрудниками региональных администраций. И это - при наличии в регионах уполномоченных Минторга и госторгинспекций. В процессе обследования у нас сложилось впечатление оторванности департаментов внутренней торговли от всех остальных подразделений министерства.
Многообразные ресурсы "Интернета" сотрудникам министерства практически недоступны. Исключение, видимо, составляют 26 ТП и АТС, подключенных к мировым сетям передачи данных.
1.3. Архитектура разрабатываемой системы
Вначале рассмотрим общие требования к системе электронного документооборота.
Масштабируемость. Желательно, чтобы система документооборота могла поддерживать как пять, так и пять тысяч пользователей, и ее способность наращивать мощность определялась только мощностью аппаратного обеспечения, на котором она установлена. Выполнение этого требования может быть обеспечено с помощью поддержки индустриальных серверов баз данных, производства, например, компаний Sybase, Microsoft, Oracle, Informix, которые существуют практически на всех возможных программно-аппаратных платформах, обеспечивая тем самым максимально широкий спектр производительности.
Распределенность. Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура системы документооборота должна поддерживать взаимодействие распределенных площадок. Причем они могут быть объединены самыми разнообразными по скорости и качеству каналами связи. Также архитектура системы обязана обеспечивать взаимодействие с удаленными пользователями.
Модульность. Вполне возможно, что заказчику может не потребоваться сразу внедрение всех компонентов системы документооборота, а иногда круг решаемых заказчиком задач меньше всего спектра задач документооборота. Поэтому очевидно, что система должна состоять из отдельных модулей, интегрированных между собой.
Открытость. Система документооборота не может и не должна существовать в отрыве от других приложений, к примеру часто необходимо интегрировать систему с прикладной бухгалтерской программой. Следовательно, система документооборота должна иметь открытые интерфейсы для возможной доработки и интеграции.
1.4. Организация взаимодействия исполнителей
На основе разработанной архитектуры системы и требованиями Заказчика на текущем этапе общий объем работ был распределен между исполнителями в соответствии с делением на классы задач, стоявших перед разработчиками. Работа над проектом проводилась разработчиками в составе:
Беляев А.И-М. - разработка общей концепции системы, определение общих соглашений по разрабатываемым составным модулям;
Яковлев Д.В. - разработка подсистемы по обеспечению информационной безопасности;
Игнатов-Радохов Д.В. – разработка подсистемы поиска и ахривации информации;
Взаимодействие между исполнителями по решаемым задачам осуществлялась в соответствии с приведенной на плакате 1 схемой взаимодействия.
1.5. Обоснование выбора программных средств
1.5.1. Операционная среда
Операционные среды: Windows 95 (или Windows NT Workstation 4.0) определена требованиями Заказчика, вытекающими из проектных работ.
1.5.2. Инструментальные средства разработки
В качестве средств разработки специального программного обеспечения была выбрана система Borland C++ Builder 1.0 Client/Server. Выбор обуславливается тем, что с его помощью можно в кратчайшие сроки разработать быстрое, компактное и полноценное Windows-приложение, работающее с базами данных и приложениями электронной почты.
Для разработки программного обеспечения по курсу "Экономика" был выбран Visual Basic for Applications, так как программа должна будет работать под операционными системами Windows 95, в среде электронных таблиц Excel.
Для разработки программного обеспечения по курсу "Экология и охрана труда" был выбран Visual Basic 5.0.
Для разработки программного обеспечения по курсу "Гражданская оборона" был также выбран Visual Basic 5.0., так как программа должна будет работать под операционной системой Windows 95 по требованию кафедры.
1.5.3. Среда реализации
Ниже приведены результаты проведенного комплексного исследования трех наиболее известные продуктов: Notes компании IBM/Lotus, Exchange Server фирмы Microsoft и GroupWise производства Novell. Были рассмотрены все достоинства и недостатки вышеприведенных систем и выбрана система, ставшая средой реализации задач данного дипломного проекта.
Раньше сервер электронной почты представлял собой простое почтовое отделение на базе компьютера. Однако постепенно, с развитием архитектуры клиент/сервер и корпоративных сетей он из обычного автоматизированного "почтового ящика" превратился в разветвленную службу, охватывающую многочисленные сети предприятия, большое количество узлов электронной почты и ежедневно обслуживающую несколько тысяч пользователей. Для создания такой платформы требуются опытные разработчики. Поэтому для тестирования мы выбрали продукты ведущих компьютерных компаний. Каждый пакет не только является мощной почтовой службой, но и обеспечивает много дополнительных возможностей, таких как управление документооборотом и автоматизация деловых процедур.
Все три продукта поддерживают несколько клиентских платформ - Microsoft Windows, Windows 95, Windows NT, Apple Macintosh, а в некоторых конфигурациях - IBM OS/2 и Unix. Для подключения к Internet и другим системам электронной почты в каждом из пакетов предусмотрено шлюзовое ПО. Учитывая, что эти почтовые серверы поддерживают тысячи почтовых ящиков пользователей, а также включают функции администрирования и защиты данных в многодоменных системах с множеством почтовых отделений, становится ясно, почему разработкой продуктов такого класса занимаются только ведущие компании, обладающие для этого необходимыми ресурсами.
Основные особенности продуктов
Начнем с версии Notes 4.0 фирмы Lotus. Система Notes представляет собой операционную среду для создания документов и поддержки рабочих групп, организованную на основе сервера базы данных.
Независимые производители дополняют Notes все новыми и новыми приложениями, расширяющими возможности пакета, что немаловажно для продукта, претендующего на роль сетевой платформы масштаба предприятия. Система Notes давно получила признание благодаря своим средствам электронной почты и поддержки рабочих групп. Однако самой сильной стороной продукта является возможность настройки на конкретные требования заказчика, получившая развитие именно в последней версии Notes.
Как это ни парадоксально, но широкий выбор функций Notes - палка о двух концах. Например, при отсутствии в Notes нужного приложения вам нелегко будет найти опытного специалиста, способного создать программу для этой среды. Но, с другой стороны, если вы уже освоили систему Notes, то ее функции обработки документов, распределения и управления информацией, а также автоматического администрирования откроют перед вами такие возможности, которые нельзя даже сравнивать с имеющимися в любой из существующих стандартных систем электронной почты.
Основной конкурент Notes - продукт Exchange Server компании Microsoft. Это не просто расширение существующего пакета электронной почты MS Mail, а новая система, созданная в результате его коренной переработки. Exchange обладает гораздо более широкими возможностями, чем MS Mail, и включает средства подготовки форм на основе среды программирования Visual Basic (VB) 4 компании Microsoft. Exchange Server поддерживает архитектуру клиент/сервер и совместим с клиентской версией Exchange, поставляемой в составе Windows 95. Если пакет MS Mail ориентирован на рабочие группы, то Exchange Server, позволяющий управлять множеством серверов и доменов, подходит для использования в масштабе предприятия.
Пакет GroupWise компании Novell представляет собой систему передачи почтовых сообщений и календарного планирования, в которой предусмотрена возможность тесной интеграции с другими продуктами Novell. В частности, благодаря объединению GroupWise с пакетами InForms и SoftSolutions можно получить среду для создания и заполнения электронных форм, а также для управления документооборотом. В ближайшем будущем возможности GroupWise еще расширятся. Пакет получит название - GroupWise XTD (см. врезку "XTD - новая версия GroupWise") и будет иметь расширенные функции совместной работы с файлами и управления почтовыми отделениями. При этом пакет XTD совместим не только с существующей версией GroupWise, но и со всеми предыдущими.
Все три продукта - Notes, Exchange и GroupWise - не только включают собственное клиентское ПО, но и совместимы с другими клиентскими приложениями электронной почты. При тестировании главное внимание мы уделяли работе серверной части продуктов. Тем не менее все изделия имеют надежную клиентскую часть, которая обеспечивает возможность обработки списков рассылки, присоединенных файлов и правил управления сообщениями.
Несмотря на то что каждому серверному продукту соответствует собственное клиентское ПО, в реальной жизни сетевым администраторам приходится объединять серверы электронной почты разных производителей, например Notes и Exchange Server. Обычно эта проблема решается с помощью шлюзового ПО, предусмотренного в этих серверах. Связь с коммерческими службами электронной почты, такими как MCI Mail, America Online и CompuServe (а также и с Internet), тоже может быть реализована с помощью шлюзов или средств независимых поставщиков. Подключение к Internet может потребоваться не только для использования электронной почты, но и для доступа к группам новостей и взаимодействия с системой WWW (World Wide Web). Например, продукт InterNotes фирмы Lotus позволяет преобразовывать документы базы данных Notes в формат HTML (HyperText Markup Language), применяемый в WWW.
Расширенные функциональные возможности продуктов
Платформы, предназначенные для работы в масштабе предприятия, обычно устанавливаются на множестве серверов и узлов. Это вызывает огромное количество проблем, которые отсутствуют, когда система электронной почты работает на одном- единственном узле, так как в этом случае не нужно заботиться о защите информации, управлении документами, синхронизации передачи сообщений и тиражировании данных. Особенно важно определить дополнительные меры безопасности для защиты бизнес-приложений, такие как шифрование данных, электронная подпись и управление документами с применением цифровых кодов.
Важнейшей характеристикой серверов является степень их готовности, под которой подразумевается минимизация времени простоя оборудования. Для этого нужно предусмотреть избыточные средства связи между серверами, а также объединить почтовые серверы с системами резервного копирования. Желательно, чтобы операции резервного копирования и восстановления данных не влияли на функционирование системы в целом, однако они должны охватывать всю информацию, относящуюся к серверу, включая данные системы безопасности.
И наконец, несмотря на то что функции настройки и мониторинга редко встречаются в небольших системах электронной почты, они необходимы для более крупных сетевых продуктов. Хотя при выборе системы электронной почты вы, скорее всего, не будете исходить из числа сообщений, передаваемых в минуту, эта информация может пригодиться для определения узких мест и оптимизации производительности сервера после инсталляции.
Сравнение всех функций и возможностей Notes, Exchange Server и GroupWise - непростая задача. И хотя эти продукты во многом схожи, каждый из них обладает огромным количеством уникальных особенностей. Чтобы подобрать подходящую систему, прежде всего определите, какой из предлагаемых наборов функций для вас более важен. Так, для автоматизации деловых процедур база данных Notes подходит больше, чем средства обработки форм, реализованные в Exchange Server.
С другой стороны, если среди ваших разработчиков немало программистов на языке Visual Basic, вам лучше использовать систему подготовки форм Exchange Server, интегрированную с клиентской частью Exchange, входящей в Windows 95, чем средства для работы с формами пакета GroupWise. Но если решающим фактором является возможность интеграции с NDS (службой каталогов NetWare), присмотритесь к GroupWise.
В любом случае не следует выбирать продукт исходя только из одной его функции или производительности. Напротив, необходимо тщательно взвесить все функции и особенности вашей сети. Если вы собираетесь заменить один сервер электронной почты на другой, воспользуйтесь средствами перехода. Одни системы автоматически заменяют клиентские части системы электронной почты при смене серверной, другие же используют службу каталогов, например NDS компании Novell.
Как мы тестировали продукты
Все три пакета поддерживают ряд клиентских платформ, а GroupWise и Notes - и несколько серверных. Инсталлировав Exchange Server компании Microsoft на ПК Zeos Pantera (Pentium/90, ОЗУ на 32 Мбайт) в среде Windows NT Server 3.51, мы проверили, как продукт работает со встроенной системой подготовки форм на базе VB, а также с коммерческой версией VB 4, которая предоставляет полный набор возможностей для разработки программ.
GroupWise мы установили на компьютер ProVeisa фирмы ALR с 24-Мбайт ОЗУ и 66- МГц процессором i486DX2 под управлением NetWare 4.1 компании Novell. Система GroupWise, реализованная в виде загружаемого модуля NetWare (NLM), выполняла управление почтовым отделением, расположенным на этом же сервере.
Пакет Notes мы инсталлировали на ПК Zstation 500 компании Zenith Data Systems (66- МГц процессор i486DX2, ОЗУ емкостью 24 Мбайт) под управлением Windows NT Server 3.51. Использование нескольких компьютеров позволило нам одновременно проверить весь спектр возможностей каждого продукта. Различия в производительности процессоров, конфигурации дисков и объемах оперативной памяти не играют большой роли, поскольку мы исследовали не производительность, а функциональные возможности и особенности продуктов. Скоростные характеристики этих продуктов примерно совпадают, если они работают на одинаковом оборудовании.
Для тестирования возможностей и проверки доступа ко всем трем продуктам использовались рабочие станции под управлением Windows 3.x, Windows for Workgroups, Windows 95 и клиентской версии Windows NT.
Notes фирмы Lotus
По своим возможностям Notes, несомненно, превосходит простой сервер электронной почты для сети предприятия. Этот пакет стал своего рода стандартом, в сравнении с которым определяется качество многих средств для поддержки рабочих групп. Он содержит не только сервер базы данных и сервер управления документацией, но и средства разработки программ и автоматизации деловых процедур, которые являются предметом зависти конкурентов фирмы Lotus, так как им трудно предложить изделия, соперничающие с функциями, предоставляемыми Notes. Если же к этим достоинствам приплюсовать огромное количество приложений независимых разработчиков, а также немалое число платформ (как клиентских, так и серверных), которые поддерживает этот продукт, то он будет выглядеть весьма привлекательно.
Пакет Notes благодаря широким функциональным возможностям и увеличению числа операционных сред, в которых пакет работает наиболее эффективно, медленно, но верно завоевывает признание. Мы рассмотрели только основные возможности Notes, но и они дают представление о мощи этого пакета. Применять Notes лишь в качестве сервера электронной почты нецелесообразно: это все равно что использовать авианосец для запуска бумажных самолетиков. Продукт подходит для крупных компаний, где для работы необходимо использовать несколько серверов Notes. Но один сервер Notes подходит для небольших и средних предприятий, где не более 200 пользователей. Можно даже применять Notes на автономной рабочей станции, однако эта конфигурация обычно служит для работы с мобильными или удаленными пользователями.
Пакет поддерживает архитектуру клиент/сервер, но при этом больше напоминает сервер базы данных, чем просто сервер электронной почты. Клиентская часть состоит из набора папок, обеспечивающих доступ к базам данных, управляемым сервером Notes. В системе Notes записи базы данных называются документами. Документ Notes допускает любое количество полей и присоединенных файлов, которые могут представлять собой документы, созданные другими приложениями. Кроме того, документы Notes могут включать в себя объекты OLE и ссылки на другие документы Notes. Не напоминает ли это вам документы на языке HTML, используемом в гипертекстовой системе World Wide Web? Однако Notes предлагает значительно больше, так как позволяет подключаться к Internet. Но эти возможности мы обсудим ниже.
Notes обладает расширенными средствами программирования, которые позволяют выполнять обработку простых формул и правил, а также поддерживает собственный язык программирования LotusScript, обеспечивающий доступ к другим серверам баз данных с помощью интерфейса ODBC (Open Database Connectivity). Если вы имеете опыт в создании электронных таблиц, приложений Basic и других программ, то вам понравится LotusScript. Если же вас не удовлетворяют возможности LotusScript, обратитесь с помощью интерфейса прикладного программирования Notes к другим инструментальным средствам. Notes обеспечивает поддержку SmartButtons, а также работу с формами и программами-агентами. Последние могут применяться для реагирования на различные события, такие как заранее предусмотренные ситуации или поступление почтовых сообщений.
Поскольку Notes рассматривает сообщение электронной почты в качестве документа, реализуется главное преимущество этого продукта: все его функции в одинаковой степени применимы как для почтовых сообщений, так и для любых других записей базы данных. Например, перемещение документа электронной почты из папки входного почтового ящика в другую папку может выполнять программа-агент, которая проверяет поступление новых документов и начинает их обработку под управлением специализированного приложения Notes. Такой согласованный метод обработки документов позволяет интегрировать электронную почту с приложениями Notes.
Расписания, списки срочных дел и другие приложения рабочих групп также укладываются в схему, которая применяется в Notes для работы с документами. Все эти приложения могут создаваться на основе базы данных документов Notes. Кроме того, клиентская часть Notes поставляется с множеством таких приложений.
На различных платформах клиентская часть Notes поддерживает соответствующий графический интерфейс, который внешне несколько отличается от собственного интерфейса операционной среды. Например, при работе под управлением Windows серверу Notes требуется двойное нажатие на клавишу мыши для перехода на другой документ, хотя для большинства броузеров Web достаточно одного нажатия. Но многие пользователи Notes не обращают внимания на такие мелочи и применяют для работы с Web исключительно этот продукт.
Серверы Notes функционируют на разнообразных платформах - от IBM OS/2 до Novell NLM, серверов Windows NT и Unix. Пакет проверялся на платформе Windows NT. Ранее мы работали с Notes в среде OS/2 и NLM 4.0 для NetWare. Различий между ними оказалось гораздо меньше, чем можно было ожидать.
Интерфейс сервера Notes разделен на две части: одна поддерживает текстовый режим для клиента Notes, другая - графический. Большинство функций управления сервером исполняется через клиентскую часть Notes, которую можно установить на любой станции сети, причем один клиент способен управлять множеством серверов Notes. Для защиты средств управления применяются те же самые средства, что и для сервера базы данных Notes. Преимуществом текстового режима является то, что интерфейс не зависит от операционной платформы Notes и одинаков для NetWare, OS/2, Windows NT и Unix-систем.
Пакет Notes прославился своими возможностями тиражирования и синхронизации баз данных. Например, содержимое папки можно тиражировать во множество серверных или клиентских баз данных, что позволяет мобильным пользователям брать БД Notes с собой в дорогу. Удаленных пользователей Notes, применяющих различные платформы, особенно обрадует версия 4.0, поддерживающая режим транзитной передачи данных, при котором серверы Notes передают запрос друг другу до тех пор, пока он не достигнет нужного узла. При этом удаленный пользователь может не беспокоиться об особенностях сети, к которой он обращается, а кроме того, его изолированность от сети обеспечивает высокую степень защиты данных.
Для каждой базы данных в пакете Notes предусмотрены функции защиты, а также шифрование и поддержка цифрового ключа для каждого поля БД. Так, например, персональная карточка служащего с зашифрованным полем оклада может быть доступна многим пользователям, но только те из них, кто имеет специальное разрешение и нужный ключ, смогут увидеть содержимое этого поля.
Notes поддерживает различные сетевые шлюзы, в том числе и для подключения к Internet. Шлюзовое ПО для доступа к другим почтовым службам работает так же, как аналогичные средства других тестируемых продуктов. При этом поддерживаются такие стандарты, как SMTP (Simple Mail Transfer Protocol) и Х.400, а также факсимильная связь. Для работы с Internet служит дополнительный комплект InterNotes, содержащий модули InterNotes News, Web Navigator и Web Publisher. При подключении сервера Notes к Internet модуль InterNotes News распределяет группы новостей Internet по папкам Notes. Web Navigator обеспечивает доступ к гипертекстовой системе WWW, а Web Publisher позволяет преобразовать документы Notes в формат HTML. Чтобы распространять документы через Internet или сеть intranet, помимо Web Publisher следует использовать и Web-сервер.
Если у нас и есть пожелания к расширению Notes, то они касаются дополнительных средств для измерения производительности системы. Хотя в документации имеются некоторые рекомендации, а по базам данных собираются статистические сведения, процедура оптимизации сервера Notes не рассчитана на среднего пользователя. Для копирования баз данных Notes можно применять обычные программы резервного копирования, но выполнение процедур резервного копирования и восстановления данных должно быть спланировано так, чтобы в это время файлы БД не использовались.
Управление множеством серверов Notes - непростая задача. Обычно эти серверы ориентированы на выполнение определенных функций, таких как поддержка базы данных, электронной почты, удаленного доступа, шлюза и др. Кроме того, в крупных сетях Notes могут присутствовать концентраторы, а также транзитные серверы передачи информации для связи клиентов с несколькими серверами Notes. Концентраторы позволяют объединить серверы друг с другом, давая возможность осуществлять тиражирование данных и обмен документами между этими серверами.
Хотя собрать из различных продуктов систему, выполняющую функции Notes, теоретически возможно, ее внедрение наверняка превратится в кошмар. Notes предоставляет так много хорошо интегрированных друг с другом средств, что было бы трудно оправдать временные затраты на то, чтобы самостоятельно добиться такого уровня интеграции.
Exchange Server компании Microsoft
Exchange Server подвергся такому же тщательному бета-тестированию, что и Windows 95. Поэтому, несмотря на новизну продукта, от него можно ожидать стабильности и надежности, которые так необходимы серверу электронной почты масштаба предприятия. Exchange Server поддерживает только серверную ОС Windows NT Server 3.51 (или более старшую версию), что ограничивает сферу его применения. Но есть у него и существенное преимущество - возможность работы на всех аппаратных платформах, поддерживаемых системой Windows NT, включая микропроцессоры i486 и Pentium фирмы Intel и Alpha корпорации Digital Equipment. Перечень клиентских платформ более широк: в него входят DOS, все версии Windows и Macintosh. Продукт совместим с сетевыми протоколами TCP/IP, NetBEUI и NetWare SPX (Sequenced Packet Exchange).
Exchange Server был разработан компанией Microsoft взамен почтовой системы Mail, основанной на совместном использовании файлов. Новый продукт поддерживает более надежный интерфейс для архитектуры клиент/сервер на базе MAPI, который реализован и в последней клиентской версии Exchange, входящей в базовый комплект Windows 95. Однако вместе с Exchange Server поставляется новая клиентская версия, обеспечивающая доступ ко всем функциям сервера. Фактически любое клиентское ПО, совместимое с МАРI, может применять Exchange Server для работы с такими приложениями, поддерживающими электронную почту, как Excel и Word.
Для удаленного доступа к Exchange Server служит утилита RAS (Remote Access Server) системы Windows NT, используемая для модемной связи и подключения через Internet. Правда, в последнем случае поддерживается только соединение машины- клиента со службами Exchange Server, а Remote Access Server дает возможность удаленной рабочей станции получить доступ к любой службе Windows NT и даже обеспечивает совместное использование дисков и принтеров. Кроме того, Exchange Server поддерживает автономные адресные книги удаленных пользователей, которые содержат подмножества адресов всех пользователей данного сервера.
В адресные книги этого пакета могут входить записи в различных форматах, например в принятых в сетях X.400 или Internet. Для передачи почтовых сообщений по таким адресам Exchange Server использует шлюзы.
Клиентская часть Exchange поддерживает стандарт OLE 2.0 в почтовых сообщениях. Кроме того, имеются специальные объекты OLE для доступа к почтовым службам. Технология OLE Automation позволяет приложениям, написанным на языке VBA (Visual Basic for Applications) и работающим в среде Excel, пересылать диаграммы и графики Excel средствами электронной почты. Это может пригодиться и при составлении расписаний совещаний или встреч.
Общедоступные папки обеспечивают поддержку телеконференций, аналогичных тем, которые применяются во многих коммерческих информационных службах, таких как CompuServe. Хотя папки содержат только сообщения, поддержка присоединенных файлов позволяет хранить в папках документы любого типа. В папках поддерживаются связанные сообщения, что весьма удобно для отслеживания источника общедоступных аннотаций или при обмене частными сообщениями.
Несмотря на то что клиентская часть Exchange не выполняет всех функций броузера Web, она распознает адреса URL (Universal Resource Locator) в почтовых сообщениях и может запустить броузер Web. Это, например, позволяет сначала передать адрес Web-страницы в составе сообщения, а затем с помощью броузера отобразить эту страницу на экране.
Для мобильных пользователей предусмотрен широкий набор средств для загрузки сообщений, включая фильтрацию сообщений по размеру или по адресу отправителя, возможность загрузить только краткое содержание сообщения, а полный текст считать позднее. Кроме того, Exchange Server поддерживает тиражирование и синхронизацию автономных папок, которые хранятся на локальных дисках, в частности на переносном ПК. С помощью процедуры синхронизации можно автоматически обновлять папки и приводить их в соответствие с содержимым папок, записанных на Exchange Server.
Продукт поддерживает более 22 тыс. пользователей, используя для этого несколько серверов, организованных в виде двухуровневой иерархической структуры, когда главный сервер обеспечивает управление связями с серверами нижнего уровня. Управление всеми серверами Exchange Server может осуществляться с одной рабочей станции. За счет интеграции архитектур Exchange Server и сервера Windows NT доменная система защиты системы NT позволяет управлять администрированием серверов. Интеграция Exchange Server и Windows NT распространяется и на другие средства. Регистрация событий, мониторинг и даже контроль производительности объединены с аналогичными программами NT. Особенно важно то, что все сведения об Exchange Server доступны этим средствам NT. Поэтому данные, относящиеся к Exchange Server, отображаются на экране вместе с соответствующей информацией по Windows NT Server, что значительно облегчает контроль за взаимодействием Exchange Server и Windows NT Server.
В состав Exchange Server входит программа моделирования нагрузки, которая служит для оценки производительности определенной конфигурации системы без подключения к серверу большого числа рабочих станций. Эта же утилита может применяться вместе со средствами мониторинга событий и контроля производительности. Функции резервного копирования пакета Exchange Server позволяют осуществлять эту процедуру без отключения системы. Стандартные программы резервного копирования, используемые многими средствами электронной почты предыдущего поколения, требовали отключения почтового сервера. Процедура резервного копирования Exchange Server допускает полное и частичное копирование, а также создание резервных копий только для измененных данных аналогично обычным утилитам этого класса. Кроме того, мы протестировали ряд программ резервного копирования независимых разработчиков, которые могут быть интегрированы в Exchange Server. Необходимо отметить, что многие из них обладают более широкими возможностями, чем утилита, созданная Microsoft: в частности, они позволяют осуществлять дистанционное резервное копирование и предоставляют более совершенные средства планирования этой процедуры.
Защита доступа к данным в Exchange Server обеспечивается стандартными способами, наибольший интерес из которых представляют шифрование и электронная подпись. С помощью Exchange Server можно шифровать сообщения и дополнять их цифровыми подписями. Кроме того, он дает возможность использовать специальные средства управления цифровыми ключами, обеспечивающими распределение по рабочим станциям открытых ключей шифрования и даже отмену ключей, применяемых пользователями.
"Экспертные подсказки" (wizard) значительно упрощают установку Exchange Server. Сложнее оказалось реализовать процедуры перехода с других почтовых систем или добавления почтовых ящиков пользователей, а также конфигурирование этого сервера для совместной работы с другими серверами локальной или глобальной сети. Средства перехода, входящие в базовый комплект Exchange Server, позволяют переносить из других почтовых служб типа MS Mail только списки пользователей, но они не поддерживают перенос сообщений или присоединенных файлов. Вместо полного переноса почтовых ящиков пользователей используется шлюз, который обеспечит связь существующего почтового отделения с сервером Exchange.
Средства планирования и составления расписаний также интегрированы в Exchange Server. Помимо этого, пакет совместим с другим продуктом Microsoft - Schedule+. С помощью почтовых сообщений можно проверять время совещаний, а Schedule+ будет поддерживать ваш план работы в соответствии с этими данными.
В комплект поставки Exchange Server входят средства разработки, управления и распространения форм, предназначенных для работы с автономными приложениями на базе форм или для объединения с сообщениями и папками. Поддержка стандарта MAPI дает возможность продуктам независимых разработчиков взаимодействовать с Exchange Server.
Средство разработки форм пакета Exchange Server, созданное на базе Visual Basic (VB) 4.0, использует графический интерфейс, применяемый в VB. Этот "дизайнер форм" также поддерживает код формы и диалоговые окна с закладками. Опытные программисты могут настраивать это приложение в соответствии со своими требованиями, однако можно строить сложные приложения и с минимальным количеством программных кодов или вообще без ручного программирования. Хотя Exchange Server не имеет собственной базы данных (как, например, Notes), эта система включает мощные средства для работы с папками и для передачи почтовых сообщений.
Средства поддержки множества серверов выполняют обмен сообщениями электронной почты, тиражирование и синхронизацию папок, а также распространение форм. Тиражирование папок обмена можно производить либо после каждого внесения изменений, либо в соответствии с предварительно установленным графиком. В Exchange Server предусмотрены средства разрешения конфликтов при тиражировании, которые следят за внесением изменений на различных серверах. Обычно при возникновении конфликта с какой-либо папкой в нее добавляется сообщение, указывающее тип ошибки. Для передачи этих сообщений в средства регулирования работы с папками можно использовать набор правил.
Exchange Server поддерживает работу с Internet. Сообщения групп новостей считываются из Internet и хранятся в папках, которые, в свою очередь, могут тиражироваться по всему домену Exchange. Пока этот продукт не поддерживает прямого доступа к Web-серверу, однако вскоре Web-сервер компании Microsoft и соответствующие средства поддержки будут интегрированы в Windows NT. Прямой доступ к Exchange Server через Internet особенно удобен для удаленных пользователей, поскольку средства подключения к Internet сейчас широко доступны.
Продукт GroupWise компании Novell
Этот продукт представляет собой оригинальное сочетание электронной почты на базе технологии совместного использования файлов и системы календарного планирования, поддерживающей архитектуру клиент/сервер для обмена почтовыми сообщениями между доменами. В последнюю версию GroupWise - XTD - не только включены все возможности этого продукта, они там значительно расширены, особенно поддержка интерфейсов прикладного программирования. XTD полностью совместима с предыдущими версиями и дополнительно предоставит пользователям электронную почту и функции планирования в среде клиент/сервер.
Хотя пакет GroupWise обеспечивает передачу почтовых сообщений и календарное планирование, он состоит из такого числа отдельных программ, что проверка всех возможностей продукта весьма затруднена. Например, модуль SoftSolutions, который является средством управления документами, использует для работы с Windows- приложениями стандарт ODMA (Open Document Management Architecture). Найти нужный документ можно по ключевым словам. Кроме того, SoftSolutions обеспечивает контроль версий и может использоваться при совместной работе с документами. Как и подсистема передачи сообщений пакета GroupWise, модуль SoftSolutions использует архитектуру клиент/сервер, но эти продукты абсолютно независимы друг от друга.
Модуль InForms поддерживает подготовку форм и автоматизацию деловых процедур, применяется для управления базой данных и может работать как со службой электронной почты пакета GroupWise, так и с другими почтовыми системами, например с Notes фирмы Lotus.
Стандартные средства администрирования пакета GroupWise, как и другие аналогичные изделия Novell, ориентированы только на текстовое представление информации на экране. В GroupWise также входит продукт NetWare Admin Integration Snap-in for GroupWise, который позволяет осуществлять системное администрирование для серверов NetWare 4.x и GroupWise с одной консоли. Благодаря использованию службы каталогов NDS он особенно эффективен в крупных сетях с большим количеством серверов.
Если в сети имеется одно почтовое отделение, клиентские приложения GroupWise пользуются только режимом совместного использования файлов. Если почтовых отделений в сети больше одного, целесообразно представить GroupWise в виде загружаемых модулей NLM. В этом случае применяются серверы четырех типов - сообщений, администрирования, почтового отделения и синхронизации базы данных для сетевых ресурсов.
Сервер сообщений распределяет сообщения по почтовым отделениям и доменам (домен - базовая административная единица, состоящая из почтовых отделений и шлюзов, непосредственно обслуживаемых сервером сообщений). Он применяется в сетях, содержащих множество почтовых отделений, доменов и шлюзов или поддерживающих прямое подключение удаленных почтовых служб. Сервер администрирования получает управляющие сообщения и использует эту информацию для обновления баз данных доменов и почтовых отделений, которые он обслуживает. Сервер почтового отделения распределяет сообщения по почтовым ящикам своих отделений. Клиент почтовой службы может передать сообщение только через собственное почтовое отделение. Сервер синхронизации базы данных для сетевых ресурсов обновляет перечень пользователей GroupWise, когда в БД сетевых ресурсов вносятся изменения.
Шлюзы
Шлюзы - это тоже загружаемые модули NLM, которые взаимодействуют с серверными NLM-модулями GroupWise. Некоторые из шлюзов поддерживают доступ к другим почтовым системам, например к использующим протоколы Х.400 и SMTP, а также к системам на базе совместной работы с файлами, в частности к службе Message Handling Service компании Novell. Адресные книги могут содержать адреса, передаваемые через эти шлюзы. Удаленный доступ через модемную связь тоже обеспечивается с помощью шлюзов.
Так как базы данных GroupWise хранятся как обычные файлы, их резервное копирование выполняют соответствующие приложения NetWare. К сожалению, при восстановлении БД необходимо временно отключить связанные с ней серверы.
Пакет GroupWise, в отличие от Notes и Exchange Server, хотя и обеспечивает передачу почты и составление расписаний, но не поддерживает совместно используемой базы данных и общих папок обмена. Поэтому в продукте GroupWise не применяются службы тиражирования и синхронизации данных. Что касается автоматизации деловых процедур, то соответствующие клиентские средства отличаются более широкими функциональными возможностями, чем серверные.
Клиентская часть GroupWise обеспечивает доступ к электронной почте, составлению планов и расписаний, несмотря на то что возможности клиентских средств по оформлению текста почтовых сообщений весьма ограниченны; поддерживаются такие атрибуты, как выделенные символы и курсив. К сообщению можно присоединять любые файлы и объекты OLE. Кроме того, личные сообщения можно помечать, но система защиты не поддерживает ни шифрования, ни цифровых подписей.
GroupWise обеспечивает доступ к Internet только через шлюзовое ПО в стандарте SNMP (Simple Network Management Protocol). Поэтому единственным средством доступа к группам новостей и системе Web являются продукты независимых производителей.
Хотя GroupWise отстает от Notes и Exchange Server по многим показателям, этот пакет обеспечивает все функции системы электронной почты, поддерживает календарное планирование и управление документами, а также позволяет работать с формами и базами данных на целом ряде платформ, и прежде всего на NetWare.
КОРОТКО О ПРОДУКТЕ
Notes Поставщик: Lotus Development (Кембридж, шт. Массачусетс).
Цена по каталогу: Mail Notes (клиентская версия) - 55 дол.; Desktop (клиентская версия) - 69 дол.; Development Tools Client - 225 дол.; Notes Server - 495 дол.; SMP Server - 2295 дол.
Проверяемый продукт: Notes 4.0. Преимущества: развитые средства программирования, широкие возможности тиражирования баз данных. Имеется много приложений независимых компаний.
Недостатки: продукт сложен, клиентский интерфейс согласован с интерфейсами поддерживаемых платформ, но не совместим с другими платформами. Сложность конфигурирования затрудняет использование продукта для неопытных пользователей и небольших компаний.
Гарантия: 90 дней.
Техническая поддержка: бесплатно в течение 90 дней (с 8.00 до 20.00) с понедельника по пятницу.
Дополнительные продукты: InterNotes, Web Publisher и др.
XTD - новая версия GroupWise
Как обещает Novell, продукт XTD станет достойным преемником сервера GroupWise. Однако мы не смогли включить XTD в число проверяемых почтовых изделий, поскольку он еще не совсем готов. Мы получили только довольно надежную бета- версию продукта, обладающую всеми обещанными возможностями. Хотя, в отличие от GroupWise, сервер XTD полностью поддерживает архитектуру клиент/сервер, он сохраняет полную совместимость с GroupWise, поэтому его почтовые отделения поддерживают почтовое клиентское ПО, в котором применяется метод совместного использования файлов. Но помимо этого, XTD поддерживает и более современное клиентское ПО, основанное на архитектуре клиент/сервер, и применяет стандартные интерфейсы типа XTD или MAPI (Messaging Application Programming Interface) компании Microsoft.
Продукт построен на базе более развитой, чем у GroupWise, кроссплатформной многодоменной архитектуры и позволяет осуществлять администрирование всей системы с одного рабочего места. Среди новых возможностей XTD - тиражирование совместно используемых папок, более широкий набор правил для обработки сообщений, предназначенных как для клиента, так и для сервера. Процедуры автоматизации деловых процедур расширены за счет поддержки API-интерфейсов, которые дают возможность интегрировать в XTD высокопроизводительные приложения.
Благодаря новой функции Gummy Notes можно присоединить примечание к любому элементу, с которым работает XTD, включая сообщения и записи календарного плана, а также преобразовать это примечание в обычное сообщение или другой объект, используемый почтовой системой. Например, примечание, добавленное к расписанию совещаний, можно преобразовать в сообщение и разослать его всем приглашенным с просьбой подтвердить участие во встрече.
Кроме того, Novell постаралась воплотить в XTD технологию универсального почтового ящика, которая позволяет получать сообщения речевой и электронной почты, а также обрабатывать календарные планы через один почтовый ящик. Возможности удаленных пользователей тоже значительно расширены: теперь они могут получить доступ к основному почтовому ящику из любого узла сети.
По своим функциям этот продукт выходит далеко за рамки простого сервера электронной почты. Подобно своему предшественнику GroupWise, пакет XTD поддерживает службы управления документами и папки обмена сообщений, используемые при проведении телеконференций. Специальные приложения и навигационные средства обеспечивают доступ к огромному объему информации, которая может храниться в среде XTD. Несомненно, что, когда этот продукт поступит в продажу, в первую очередь он будет ориентирован на корпоративных покупателей. Однако, только протестировав коммерческую версию XTD, мы сможем узнать, насколько возможности реального продукта соответствуют обещаниям Novell и функциям бета-версии.
КОРОТКО О ПРОДУКТЕ
GroupWise
Поставщик: Novell (Орем, шт. Юта).
Цена по каталогу: GroupWise (клиентская версия) - 99 дол.; GroupWise NLM (серверная версия) - 2999 дол.; GroupWise Gateway - 1995 дол.
Проверяемый продукт: GroupWise 4.1. Преимущества: поддержка многоплатформного сервера, множества шлюзов для связи с другими системами электронной почты. Продукт интегрирован со средствами управления документами (SoftSolutions). Недостатки: отсутствует возможность централизованного управления в масштабах предприятия, средства управления работают только в текстовом экранном режиме, недостаточно высокий уровень автоматизации при работе с формами.
Гарантия: 90 дней.
Техническая поддержка: бесплатно с понедельника по пятницу.
Дополнительные продукты: SoftSolutions, InForms и др.
КОРОТКО О ПРОДУКТЕ
Exchange Поставщик: Microsoft (Редмонд, шт. Вашингтон).
Цена по каталогу: полная версия - 1970 дол.; почтовый сервер - 699 дол.; клиентское ПО - 50 - 70 дол.
Проверяемый продукт: Exchange Server.
Преимущества: предусмотрена поддержка доступа к Internet, а также надежные интегрированные средства для разработки и управления формами. Полная совместимость с архитектурой Windows NT. Имеются иерархические ср
Недостатки: Exchange сложен при переходе с других систем электронной почты или при добавлении новых почтовых ящиков пользователей, а также при конфигурировании для поддержки других серверов глобальной сети. Средства перехода позволяют перенести только перечень пользователей, но не переносят присоединенные файлы и почтовые сообщения.
Гарантия: не объявлена.
Техническая поддержка: бесплатное телефонное обслуживание с 9.00 до 17.00. Дополнительные модули: не объявлены.
Выводы по главе 1
Номинально достаточно обширная компьютерная база министерства незначительно повышает эффективность труда сотрудников министерства по следующим причинам:
большинство компьютеров не пригодно для работы с современными прикладными программами;
компьютеры используются автономно;
попытки создания подсистем (ДФБУ, ДГРВЭД, УКГС) ведутся без ориентации на единую системную идеологию (кусочно-лоскутная автоматизация);
информационные ресурсы министерства незначительны, доступны ограниченному кругу лиц;
современные информационные технологии, телекоммуникационные сети и мировые информационные ресурсы для обеспечения деятельности министерства, практически, не используются.
Проблема информатизации Минторга может быть решена путем создания Автоматизированной Информационной системы Министерства Торговли РФ (АИС МТ РФ) в соответствии с настоящим Техническим предложением.
ГЛАВА 2. МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ КОМПЛЕКСА ЗАДАЧ "СИСТЕМА ДОКУМЕНТООБОРОТА УЧЕРЕЖДЕНИЯ”.
ФУНКЦИИ ПОИСКА И АРХИВАЦИИ
2.1. Постановка задачи и её спецификация
2.1.1. Общие требования к системе документооборота
Вначале рассмотрим общие требования к системе электронного документооборота.
Масштабируемость. Желательно, чтобы система документооборота могла поддерживать как пять, так и пять тысяч пользователей, и ее способность наращивать мощность определялась только мощностью аппаратного обеспечения, на котором она установлена. Выполнение этого требования может быть обеспечено с помощью поддержки индустриальных серверов баз данных, производства, например, компаний Sybase, Microsoft, Oracle, Informix, которые существуют практически на всех возможных программно-аппаратных платформах, обеспечивая тем самым максимально широкий спектр производительности.
Распределенность. Основные проблемы при работе с документами возникают в территориально-распределенных организациях, поэтому архитектура системы документооборота должна поддерживать взаимодействие распределенных площадок. Причем они могут быть объединены самыми разнообразными по скорости и качеству каналами связи. Также архитектура системы обязана обеспечивать взаимодействие с удаленными пользователями.
Модульность. Вполне возможно, что заказчику может не потребоваться сразу внедрение всех компонентов системы документооборота, а иногда круг решаемых заказчиком задач меньше всего спектра задач документооборота. Поэтому очевидно, что система должна состоять из отдельных модулей, интегрированных между собой.
Открытость. Система документооборота не может и не должна существовать в отрыве от других приложений, к примеру часто необходимо интегрировать систему с прикладной бухгалтерской программой. Следовательно, система документооборота должна иметь открытые интерфейсы для возможной доработки и интеграции.
2.1.2. Задачи, решаемые системами документооборота
Рассмотрим общий спектр задач электронного документооборота. Задачи и, соответственно, необходимая система автоматизации определяются стадией жизненного цикла документа, которую необходимо поддерживать. Вообще жизненный цикл состоит из двух основных стадий.
1. Разработка документа, которая может включать собственно разработку содержания документа, оформление документа, утверждение документа.
В том случае если документ находится на стадии разработки, он считается неопубликованным, и права на него определяются правами доступа конкретного пользователя.
2. Стадия опубликованного документа, которая может содержать: активный доступ, архивный документ краткосрочного и долгосрочного хранения, уничтожение документа.
Когда документ переходит на вторую стадию, он считается опубликованным, и на него остается только одно право - доступ на чтение. В качестве примера опубликованного документа приведем шаблон стандартного бланка предприятия. Кроме права доступа на чтение могут существовать права на перевод опубликованного документа в стадию разработки.
В зависимости от конкретной стадии жизненного цикла документа, с которым имеют дело архивные системы, они подразделяются на следующие типы.
Статические архивы документов (либо просто архивы) - системы, которые обрабатывают только опубликованные документы.
Динамические архивы (либо системы управления документами) работают как с опубликованными документами, так и с теми, которые находятся в разработке.
Подробнее задачи статических и динамических архивов будут рассмотрены в пунктах 2.1.6.1 и 2.1.6.2 соотевтственно.
2.1.3. Проблема поиска документов
2.1.3.1. Организация поиска документов
Наряду с организацией хранения документов, их необходимо также быстро и эффективно искать. Со скоростью поиска все относительно понятно - чем быстрее вы найдете необходимые документы, тем лучше. А вот с эффективностью поиска документа ситуация не так проста. Что считать эффективным поиском? Для того чтобы понять это, рассмотрим модели поиска. Здесь существует два подхода. Первый состоит в том, что в процессе поиска вы ищете документ, который точно существует в системе, и ваша задача - свести процесс к его нахождению. Этот метод применяется в 90% всех случаев. Второй подход состоит в том, что вы ищете все документы, которые могут относиться к интересующему вас вопросу. Очевидно, применение данного подхода целесообразно в аналитических и исследовательских задачах. Для него характерны такие термины, как полнота поиска - соответствие между найденными документами по данному запросу и действительному списку документов; шум при поиске - соотношение (соответствие) соответствующих и несоответствующих запросу документов.
Существует два основных типа поиска. Атрибутивный, когда каждому документу присваивается набор определенных атрибутов (полей). При сохранении документа в архив поля заполняются определенными значениями, в дальнейшем при поиске проверяется совпадение значений этих полей запросу. К атрибутам документа можно отнести имя документа, время создания, автора, машинистку, имя подраздаления, тип документа (факс, письмо, контракт, спецификация). Ясно, что cписок таких атрибутов должен быть расширяем. Их совокупность называется карточкой документа. Поля могут заполняться произвольно или из предопределенных справочников. Причем последнее наиболее предпочтительно, так как сужает области поиска.
Второй тип поиска носит название полнотекстовый. В этом случае автоматически обрабатывается все содержание, как правило предварительно проиндексированного, документа, и затем его можно найти по любому входящему в него слову.
Соответственно, существует зависимость между типами поиска и подходами к поиску. Для поиска известного документа более пригоден атрибутивный поиск, тогда как для исследовательского - полнотекстовый. Существует комбинация полнотекстового и атрибутивного поиска, когда атрибуты документа обрабатываются так же, как все содержание документа. Полнотекстовый поиск зависит от формата документа и языка, на котором он создан. Электронный документ любого формата необходимо предварительно преобразовывать в плоский текст для обработки системой полнотекстового поиска, следовательно, любая такая система должна содержать в своем составе конвертеры форматов.
Зависимость от языка выражается в следующих факторах:
Поиск документа более полный, если в результате запроса будут найдены не только документы, которые точно соответствуют слову в запросе, но и те, в которых присутствуют различные его словоформы. Данная технология носит название нормализации. Причем эффективность метода зависит от применяемого алгоритма. Для русского языка наиболее эффективен словарный метод, когда слово нормализуется на основе словарей, в которых содержатся словоформы. Кроме словарного может применяться эвристический метод нормализации, когда слово может быть приведено к нормальному виду путем выполнения определенных правил, описывающих алгоритм нормализации. Если для английского языка свод правил нормализации составляет 300 страниц машинописного текста, то для русского он на несколько порядков больше.
Аналогично нормализации было бы логично выполнять поиск не только по конкретному слову, но и его синонимам.
2.1.4. Проблема индексаци документов
Процессом, аналогичным индексации, в бумажном делопроизводстве является регистрация.
Регистрация является "священной коровой" российского делопроизводства. Историческая неразвитость системы управления в сочетании с большими расстояниями и традиционно низкой ответственностью исполнителей породила своеобразный, скрупулезный подход к регистрации документов на всех уровнях управления.
Хрестоматийным примером может послужить журнал учета входящих документов, уникальный в мировой практике документ, являющийся российским "know-how".
Индексация электронных документов, осуществляемая системами автоматизации делопроизводства, преследует несколько иную цель – получить максимальное количество достоверной информации о формируемом документе и создать его регистрационную карточку. Процесс этот тем более важен, что в дальнейшем система управления документами имеет дело именно с этой карточкой, не затрагивая реальные объекты файловой системы. Далее мы в общих чертах рассмотрим известные методы индексации.
2.1.4.1. Индексация по ключевым словам
Метод индексации по ключевым словам широко использовался на начальном этапе развития СУД. Суть его заключается в выделении совокупности ключевых для работы с данным документом слов, вносимых в индексный файл. Недостатки данного метода очевидны – процесс индексирования требует дорогостоящего экспертного участия, результат индексации субъективен и не гарантирует надежного управления документом. Пользователь, например, при поиске документа вполне может использовать свой набор ключевых слов и, таким образом, не добьется результата.
В настоящее время метод индексации по ключевым словам в чистом виде не применяется.
2.1.4.2. Полнотекстовая индексация
Совершенствование и распространение систем оптического распознавания текста, обсуждавшееся нами в прошлый раз, а также совершенствование алгоритмов, основанных на элементах искусственного интеллекта, вывели на сцену метод автоматической полнотекстовой индексации (Full Text Retrieval). В этом случае весь текст подвергается автоматической обработке, основанной на морфологическом анализе (выделении грамматических классов, морфем и анализе формообразования слов). Обработанный текст заносится в индексный файл и используется при поиске документов.
Таким образом, с минимальными издержками формируется индексная база данных, обеспечивающая пользователям СУД возможности для быстрого и эффективного поиска.
На сегодняшний день та или иная реализация метода полнотекстовой индексации используется практически во всех системах управления документами.
В этой связи хотелось бы рассмотреть "нечеткй поиск". Данное понятие в приложении к системам управления документами связано с продуктом компании Excalibur Technologies – системой Excalibur EFS. В основе системы лежит технология так называемого "адаптивного распознавания образов", позволяющая, с точки зрения разработчиков, обеспечить эффективный поиск в распознанных документах, непрошедших трудоемкий этап выявления и исправления ошибок. Таким образом, декларируется возможность работы с документами, заведомо содержащими ошибки.
Вопрос сравнения эффективности систем, использующих полнотекстовую индексацию и "нечеткий поиск", нетривиальный, требует исследования и здесь не рассматривается. Мы только позволим себе прокомментировать тезисы, с помощью которых принято обосновывать преимущества.
Тезис: "Удельная стоимость ввода одной страницы текста с использованием технологий оптического распознавания в системах с полнотекстовой индексацией высока (2 – 10 USD на страницу) за счет необходимости исправления ошибок ввода".
Комментарий: Применение встроенных средств проверки орфографии в сочетании с эффективными алгоритмами распознавания в современных OCR - системах существенно снижает заявленную выше стоимость обработки. Кроме того, использование описываемых технологий именно в делопроизводстве предъявляет определенные, достаточно жесткие требования к отсутствию фактических ошибок в документах.
Тезис: "Механизм четкого (полнотекстового) поиска не дает возможности найти информацию, если были допущены ошибки при вводе информации".
Комментарий: Определенная опасность, конечно же, существует. Однако современные системы предоставляют пользователю при составлении запроса ряд дополнительных возможностей для поиска: регулировка параметра "близости слов", поиск в диапазоне значений слов, поиск слов по введенному значению морфемы.
Тезис: "Размер индексной базы в системах с полнотекстовым поиском составляет от 100 до 400% от объема проиндексированных файлов, то есть является недопустимо большим".
Комментарий: Тезис устарел. Применение качественного морфологического анализа и использование стоп-словарей, содержащих перечень слов языка, не эффективных для поиска, позволяет уменьшить объем индексной базы до 25-30% от общего объема файлов.
На сегодняшний день, очевидно, что системы, использующие полнотекстовую индексацию, отвечают требованиям абсолютного большинства пользователей.
Сейчас же мы рассмотрим наиболее старый и универсальный метод индексации – реквизитный.
2.1.4.3. Индексация по реквизитам
В самом деле, реквизиты исторически были первыми. В бумажном делопроизводстве им отводится принципиальная роль. Делопроизводитель выделяет из документа реквизиты, служащие основой для информационного наполнения карточки документа, помещаемой в специальную картотеку.
Тем не менее, реквизиты не потеряли своей значимости и после появления систем управления документами. Современная тенденция мультимедийного представления данных делает затруднительным управление электронными документами с помощью средств текстовой индексации. Графические, звуковые и видео файлы не содержат информации, обеспечивающей поиск.
В таких случаях на помощь пользователям приходит реквизитная разметка документов. Суть её состоит в том, что в регистрационной карточке документа определяются поля, в которые вводится информация, определяющая свойства документа.
Набор системных реквизитов определяется в соответствии с назначением системы и по умолчанию должен включать позиции, определяемые действующими нормативными актами по делопроизводству. Для пользователя также важно иметь возможность модифицировать набор и свойства реквизитов, что, к сожалению, встречается не во всех коммерческих продуктах.
2.1.4.4. Построение запросов
В данном разделе будет рассмотрена организация построения запросов при полнотекстовом и реквизитном поиске электронных документов.
Система управления документами должна предоставлять пользователю возможность поиска с применением естественного языка. Абсолютно необходимой является также возможность формулировать запрос без учета различных форм слова (например, игнорируя падеж и число для существительных).
Здесь прослеживается схожесть с работой поисковых машин, работающих в Интернете. Действительно, современные поисковые машины (например, Yandex, Alta Vista и др.) дают возможность построения запросов, максимально приближенных к естественному языку и активно используют лингвистические технологии. Разница, тем не менее, есть: в Интернете пользователь стремится к относительно высокой релевантности поиска, а при работе с документами зачастую требуется абсолютная, 100% вероятность нахождения проиндексированного документа.
При полнотекстовом поиске пользователь, формируя запрос, вводит (либо выбирает из словаря) одно или несколько слов, предположительно содержащихся в искомых документах. Вводимые ключевые слова могут быть связаны логическим оператором ("И" – по умолчанию, "ИЛИ", "НЕ"), что позволяет уточнить условия поиска и уменьшить количество документов, выдаваемых системой в ответ на запрос. Кроме того, в запросе, как правило, может быть применен оператор "*", традиционно обозначающий подстановку любого символа.
В предыдущем разделе, обсуждая "нечеткий" поиск, было сказано о том, что пользователь, манипулируя параметрами полнотекстового поиска, может повысить вероятность отыскания документов, содержащих неисправленные ошибки. Это возможно, например, за счет задания диапазона поиска указанием сколь угодно разнесенных пар слов (чисел, дат). В этом случае система применяет так называемое лексикографическое сравнение, опираясь на свойства используемого алфавита.
Упомянем еще об одном "подводном камне" при построении запросов. Как иногда бывает, один из недостатков поискового механизма является продолжением его достоинств. Система может не найти документы, обрабатывая введенный вручную запрос, содержащий глаголы и слова, входящие в стоп-словарь. Пользователь, на основе испытаний, должен отыскать компромисс между поисковыми возможностями и объемом индексной базы.
При применении системы управления документами в организациях и компаниях с развитым делопроизводством чрезвычайно эффективным может оказаться реквизитный поиск. Как правило, в этих случаях речь идет об обработке большого количества одинаковых по структуре стандартных документов (приказов, актов, писем и др.). Полнотекстовый поиск, конечно же, применим и здесь, но не всегда эффективен: пользователь в результате запроса может получить весь ассортимент изданных приказов, различающихся номером, датой и, может быть, фамилией исполнителя. Отыскание нужного приказа в этих условиях может стать затруднительным.
Однако такой документ, как правило, элементарно может быть найден по значению соответствующего реквизита – регистрационного номера, даты или имени исполнителя (возможны варианты).
Незаменим реквизитный поиск и при работе с корпоративным электронным архивом, содержащим нетекстовые документы.
В целом, комплексное и творческое применение двух вышеописанных методов поиска обеспечивает выполнение ключевой задачи управления электронными документами.
2.1.5. Методы индексирования документов
Итак, на основе вышесказанного становится очевидным то, что успешный поиск документа во многом зависит от реализованного в системе метода индексирования документов. Рассмотрим основные положения индексирования.
Индексирование документа обычно организуется через автоматическую обработку его текста и заполнение метаданных. Автоматическая обработка – полнотекстовое индексирование – заключается в преобразовании текста документа в набор слов. Причем обычно для слов сохраняется их позиция в документе, для обеспечения возможности поиска по словосочетаниям. Существуют два принципиально различных метода такого индексирования с учетом применяемых в дальнейшем методов поиска:
бинарное индексирование – не зависит от языка документа по причине бинарной или словарной индексации;
морфологическое индексирование – производится с учетом морфологии и семантики языка.
При бинарном индексировании поиск ведется на основе алгоритмов “нечеткого поиска”, т.е. поиска с ошибками. В этом случае допускается неполное (с заданным количеством ошибок в начале, середине и конце слова) совпадение слов с шаблоном. При втором методе индексации слова преобразуются в словоформы с отсечением суффиксов и окончаний, что позволяет искать склонения и спряжения шаблонов.
Стандарта на метаданные на текущий момент не существует, но обычно они включают по крайней мере дату создания документа, его размер, возможно, тип и автора, краткое содержание – аннотацию и ключевые слова. Стоит отметить, что последние поля (аннотация и ключевые слова) на сегодняшний день заполняются вручную. При этом, если формат документа их предусматривает и автор их заполнил, то все неплохо, но практически всегда в реальных документах они отсутствуют. Поэтому существующие сегодня системы документооборота их обычно игнорируют по причине крайне дорогого и медленного их заполнения оператором, вводящим документы в систему.
2.1.6. Архивирование документов
Как уже было упомянуто в пункте 2.1.1. существуют два вида архивов документов: статические архивы документов (либо просто архивы) - системы, которые обрабатывают только опубликованные документы и динамические архивы (либо системы управления документами), работающие как с опубликованными документами, так и с теми, которые находятся в разработке.
Ниже будут рассмотрены задачи статических и динамических архивов.
2.1.6.1. Задачи статических архивов
Архив предприятия - это комплекс программного и аппаратного обеспечения, предназначенный для решения перечисленных ниже задач.
Организация хранения электронных документов. Необходимо обеспечивать хранение произвольного количества электронных документов на разнообразных носителях информации. Носители электронных документов характеризуются двумя основными параметрами: стоимостью хранения мегабайта информации и скоростью доступа к информации. Причем эти два параметра обратно пропорциальны друг другу, и в зависимости от решаемых задач приходится выявлять их оптимальное соответствие и выбирать определенный носитель информации. На выбор носителя информации также влияет срок хранения информации на данном носителе.
Иногда для ряда задач нужны системы хранения, состоящие из разнотипных носителей информации. Например, для оперативного доступа требуется применение высоскоростных жестких дисков, а для архивного хранения достаточно роботизированных библиотек оптических дисков. Соответственно, для таких гетерогенных систем хранения необходимо решать задачи не только совместной работы носителей информации, но и обеспечивать миграцию документов между ними. Миграция может осуществляться либо путем настройки системы администратором (скажем, после истечения 90 дней со дня создания документ должен автоматически переместиться на более медленный и дешевый носитель), либо автоматически, в зависимости от частоты обращения пользователей к тому или иному документу. Программное обеспечение, которое ответственно за автоматическую миграцию документов, носит название Hierarchical Storage Management (HSM).
Организация учета бумажных и микрографических документов. Архивная система должна учитывать (в отличие от хранения и учета электронных документов) бумажные и микрографические документы. То есть система будет хранить только электронную карточку на документ данного типа и поддерживать контроль стандартных архивных операций, как-то: выдачи документа, его возврата и т. п.
Поддержка защиты документов от несанкционированного доступа и аудит работы. Архивной системе необходима защита на уровне документа, т. е. каждый документ должен иметь ассоцированный список пользователей, которые имеют право совершать с ним определенные операции. Для статических архивов этот список операций может представлять следующий набор: просмотр и печать документа, право изменять его карточку.
Поддержка просмотра документов без загрузки приложений, его породивших. Архивная система должна поддерживать специальные программы просмотра, которые позволяют получить доступ к документам разнообразных форматов без загрузки ресурсоемких приложений.
Поддержка аннотирования документа. Иногда для обеспечения коллективной работы с документом пользователям необходима возможность вносить в документ комментарии, не изменяя его основного содержания (в этом состоит отличие от редактирования самого документа). Комментарии (стрелки, знаки, текст, выделения цветом) хранятся в слоях, которые могут быть привязаны к автору, создавшему эти комментарии.
В качестве характерного примера реализации статического архива можно привести стандартную imaging-систему типа WaterMark, PaperWise, ImageWise.
2.1.6.2. Дополнительная функциональность динамических архивов
Для динамических архивов обязательны следующие функции:
Поддержка коллективной работы с документом, которая выражется в обеспечении целостности документов. Для этого должны быть реализованы библиотечные функции выписки и возврата документов на/c редактирование, что предотвращает одновременное редактирование одного и того же документа несколькими пользователями и, тем самым, возможные конфликты; предоставлении возможности в рамках одного документа работать одновременно нескольким пользователям. Для этого вводятся понятия версии и подверсии документа, т. е. один документ может содержать несколько версий, а каждая версия - несколько подверсий; наличии в рамках одного документа и одной версии (подверсии) нескольких его представлений в разных форматах.
Составные документы. Каждый документ может представлять собой совокупность других. В этом случае он носит название составного, или контейнера, а в делопроизводстве - «дела». По своим характеристикам он аналогичен простому. В него объединяют документы с помощью нескольких типов связей, определяющих, какие версии помещаются в контейнер (например последняя по дате, последняя отредактированная, старшая версия и т. п.). Заданные связи определяют, как будет осуществляться сборка документа в контейнер. Для составных документов должно существовать приложение, которое будет производить его окончательную сборку, оно зависит от конкретного формата.
Распространение опубликованных документов. Иногда, после публикации документа, его необходимо распространять. В основном это происходит двумя путями: или через систему электронной почты, рассылкой, или через Internet, публикацией на Web-сервере.
Расширенный спектр прав доступа к документу, а именно: на редактирование, на публикацию, на снятие публикации и на создание новой версии.
2.1.6.3. Структура архива данных
Принцип организации хранения документов в системе изолирует пользователя от физического хранилища документов по двум причинам:
1. При доступе к библиотеке, пользователь не знает, где располагается база данных, и не знает, где располагается сервер, который открывает доступ к базе. Вся эта информация находится под управлением специального приложения.
2. Внутри библиотеки, пользователи работают с логической организацией документов. Они ничего не знают о физической организации библиотеки.
Физическое хранилище скрыто от пользователей, но может в полной мере контролироваться разработчиками и администраторами. Система хранит объекты документов в реляционной базе данных. Содержание документа может храниться различными способами. Обычно это выглядит так: очень маленькие (меньше 2k) объекты хранятся прямо в базе данных; маленькие объекты (меньше 64k) хранятся в базе данных в виде 'Больших Бинарных Объектов' (Blobs); объекты большего объема хранятся в любом файловом виде, в месте, которое доступно серверу системы.
Для данных, хранящихся на внешних носителях, существует несколько уровней ссылок на объекты, которые помогают определить последнее местоположение файла с содержанием. Каждый объект содержания имеет параметр, который указывает на объект хранилища для конкретного объекта содержания. Обычные объекты хранения файлов имеют параметр, который делает ссылку на объект расположения. Объект расположения имеет параметр, который указывает полный путь к хранилищу файлов. Это дает верхний уровень каталога хранения файлов для объекта хранения. Четыре уровня подкаталогов автоматически создаются внутри него, основываясь на внутренних идентификаторах.
Не существует ограничения на количество объектов хранения, которые могут использоваться всеми базами данных.
2.1.6.4. Устройства хранения данных
Как уже отмечалось, все данные в системе могут находиться в двух видах: индекс документа и собственно сам документ. Из-за высоких требований к скорости доступа к индексу документа и его целостности, он должен храниться в высокоскоростных отказоустойчивых системах хранения, например RAID-массивах.
Для хранения самих документов использование магнитных дисковых носителей не представляется возможным вследствие их высокой стоимости. Наиболее подходящими носителями могут быть магнитооптические, фазоинверсные (PD/CD), компакт- (CD-R) и WORM-диски (таблица 2.1). Для автоматизации поиска информации, размещенной на этих дисках, ее извлечения и работе собственно с дисками используются автоматические библиотеки или, как их еще называют, оптические дисковые автоматы (JukeBox). Сегодня известны библиотеки, имеющие до 60-ти дисководов и до 3 тыс. гнезд для дисков, выбираемых механизированным способом. Автоматические библиотеки могут быть многофункциональными, например, одновременно поддерживать магнитооптические, фазоинверсные и компакт-диски.
Таблица 2.1.
Оптические и магнитооптические накопители
Тип диска
Емкость
Число циклов перезаписи
5.25"-магнитооптические диски
650 Мб, 1.3 Гб, 2.6 Гб
1млн.
PD/CD-диски фазоинверсной записи
650 Мб
1тыс.
WORM-диски
1-10 Гб
однократно
Компакт-диски CD-R
650 Мб
однократно
Преимущество магнитооптических дисков перед компакт-дисками основана на том, что первые позволяют перезаписывать информацию. Большинство технологических решений электронного архивирования поддерживает технологию миграции данных именно на магнитооптические диски, которые более устойчивы к ошибкам записи, имеют более высокую скорость чтения, однако уступают компакт-дискам в гарантийном сроке хранения информации и стоимости. Если магнитооптические диски, в лучшем случае, декларируют сохранность информации в течение 50 лет, то гарантия на компакт-диски может составлять 100 лет и более. Что касается стоимости систем хранения на базе магнитооптических и компакт-дисков, то она может отличаться в 4 раза. С учетом того, что большинство архивных документов, практически, не подлежат модификации и удалению, библиотеки на компакт-дисках могут быть предпочтительнее. Кроме того, компакт-диски удобнее в работе: их автономное чтение можно осуществлять на любом ПК, комплектуемом приводом CD-ROM.
Не вызывает сомнения, что вся информация в системе должна иметь резервные копии. Для графических образов сохранность информации может быть обеспечена созданием дублированных магнитооптических или компакт-дисков. Для хранения меняющейся поисковой информации в качестве сохранных накопителей удобнее использовать системы резервного копирования на магнитных лентах. Применяемые в персональных системах технологии (DC2000/Travan, DC6000, DAT) непригодны из-за ограничений в объеме. Возможным вариантом могут стать DLT-стримеры, восьмимиллиметровые библиотеки Exabyte (Mammoth) или специализированные катушечные системы. Наиболее распространены DLT-стримеры.
2.2. Обоснование проектных решений
2.2.1. Математическая модель применяемого метода
Ниже приведен разработанный алгоритм процесса индексирования документа:
1. Присвоение документу уникального идентификатора, внесение в файл идентификаторов
2. Определение формата документа
3. Определение кодировки документа
4. Перевод текста в «плоский» формат
5. Определение единицы поиска
6. Выделение отдельных слов
7. Выделение отдельных предложений
8. Обработка буквы «ё»
9. Исключение из запроса шумовых слов
10. Составление (пополнение) индекса определенного формата (рис. 2.1)
Слово
id документа, номер слова, номер слова, . . .
id документа, номер слова, номер слова, . . .
Рис. 2.1. Формат индекса
При индексировании нового документа в уже существующий индекс напротив слов добавляется идентификатор нового документа и номера данного слова в нем. При этом идентификаторы документов сортируются в соответствии с количеством вхождений слова в документ.
Таким образом, приведенный выше алгоритм обеспечивает составление единого индекса для всех индексируемых документов, что существенно уменьшает объем занимаемого индексами дискового пространства, а также уменьшает время, затрачиваемое на поиск документа.
Блок-схема алгоритма индексирования приведена на рис. 2.2.
Теперь коснемся процесса обработки запроса. Ниже приведен разработанный алгоритм процесса обработки запроса:
1. Определение кодировки запроса
2. Обработка буквы «ё»
3. Исключение из запроса шумовых слов
4. Проверка основ слов
5. Сортировка ответа по убыванию компактности вхождений слов в текст (в рамках ранжирования по релевантности)
Формализованное описание модели
В модели информационного потока вообще можно выделить несколько основных понятий: словарь, документ, поток и процедуры поиска и коррекции запросов.
Под словарем понимают упорядоченное множество терминов, мощность которого обозначают как D.
Документ - это двоичный вектор размерности D. Если термин входит в документ, то в соответствующем разряде этого двоичного вектора проставляется 1, в противном же случае - 0. Обычно все операции в линейной модели индексирования и поиска документов выполняются над поисковыми образами документов, но при этом их как правило называют просто документами.
Информационный поток или массив L представляют в виде матрицы размерности NxD, где в качестве строк выступают поисковые образы N документов. При таком рассмотрении можно сформулировать процедуру обращения к информационной системе следующим образом:
L x q = r; (2.1)
где q - вектор запроса, r - отклик системы на запрос.
Это традиционное определение процедуры поиска документов в ИПС, которое ввел Солтон в 1977 году. Оно было введено для решения проблемы автоматического индексирования документов, но оказалось чрезвычайно полезным и для описания процедуры поиска.
Существуют и другие определения процедуры обращения пользователя к системе, но для описания работы распределенных ИПС в интернете больше подходит определение Солтона - в подавляющем большинстве этих систем применяются информационно-поисковые языки типа "Like This". Данный подход хорошо известен как вычисление мер близости "документ-запрос".
В современных распределенных ИПС Internet реально используются только 6 мер близости. При этом наиболее часто в качестве меры близости рассматривают определение Солтона, например, системы RBSE и WAIS, и его же улучшенную меру близости - системы WebCrawler и Lycos.
Начало применению запросов типа "Like This" положила система WAIS. Именно в ней был впервые сформулирован отказ от использования традиционных информационно-поисковых языков булевого типа и было заявлено о переносе центра тяжести информационного поиска на языки, основанные на вычислении меры близости "документ-запрос". Основная причина такого подхода - желание снять с пользователей заботу по формулированию запросов на информационно-поисковых языках и дать им возможность использовать обычный естественный язык. Ради справедливости следует отметить, что от запросов на естественном языке практически сразу отказались. Система просто проводила нормализацию лексики и удаляла из списка терминов запроса общие и стоп-слова. Тем самым практически один в один выполнялись условия линейной модели индексирования и поиска. После этой процедуры система вычисляла меру близости по выражению и в соответствии с полученными значениями ранжировала информационный массив. Практически все ИПС в интернете устроены по этому принципу. Единственным исключением является применение более сложных мер близости.
Коррекция запросов по релевантности
Другим важным способом улучшения качества поиска в информационно-поисковых системах Internet стала процедура коррекции запроса по релевантности. Пионером здесь также выступила система WAIS. Пользователю предоставлялась возможность отметить документы, которые являлись релевантными его запросу. После этого запрос расширялся терминами этих документов и снова вычислялось выражение (2.1) для поисковых образов документов всего массива. В рамках линейной модели индексирования и поиска эта процедура может быть также выражена через матричные выражения.
В литературе по информационному поиску часто можно встретить термин "профиль", который относят к запросам пользователей. Но информационный профиль или тематический профиль имеется и у информационной системы. Наиболее просто тематический профиль системы материализуется в виде классификации, которая применяется в данной системе или рубрикаторе. Не исключение и информационные системы интернета, в которых профиль играет еще и роль навигационного средства, позволяющего получить доступ непосредственно к набору документов, попадающих в тот или иной раздел классификации. При этом многие системы интернета имеют несколько профилей, которые могут быть соотнесены с фасетной классификацией.
Естественно, что при таком положении дел в моделях, предназначенных для описания работы ИПС так же должно быть введено понятие профиля и выявлена его актуальность для информационного поиска.
Определим операцию расширения запроса как:
LT x r0 = q1 (2.2)
В данном выражении LT - это транспонированная матрица L. Однако, это не совсем точно. Обычно пользователь не использует свое право отметки релевантных документов и только их термины используются в расширенном запросе или получают больший вес перед терминами других документов. Поэтому в выражение (2.2) надо ввести еще матрицу - F, призванную учитывать фактор пользователя.
LT x Fk-1 x rk-1 = qk (2.3)
L x qk = rk;
Как видно из (2.3) матрицы Fk-1 составляют систему фильтров пользователя, при помощи которых он корректирует свой запрос. Эти фильтры имеют в реальных системах конкретную интерпретацию. Так в WAIS и Lycos пользователь просто помечает релевантные документы. В этом случае фильтры превращаются в диагональные матрицы, которые в релевантных документах имеют главную диагональ с единицами, а в нерелевантных - с нули. Но, в общем случае, на диагонали можно размещать и веса релевантности. Эти фильтры могут быть и недиагональными. В этом случае пользователь будет взвешивать документы не только самостоятельно, но и с учетом их связи с другими документами массива, как релевантными, так и нерелевантными, например с учетом его гипертекстовых связей. Но в любом случае совершенно естественно предположить, что система предпочтений пользователя в течение одной сессии работы с ИПС остается неизменной, иначе пользователь просто не знает, что же он в самом деле ищет. Тогда все фильтры одинаковы и не изменяются от шага к шагу:
F0 = F1 = F2 = ... = Fk-1 = Fk = F (2.4)
В конечном итоге, если пользователь просто переберет все документы массива, то можно составить диагональную матрицу, например, состоящую из нулей и единиц.
Процесс коррекции запроса не бывает бесконечным. Обычно он завершается, когда пользователь устает просматривать найденные документы, и приходит к выводу, что нашел искомое, либо действительно больше нет новых релевантных документов. В принципе, даже при прямом просмотре, второй результат является концом процедуры поиска информации. Это значит, что начиная с некоторого вектора отклика этот самый отклик не изменяется:
(L x LT x F) x rk-1 = rk; (2.5)
(A x F) x r = lr:rk = lrk-1.
Из (2.5) следует, что процесс коррекции запросов по релевантности должен сходиться к собственному вектору матрицы ( L x LT x F). Если при этом пользователь хочет добиться максимального различия документов по степени релевантности, которая фактически определяется значениями компонентов вектора r, тогда речь идет о собственном векторе при максимальном собственном числе. Аналогичный результат можно получить и для набора терминов, которые характеризуют информационную потребность пользователя.
Однако, кроме профилей пользователя при моделировании взаимодействия пользователя и информационной системы. Существенную играет роль сам информационный массив, а точнее набор информационных образов документов массива, скажем, в ранжировании документов по степени релевантности. А именно об этом и идет речь в линейной модели индексирования и поиска информации. Чем ближе оказываются документы к информационной потребности пользователя, тем проще структура матрицы F. Идеальный случай, если эта матрица будет единичной - тогда пользователь вообще не нуждается в ручной коррекции, а система сама проранжирует все документы.
Приведенная трактовка процедуры коррекции запроса и профиля информационной системы имеет аналоги в других методах анализа информационных потоков. Если надо различить какие-либо группы пользователей по их тематике с применением некоторой информационной структуры, то можно прибегнуть к факторному анализу статистики посещения страниц. В этом случае главные компоненты будут задаваться собственными векторами корреляционной матрицы, которая позволяет определить направление максимального разброса показателей посещений, что соответствует собственному вектору при максимальном собственном числе.
2.3. Программная реализация
В данном разделе описывается программа, реализующая изложенные выше алгоритмы индексирования и обработки запроса.
2.3.1. Выбор средств программирования
Для написания программы была выбрана интегрированная система программирования Borland C++ Builder 6.0 и объектноориентированный язык C++, так же использовался компилятор С++ 5.02 фирмы Borland и язык программирования С++. Эти средства позволяют создавать прикладные программы, предназначенные для работы на ПЭВМ IBM PC AT под управлением оболочки Windows 95 и более поздних версий, а так же операционной системы Windows NT и использующие общепринятые для Windows элементы пользовательского интерфейса. Программы такого типа в настоящее время признаны в качестве стандарта ПП, поскольку наиболее широко распространены, удобны для пользователей и не требуют долгого их обучения.
Предпочтение было отдано системе Borland C++ Builder благодаря тому, что она позволяет программисту очень быстро и удобно разрабатывать пользовательский интерфейс. Это свойство особенно ценно из-за того, что, как показывает практика, работа над интерфейсом занимает б(льшую часть (до 80%) времени создания ПП. Еще одним преимуществом выбранной системы является высокая (по сравнению со многими другими средствами программирования) эффективность генерируемого компилятором кода, что весьма существенно для данного ДП, т.к. в нем применяется метод, требующий большого количества вычислений.
2.3.2. Описание программного продукта
Программа индексирования и поиска документов имеет следующие функциональные возможности:
* индексирование документов заранее, в режиме off-line
* быстрое пополнение индекса в режиме on-line
* реализация поиска по комбинациям слов
* запоминание координат слов в документах
* сортировка найденных документов по компактности вхождения слов
* ранжирование найденных документов по их релевантности
* выделение форматов
* выделение кодировак
* правильная обрабатка буквы «ё»
* выделение предложений
* наличие списка шумовых слов
2.3.3. Разработка программной документации
В документацию к ПП на КЗ “Автоматизированная система документооборота учереждение” входят тексты исходных модулей программы. Программная документация на КЗ “Автоматизированная система документооборота учереждение” разработана в соответствии с требованиями ГОСТ 19.301-76, ГОСТ 19.503-79 и ГОСТ 19.504-79.
2.3.4. Результаты опытной эксплуатации КЗ “СИСТЕМА ДОКУМЕНТООБОРОТА УЧЕРЕЖДЕНИЯ” и технические предложения по ее развитию
Опытная эксплуатация разработанного МО КЗ и ПП показала, что он соответствует требованиям ТЗ на данный комплекс и решает поставленную перед ним задачу.
В большинстве случаев удаётся проинтерпретировать главные компоненты и построить на их базе требуемые оценки.
Для того чтобы подтвердить эффективность разработанного алгоритма, были проведены испытания, дающие определенное представление о скорости и качестве поиска при использовании различных средств поиска.
Для испытаний использовался ПК с процессором Pentium – 166MMX, RAM 64 Mb, HDD Quantum Fireball TM 2,1 GB и операционной системой MS Windows NT 4.0 Workstation.
Массив данных для поиска: 273 файла в 54 каталогах, общим объемом 53,5 Mb.
Испытываемые средства поиска:
Windows NT Server Explorer;
Medialingua Text Pilot (программа смыслового поиска документов "Следопыт" российской компании "Медиалингва");
"Евфрат 99", система автоматизации делопроизводства компании Cognitive Technologies.
Программа, реализующая алгоритм, предложенный в данном дипломном проекте.
Для составления запроса использовались слова "поиск", все словоформы которого содержат исходное слово и "автоматизация", не обладающее этим свойством.
Полученные результаты:
Время поиска: 30, 15, 13 и 9 секунд соответственно.
Количество обнаруженных документов: для слова "поиск" – 34 документа для каждого средства поиска, для слова "автоматизация" – 2, 16, 18 и 22 документов соответственно.
Проведенное исследование не претендует на абсолютную объективность. Тем не менее, очевидно, что применение предложенного алгоритма существенно увеличивает эффективность поиска.
Выявлены следующие недостатки разработки (большинство из которых предполагалось заранее):
недостаточная релевантность документов в ответе на запрос, объясняющаяся необходимость дополнительной настройки стоп-словарей и словарей основ;
Для устранения вышеперечисленных недостатков требуется донастроить программный продукт под область деятельности заказчика и повысить компьютерную грамотность персонала учереждения.
Выводы по главе 2
В данной главе решены следующие задачи:
1. Выполнена постановка задачи на разработку КЗ “Реализация функций поиска и архивации информации в системе документооборота учереждения”
2. Рассмотрены преимущества полнотекстовой индексации документов как основа для математического аппарата решения поставленной задачи и разработана математическая модель, реализующая выбранный алгоритм индексации документов.
3. Разработано математическое и программное обеспечение КЗ “Реализация функций поиска и архивации информации в системе документооборота учереждения”. Программная документация содержит 237 строк исходного кода Visual C++.
4. Разработанный математический аппарат признан пригодным для автоматизации проводимых в министерстве работ по повышению эффективности функционирования учереждения.
В перспективе возможно применение разработанных методов и построенных моделей в других учреждениях Российской Федерации.
ГЛАВА 3. МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ПРИКЛАДНЫХ ЗАДАЧ
3.1. Деловая игра по курсу "Гражданская оборона"
3.1.1. Постановка задачи и ее спецификация
Гражданская оборона страны - составная часть системы общегосударственных оборонных мероприятий, проводимых в мирное и военное время в целях защиты населения и народного хозяйства от оружия массового поражения и других современных средств нападения противника, а также для спасательных и неотложных аварийно-восстановительных работ в очагах поражения и зонах катастрофических разрушений в результате стихийных бедствий.
Задачи, решаемые гражданской обороной, определяют принципы ее организационного построения. Гражданская оборона организуется по территориально-производственному принципу, что позволяет при необходимости обеспечить использование в своих интересах людских и материальных ресурсов для успешного решения задач с наименьшим отрывом людей от их производственной деятельности. Производственный принцип заключается в организации ГО на каждом предприятии или объекте. При территориально - производственном принципе построения формирований гражданской обороны полную ответственность за организацию и состояние ГО, за постоянную готовность ее сил и средств к проведению спасательных и аварийно - восстановительных работ несет начальнику гражданской обороны объекта - руководитель предприятия. Поэтому система гражданской обороны тесно связана со всей структурой науки и производства.
Эффективность функционирования формирований и служб гражданской обороны определяется степенью подготовки и уровнем специальных навыков персонала, в первую очередь инженерно-технических работников как руководителей подразделений и служб в структуре ГО.
Происшествия на объектах, связанных с работой с радиоактивными материалами а также авария на Чернобыльской АЭС в 1986 г. показали необходимость поддержания высокого уровня подготовленности формирований ГО и готовности к ликвидации последствий аварий, отчего зависит спасение жизни людей нескольких поколений и сохранение значительных материальных ценностей.
Повышение профессионального уровня личного состава формирований гражданской обороны может обеспечиваться своевременным проведением учебно-подготовительных, тренировочных и контрольных занятий.
Большую помощь в этом может оказать применение современных средств обучения, автоматизации и, в частности, электронно-вычислительной техники. Это позволит значительно повысить эффективность и качество обучения при одновременном снижении времени и материальных затрат (например, за счет применения обучающих, тестирующих и имитирующих программ для ЭВМ вместо занятий на материальной части и тренировок на объектах).
3.1.2. Характерискика воздействия ядерного оружия
Поражающее действие ядерного взрыва определяется механическим воздействием ударной волны, тепловым воздействием светового излучения, радиационным воздействием проникающей радиации и радиоактивного заражения. Для некоторых элементов объектов поражающим фактором является электромагнитное излучение (электромагнитный импульс) ядерного взрыва.
Распределение энергии между поражающими факторами ядерного взрыва зависит от вида взрыва и условий, в которых он происходит. При взрыве в атмосфере примерно 50 % энергии взрыва расходуется на образование ударной волны, 30-40 % - на световое излучение, до 5 % - на проникающую радиацию и электромагнитный импульс и до 15 % - на радиоактивное заражение.
Для нейтронного взрыва характерны те же поражающие факторы, одна ко несколько по-иному распределяется энергия взрыва: 8-10 % - на образование ударной волны, 5-8 % - на световое излучение и около 85 % расходуется на образование нейтронного и гамма-излучений (проникающей радиации) .
Действие поражающих факторов ядерного взрыва на людей и элементы объектов происходит не одновременно и различается по длительности воз действия, характеру и масштабам поражения.
Ударная волна - это область рез кого сжатия среды, которая в виде сферического слоя распространяется во все стороны от места взрыва со сверхзвуковой скоростью. В зависимости от среды распространения различают ударную волну в воздухе, в воде или грунте (сейсмовзрывные волны).
Ударная волна в воздухе образуется за счет колоссальной энергии, выделяемой в зоне реакции, где исключительно высокая температура, а давление достигает миллиардов атмосфер (до 105 млрд. Па). Раскаленные пары и газы, стремясь расшириться, производят резкий удар по окружающим слоям воздуха, сжимают их до больших давления и плотности и нагревают до высокой температуры. Эти слои воздуха приводят в движение последующие слои. И так сжатие и перемещение воздуха происходит от одного слоя к другому во все стороны от центра взрыва, образуя воздушную ударную волну. Расширение раскаленных газов происходит в сравнительно малых объемах, поэтому их действие на более заметных удалениях от центра ядерного взрыва становится воздушная ударная волна. Вблизи центра взрыва скорость распространения ударной волны в несколько раз превышает скорость звука в воздухе. С увеличением расстояния от места взрыва скорость распространения волны быстро падает, а ударная волна ослабевает; на больших удалениях ударная волна переходит, по существу, в большую акустическую волну и скорость ее распространения приближается к скорости звука в окружающей среде, т.е. к 340 м/с. Воздушная ударная волна при ядерном взрыве средней мощности проходит примерно 1000 м за 1,4 с, 2000 м - за 4 с, 3000 м - за 7 с, 5000 м - за 12 с. Отсюда следует, что человек, увидев вспышку ядерного взрыва, за время до прихода ударной волны, может занять ближайшее укрытие (складку местности, канаву, кювет, простенок и т.п.) и тем самым уменьшить вероятность поражения ударной волной.
3.1.2.1. Механическое воздействие ударной волны
Характер разрушения элементов объекта (предметов) зависит от нагрузки, создаваемой ударной волной, и реакции предмета на действие этой нагрузки. Сведения о вероятных разрушениях зданий, сооружений, транспорта, оборудования и энергетических сетей в зависимости от избыточного давления во фронте ударной волны даны в табл. 26, 27.
Общую оценку разрушений, вызванных ударной волной ядерного взрыва, принято давать по степени тяжести этих разрушений. Для большинства элементов объекта, как правило, рассматриваются три степени:
* слабое разрушение,
* среднее разрушение,
* сильное разрушение.
Для жилых и промышленных зданий берется обычно четвертая степень - полное разрушение. При слабом разрушении, как правило, объект не выходит из строя; его можно эксплуатировать немедленно или после незначительного (текущего) ремонта. Средним разрушением обычно называют разрушение главным образом второстепенных элементов объекта. Основные элементы могут деформироваться и повреждаться частично. Восстановление возможно силами предприятия путем проведения среднего или капитального ремонта. Сильное разрушение объекта характеризуется сильной деформацией или разрушением его основных элементов, в результате чего объект выходит из строя и не может быть восстановлен.
Применительно к гражданским и промышленным зданиям степени разрушения характеризуются следующим состоянием конструкции.
Слабое разрушение. Разрушаются оконные и дверные заполнения и легкие перегородки, частично разрушается кровля, возможны трещины в стенах верхних этажей. Подвалы и нижние этажи сохраняются полностью. Находиться в здании безопасно и оно может эксплуатироваться после проведения текущего ремонта.
Среднее разрушение проявляется в разрушении крыш и встроенных элементов внутренних перегородок, окон, а также в возникновении трещин в стенах, обрушении отдельных участков чердачных перекрытий и стен верхних этажей. Подвалы сохраняются. После расчистки и ремонта может быть использована часть помещений нижних этажей. Восстановление зданий возможно при проведении капитального ремонта.
Сильное разрушение характеризуется разрушением несущих конструкций и перекрытий верхних этажей, образованием трещин в стенах и деформацией перекрытий нижних этажей. Использование помещений становится невозможным, а ремонт и восстановление чаще всего нецелесообразным.
Полное разрушение. Разрушаются все основные элементы здания, включая и несущие конструкции. Использовать здания невозможно. Подвальные помещения при сильных и полных раз рушениях могут сохраняться и после разбора завалов частично использоваться.
Наибольшие разрушения получают наземные здания, рассчитанные на собственный вес и вертикальные на грузки, более устойчивы заглубленные и подземные сооружения. Здания с металлическим каркасом средние разрушения получают при 20-40 кПа, а полные - при 60-80 кПа, здания кирпичные - при 10-20 и 30-40, здания деревянные - при 10 и 20 кПа соответственно. Здания с большим количеством проемов более устойчивы, так как в первую очередь разрушаются заполнения проемов, а несущие конструкции при этом испытывают меньшую на грузку. Разрушение остекления в зданиях происходит при 2-7 кПа.
Объем разрушений в городе зависит от характера строений, их этажности и плотности застройки. При плотности застройки 50 % давление ударной волны на здания может быть меньше (на 20-40 %), чем на здания, стоящие на открытой местности, на таком же расстоянии от центра взрыва. При плотности застройки менее 30 % экранирующее действие зданий незначительно и не имеет практического значения.
Энергетическое, промышленное и коммунальное оборудование может иметь следующие степени разрушений.
Слабые разрушения: деформации трубопроводов, их повреждения на стыках; повреждения и разрушения контрольно-измерительной аппаратуры; повреждение верхних частей колодцев на водо-, тепло- и газовых сетях; отдельные разрывы на линии электропередач (ЛЭП); повреждения станков, требующих замены электропроводки, приборов и других поврежденных частей.
Средние разрушения: отдельные разрывы и деформации трубопроводов, кабелей; деформации и повреждения отдельных опор ЛЭП; деформация и смещение на опорах цистерн, разрушение их выше уровня жидкости; повреждения станков, требующих капитального ремонта.
Сильные разрушения: массовые разрывы трубопроводов, кабелей и разрушения опор ЛЭП и другие раз рушения, которые нельзя устранить при капитальном ремонте.
Наиболее стойки подземные энергетические сети. Газовые, водопроводные и канализационные подземные сети разрушаются только при наземных взрывах в непосредственной близости от центра при давлении ударной волны 600-1500 кПа. Степень и характер разрушения трубопроводов зависят от диаметра и материала труб, а также от глубины прокладки. Энергетические сети в зданиях, как правило, выходят из строя при разрушении элементов застройки. Воздушные линии связи и электропроводок получают сильные разрушения при 80-120 кПа, при этом линии, проходящие в радиальном направлении от центра взрыва, повреждаются в меньшей степени, чем линии, проходящие перпендикулярно к направлению распространения ударной волны.
Станочное оборудование предприятий разрушается при избыточных давлениях 35-70 кПа. Измерительное оборудование - при 20-30 кПа, а наиболее чувствительные приборы могут повреждаться и при 10 кПа и даже 5 кПа. При этом необходимо учитывать, что при обрушении конструкций зданий также будет разрушаться оборудование.
Для гидроузлов наиболее опасными являются надводный и подводный взрывы со стороны верхнего бьефа. Наиболее устойчивые элементы гидроузлов - бетонные и земляные плотины, которые разрушаются при давлении более 1000 кПа. Наиболее слабые - гидрозатворы водосливных плотин, электрическое оборудование и различные надстройки.
Степень разрушений (повреждений) транспортных средств зависит от их положения относительно направления распространения ударной волны. Средства транспорта, расположенные бортом к направлению действия ударной волны, как правило, опрокидываются и получают большие повреждения, чем машины, обращенные к взрыву передней частью. Загруженные и закрепленные средства транспорта имеют меньшую степень повреждения. Более устойчивы ми элементами являются двигатели. Например, при сильных повреждениях двигатели автомашин повреждаются незначительно, и машины способны двигаться своим ходом.
Наиболее устойчивы к воздействию ударной волны морские и речные суда и железнодорожный транспорт. При воздушном или надводном взрыве повреждение судов будет происходить главным образом под действием воз душной ударной волны. Поэтому повреждаются в основном надводные части судов - палубные надстройки, мачты, радиолокационные антенны и т. д. Котлы, вытяжные устройства и другое внутреннее оборудование повреждаются затекающей внутрь удар ной волной. Транспортные суда получают средние повреждения при давлениях 60-80 кПа. Железнодорожный подвижной состав может эксплуатироваться после воздействия избыточных давлений: вагоны - до 40 кПа, тепловозы - до 70 кПа (слабые разрушения) .
Самолеты - более уязвимые объекты, чем остальные транспортные средства. Нагрузки, создаваемые избыточным давлением 10 кПа, достаточны для того, чтобы образовались вмятины в обшивке самолета, деформировались крылья и стрингеры, что может привести к временному снятию с полетов.
Воздушная ударная волна также действует на растения. Полное повреждение лесного массива наблюдается при избыточном давлении, превышающем 50 кПа (0,5 кг с/см2). Деревья при этом вырываются с корнем, ломаются и отбрасываются, образуя сплошные завалы. При избы точном давлении от 30 до 50 кПа (0,3-0,5 кг с/см2) повреждается около 50 % деревьев (завалы также сплошные), а при давлении от 10 до 30 кПа (0,1-0,3 кг с/см2) - до 30 % деревьев. Молодые деревья более устойчивы к воздействию ударной волны, чем старые и спелые.
3.1.2.2. Методика оценки воздействия поражающих факторов ядерного взрыва
Основные поражающие факторы, которые представляют главную опасность для наземных объектов, - ударная волна, световое излучение, вторичные поражающие факторы и радиоактивное заражение. Для некоторых объектов необходимо учитывать воз действие проникающей радиации и электромагнитного импульса ядерного взрыва. Воз действие электромагнитного импульса в основном представляет опасность для предприятии, имеющих антенные устройства, большой протяженности линий связи и линии электропередач, а также электронные системы.
В качестве критериев оценки физической устойчивости приняты:
* при воздействии ударной волны - избыточные давления, при которых элементы производственного комплекса не разрушаются (не повреждаются) или получают такие повреждения или разрушения (слабые и средние разрушения), при которые они могут быть восстановлены в короткие сроки;
* при воздействии светового излучения - максимальные значения световых импульсов, при которых не происходит загорание материалов, сырья, оборудования, зданий и сооружений;
* при воздействии вторичных факторов поражения - избыточные давления, при которых происходящие раз рушения и повреждения не приводят к авариям, пожарам, взрывам, затоплениям, опасному заражению местности и атмосферы, т. е. к поражению людей и выходу из строя средств производства.
Оценка физической устойчивости объекта производится последовательно по воздействию каждого поражающего фактора, а также вторичных факторов поражения. Эта оценка включает:
определение видов поражающих факторов, воздействие которых воз можно на объект, и их параметров;
* воздействие ударной волны на элементы объекта;
* возможность возникновения пожаров;
* воздействие вторичных поражающих факторов;
* общие выводы, (заключением по физической устойчивости объекта к воздействию поражающих факторов возможного ядерного взрыва.
Определение физической устойчивости элементов объекта производится по избыточным давлениям во фронте ударной волны от 5 кПа (0,05 кгс/см2) и кончая давлением, разрушающим данный элемент. Одновременно учитывается воздействие светового излучения и вторичных факторов поражения. Если имеются данные о предполагаемом виде, мощности, месте ядерного взрыва и метеорологических условиях, то параметры поражающих факторов могут быть рассчитаны. Пример такого расчета приведен в приложении 3.
Объекты в силу различного назначения, профиля и специализации отличаются друг от друга по конструкции зданий и сооружений, составу оборудования , и технологической оснастке. Вместе с тем следует считать, что для всех промышленных объектов методика оценки устойчивости их работы при воздействии поражающих факторов ядерного взрыва может быть едина. Имеющиеся же особенности н различия в элементах производства каждого объекта должны учитываться при проведении конкретных расчетов.
Методика оценки воздействия ударной волны. Действие ударной волны на объект характеризуется сложным комплексом нагрузок: избыточным давлением, давлением отражения, давлением скоростного напора, давлением затекания, нагрузкой от сейсмовзрывных волн и т. д. Значение их зависит в основном от вида и мощности взрыва, расстояния до объекта, конструкции и размеров элементов объекта, ориентации относительно направления на взрыв, места расположения зданий и сооружений в общей застройке объекта и отдельных элементов производства в помещениях зданий, рельефа местности и некоторых других факторов.
Учесть их в совокупности для каждого элемента объекта, как правило, невозможно. Поэтому сопротивляемость элементов действию ударной волны принято характеризовать избыточным давлением во фронте ударной волны. Иными словами, считают, что значения избыточных давлений, вызывающих одни и те же степени разрушения элементов, практически не зависят от мощности и высоты наиболее вероятных ядерных взрывов.
Определение степени разрушения или повреждения элементов объекта при воздействии ударной волны про изводится в следующем порядке:
1. Изучаются исходные данные и определяются параметры ударной волны.
2. Для установленных значений избыточных давлений оценивается степень разрушения рассматриваемых элементов.
3. Одновременно с непосредственным разрушающим действием ударной волны оценивается возможность возникновения вторичных факторов поражения.
4. ПО степени разрушения слабого элемента, объекта определяется, степень разрушения объекта в целом.
Исходными данным и для оценки физической устойчивости являются: конструктивные особенности элемента, его форма; вес элемента (оборудования, прибора); габариты (длина, ширина, высота, диаметр и т. п.), прочностные характеристики и другие необходимые сведения для оценки сопротивляемости элемента воздействию механических нагрузок.
Оценка степени разрушений зданий и сооружений, защитных сооружений ГО, энергетического оборудования и сетей, станочного и технологического оборудования, измерительной аппаратуры, средств связи и оповещения, транспортных и. других средств может производиться методами: сравнения имеющихся справочных данных для рассматриваемого вида или аналогичного ему элемента; расчета воздействия ударных нагрузок и сил смещения на элемент.
Метод расчета предусматривает определение динамических нагрузок, создаваемых избыточным давлением во фронте ударной волны, и реакцию элемента на эти нагрузки.
Сравнительная оценка сопротивляемости действию ударной волны элементов объекта проводится на основе анализа справочных данных. Они составлены по источникам иностранной литературы на основании статистических данных, по лученных при анализе разрушений в городах Хиросима и Нагасаки, а так же экспериментальных исследований. Справочные данные могут пополняться сведениями, полученными в результате расчетов при конструировании новых элементов.
Степень разрушений зданий, оборудования, трубопроводов, линий связи в зависимости от избыточного давления во фронте ударной волны оценивалась методом сравнения, степень разрушения блоков программных устройств к станкам - методом расчета: определялись возможные механические нагрузки, создаваемые ударной волной, и устанавливался характер повреждения блоков при воздействии этих нагрузок.
В процессе оценки характера раз рушения каждого элемента и цеха, в целом определяют возможность образования вторичных факторов поражения, определяется степень разрушения цеха (объекта) в целом.
Оценка возможности возникновения пожаров на объекте. Возможность возникновения очагов воспламенения и горения устанавливается по данным возгораемости материалов; вторичным факторам поражения, вызванным воздействием ударной волны (разрушение печей, газопроводов, порывы и пробои электропроводки, кабелей и т. п.).
3.1.3. Разработка рекомендаций по защите
Проникающая радиация - один из поражающих факторов ядерного взрыва, представляющий собой гамма-излучение и поток нейтронов, испускаемых в окружающую среду из зоны ядерного взрыва. Кроме гамма-излучения и потока нейтронов, выделяются ионизирующие излучения в виде альфа- и бета-частиц, имеющих малую длину свободного пробега, вследствие чего их воздействием на людей и материалы пренебрегают. Время действия проникающей радиации не превышает 10-15 с с момента взрыва.
Основные параметры, характеризующие ионизирующие излучения, - доза и мощность дозы излучения, поток и плотность потока частиц.
Ионизирующая способность гамма-лучей характеризуется экспозиционной дозой излучения. Единицей экспозиционной дозы гамма-излучения является кулон на килограмм (Кл / кг). Согласно стандарту, кулон на килограмм - экспозиционная доза рентгеновского и гамма-излучений, при которой сопряженная корпускулярная эмиссия на 1 кг сухого атмосферного воздуха производит в воздухе ионы, несущие заряд в 1 кулон электричества каждого знака. В практике в качестве единицы экспозиционной дозы применяют несистемную единицу рентген (Р). Рентген - это такая доза (количество энергии) гамма-излучения, при поглощении которой в 1 см3 сухого воздуха (при температуре 0? С и давлении 760 мм рт. ст.) образуется 2,083 миллиарда пар ионов, каждый из которых имеет заряд, равный заряду электрона. 1Р = 2,58 * 10-4 Кл/кг; 1 Кл/кг = 3876 Р или 1 Кл/кг ? 3900 Р. Дозе 1Р соответствует поглощение 1 г воздуха 88 эрг энергии (8,8 х 10-3 Дж/кг), а 1 г биологической ткани - 93 эрг (9,3 * 10-3 Дж/кг).
Единица мощности экспозиционной дозы - ампер на килограмм (А/кг), рентген в секунду (Р/с) и рентген в час (Р/ч). Ампер на килограмм равен мощности экспозиционной дозы, при которой за время, равное одной секунде, сухому атмосферному воздуху передается экспозиционная доза кулон на килограмм:
1 Р/с = 2,58 * 10-4 А/кг; 1 А/кг = 3876 Р/с или 1 А/кг = 3900 Р/с = 14 * 106 Р/ч;
1 Р/ч = 7,167 * 10-8 А/кг.
Процесс ионизации атомов нейтронами отличен от процесса ионизации гамма-лучами. Поток нейтронов измеряется числом нейтронов, приходящихся на квадратный метр поверхности, - нейтрон/м2. Плотность потока - нейтрон/(м2 * с).
Степень тяжести лучевого поражения главным образом зависит от поглощенной дозы. Для измерения поглощенной дозы любого вида ионизирующего излучения установлена единица - грэй (Гр); в практике применяется внесистемная единица - рад. Грэй равен поглощенной дозе излучения, соответствующей энергии 1Дж ионизирующего излучения любого вида, переданной облучаемому веществу массой 1 кг. Для типичного ядерного взрыва один рад соответствует потоку нейтронов (с энергией превышающей 200 эВ) порядка 5 * 1014 нейтрон/м2: 1 Гр = 1 Дж/кг = 100 рад = 10000 зрг/г.
Распространяясь в среде, гамма-излучение и нейтроны ионизируют ее атомы и изменяют физическую структуру веществ. При ионизации атома и молекулы клеток живой ткани за счет нарушения химических связей и распада жизненно важных веществ погибают или теряют способность к дальнейшей жизнедеятельности.
Поражение людей и животных проникающей радиацией. При воздействии проникающей радиации у людей и животных может возникнуть лучевая болезнь. Степень поражения зависит от экспозиционной дозы излучения, времени, в течение которого эта доза получена, площади облучения тела, общего состояния организма. Экспозиционная доза до 50-80 Р, полученная за первые четверо суток, не вызывает поражения и потери трудоспособности у людей, за исключением некоторых изменений крови. Экспозиционная доза в 200-300 Р, полученная за короткий промежуток времени ( до четырех суток), может вызвать у людей средние радиационные поражения, но такая же доза, полученная в течение нескольких месяцев, не вызывает заболевания. Здоровый организм человека способен за это время частично вырабатывать новые клетки взамен погибших при облучении.
При установлении допустимых доз излучения учитывают, что облучение может быть однократным или многократным. Однократным считается облучение, полученное за первые четверо суток. Облучение, полученное за время, превышающее четверо суток, является многократным. При однократном облучении организма человека в зависимости от полученной экспозиционной дозы различают четыре степени лучевой болезни.
Лучевая болезнь первой (легкой) степени возникает при общей экспозиционной дозе излучения 100 - 200 Р. Скрытый период может продолжаться две-три недели, после чего появляется недомогание, общая слабость, чувство тяжести в голове, стеснение в груди, повышение потливости, может наблюдаться периодическое повышение температуры. В крови уменьшается содержание лейкоцитов. Лучевая болезнь первой степени излечима.
Лучевая болезнь второй (средней) степени возникает при общей экспозиционной дозе излучения 200 - 400 Р. Скрытый период длится около недели. Лучевая болезнь проявляется в более тяжелом недомогании, расстройстве функций нервной системы, головных болях, головокружениях, вначале часто бывает рвота, понос, возможно повышение температуры тела; количество лейкоцитов в крови, особенно лимфоцитов, уменьшается более чем наполовину. При активном лечении выздоровление наступает через 1,5 - 2 месяца. Возможны смертельные исходы - до 20%.
Лучевая болезнь третьей (тяжелой) степени возникает при общей экспозиционной дозе 400 - 600 Р. Скрытый период - до нескольких часов. Отмечают тяжелое общее состояние, сильные головные боли, рвоту, понос с кровянистым стулом, иногда потерю сознания или резкое возбуждение, кровоизлияния в слизистые оболочки и кожу, некроз слизистых оболочек в области десен. Количество лейкоцитов, а затем эритроцитов и тромбоцитов резко уменьшается. Ввиду ослабления защитных сил организма появляются различные инфекционные осложнения. Без лечения болезнь в 20 - 70% случаев заканчивается смертью, чаще от инфекционных осложнений или от кровотечений.
При облучении экспозиционной дозой более 600 Р развивается крайне тяжелая четвертая степень лучевой болезни, которая без лечения обычно заканчивается смертью в течение двух недель.
Лучевые болезни у животных развиваются при экспозиционных дозах: 150 - 250 Р — легкой степени, 250 - 400 Р — средней степени, 400 - 600 Р — тяжелой степени.
Радиационные повреждения. При воздушных (приземных) и наземных ядерных взрывах плотности потоков (дозы) проникающей радиации на тех расстояниях, где ударная волна выводит из строя здания, сооружения, оборудование и другие элементы производства, в большинстве случаев для объектов являются безопасными. Но с увеличением высоты взрыва все большее значение в поражении объектов приобретает проникающая радиация. При взрывах на больших высотах и в космосе основным поражающим фактором становится импульс проникающей радиации.
Проникающая радиация может вызывать обратимые и необратимые изменения в материалах, элементах радиотехнической, электротехнической, оптической и другой аппаратуры. В космическом пространстве эти повреждения могут наблюдаться на расстояниях десятков и сотен километров.
Необратимые изменения в материалах вызываются нарушениями структуры кристаллической решетки вещества вследствие возникновения дефектов (в неорганических и полупроводниковых материалах), а также в результате прохождения различных физико-химических процессов. Такими процессами являются: радиационный нагрев, происходящий вследствие преобразования поглощенной энергии проникающей радиации в тепловую; окислительные химические реакции, приводящие к окислению контактов и поверхностей электродов; деструкция и “сшивание” молекул в полимерных материалах, приводящие к изменению физико-механических и электрических параметров; газовыделения и образование пылеобразных продуктов, которые могут вызвать вторичные факторы воздействия (взрывы в замкнутых объемах, запыление отдельных деталей приборов и т.д.). В результате радиационного захвата нейтронов возможно образование примесей радиоактивных веществ. В процессе распада образовавшихся радиоактивных ядер происходит радиационное излучение, которое может оказывать воздействие на электрические параметры элементов и схем, а также затруднять ремонт и эксплуатацию аппаратуры. Наиболее опасны по вторичному излучению изделия, изготовленные из материалов, содержащих бор, марганец, кадмий, индий, серебро и др.
Обратимые изменения, как правило, являются следствием ионизации материалов и окружающей среды. Они проявляются в увеличении концентрации носителей тока, что приводит к возрастанию утечки тока, снижению сопротивления в изоляционных, полупроводниковых, проводящих материалах и газовых промежутках. Обратимые изменения в материалах, элементах и аппаратуре в целом могут возникать при мощностях экспозиционных доз 1000 Р/с. Проводимость воздушных промежутков и диэлектрических материалов начинает существенно увеличиваться при мощностях доз 10 000 Р/с и более.
Проникающая радиация, проходя через различные среды (материалы), ослабляется. Степень ослабления зависит от свойств материалов и толщины защитного слоя. Нейтроны ослабляются в основном за счет столкновения с ядрами атомов. Вероятность процессов взаимодействия нейтронов с ядрами количественно характеризуется эффективным сечением взаимодействия и зависит главным образом от энергии нейтронов и природы ядер мишени.
Энергия гамма-квантов при прохождении их через вещества расходуется в основном на взаимодействие с электронами атомов. Поэтому степень их ослабления практически обратно пропорциональна плотности материала.
Защитные свойства материалов характеризуются слоем половинного ослабления, при прохождении которого интенсивность гамма-лучей или нейтронов уменьшается в два раза.
Если защитная преграда состоит из нескольких слоев разлмчных материалов, например грунта, бетона и дерева, то подсчитывают степень ослабления для каждого слоя в отдельности и результаты перемножают:
К = 2 h/dпол; Косл = К1 * К2 * ... * Кn
где К - коэффициент ослабления одного защитного слоя преграды (материала); Косл - общий коэффициент защиты преграды, состоящей из n-го количества слоев различных материалов; h - толщина слоя материала; dпол - толщина слоя материала, ослабляющего излучение в два раза, см.
Толщина слоя половинного ослабления для нейтронного излучения определяется по справочным данным, для гамма-излучения может быть вычислена по плотности материала:
dпол = 23 / ?
где ? - плотность материала, г/см3; 23 см - слой воды (плотность 1 г/см3), ослабляющей гамма-излучения в два раза.
Защитные сооружения ГО надежно обеспечивают защиту людей от проникающей радиации. Расчет защитных свойств этих сооружений производится по гамма-излучению, так как доза гамма-излучения значительно выше дозы нейтронного излучения, а слои половинного ослабления для строительных материалов приблизительно одинаковы.
На объектах, оснащенных электронной, электротехнической и оптической аппаратурой, следует предусматривать меры по защите этой аппаратуры от воздействия проникающей радиации. Повышение радиационной стойкости аппаратуры может быть достигнуто путем:
* применения радиационностойких материалов и элементов;
* создания схем малокритичных к изменениям электрических параметров элементов, компенсирующих и отводящих дополнительные токи, выключающих отдельные блоки и элементы на период воздействия ионизирующих излучений;
* увеличения расстояния между элементами, находящимися под электрической нагрузкой, снижения рабочих напряжений на них;
* регулирования тепловых, электрических и других нагрузок;
* применения различного рода заливок, не проводящих ток при облучении;
* размещения на объектах специальных защитных экранов или использования элементов конструкций объекта для ослабления действия ионизирующих излучений на менее радиационностойкие детали.
Определение режимов защиты. Под режимом защиты понимается порядок применения средств и способов защиты людей, предусматривающий максимальное уменьшение возможных экспозиционных доз излучения и наиболее целесообразные их действия в зоне радиоактивного заражения.
Режимы защиты для различных уровней радиации и условий производственной деятельности, пользуясь расчетными формулами, определяют заранее, т.е. до радиоактивного заражения территории.
Определение допустимой продолжительности пребывания людей на зараженной местности:
5Pвхtвх - 5Pвыхtвых
D = ————————— ? Dзад ;
Косл
Рвых = Рвх (tвых/tвх)-1,2 ; tвых = tвх + T ,
получаем зависимость:
Dзад * Kосл
T = f (——————; tвх)
Pвх
где Dзад - заданная экспозиционная доза излучения; Pвх - уровень радиации к моменту входа на зараженный участок; tвх и tвых - время, прошедшее после взрыва до момента входа и выхода соответственно; T - продолжительность облучения. На основании этой зависимости составляют различного рода таблицы.
Например, для рабочих и служащих, использующих для защиты убежища с коэффициентом ослабления Косл ? 1000 при уровне радиации через 1 ч после взрыва 240 Р/ч соответствует режим защиты, согласно которому работы на объектах прекращаются и люди находятся в убежищах 6 ч. По истечении 6 ч работа восстанавливается и продолжается посменно.
Для облегчения решения задач по оценке радиационной обстановки для уровней радиации от десятков до тысяч рентген в час разрабатываются возможные режимы проведения работ для каждого объекта, которые оформляют в виде таблиц и графиков и используют их для принятия решений в условиях заражения.
3.2. Автоматизированная система по курсу «Экология и охрана труда»
3.2.1. Постановка задачи и ее спецификации
В процессе труда человек подвергается воздействию большого числа факторов, различных по своей природе и характеру воздействия, которые влияют на его здоровье и работоспособность. Обязательным условием для сохранения здоровья работающих и обеспечения высокой производительности труда является соответствие трудовой деятельности свойствам и возможностям человека, исключение воздействия опасных и вредных производственных факторов. Это достигается при помощи систем законодательных актов, социально - экономических, организационных, технических и профилактических мероприятий и средств охраны труда (ОТ).
ОТ - это система законных актов, мероприятий и средств, обеспечивающих безопасность, сохранение здоровья и работоспособности человека в процессе труда.
Основная задача обучения в высших учебных заведениях по курсу ОТ - дать студентам теоретическую основу для осуществления мероприятий ОТ на объектах народного хозяйства. Компьютеризация всех сфер народного хозяйства предоставляет широкие возможности по использованию средств вычислительной техники в сфере обучения и, в частности, на кафедре "Охрана труда". Возникает потребность в разработке АРС (Автоматизированной расчетной системы), одним из возможных применений которой является использование ее студентами при выполнении лабораторных работ по курсу "Охрана труда". Предполагается, что студент предварительно знакомиться со справочной информацией по работе, получая необходимые сведения о цели работы, составе входных и выходных параметров, а также о методике расчета. После этого студент производит необходимые измерения и вводит данные в систему, которая выдает рассчитанные значения параметров.
Другим важным применением АРС является ее использование сотрудниками отделов ОТ предприятий, которые получают возможность делать необходимые расчеты по предложенным методикам, с которыми они могут ознакомиться, используя справочную информацию, предлагаемую АРС. Выполняемые ранее человеком сложные расчеты, часто включающие в себя вычисление интегралов, логарифмов, использование метода наименьших квадратов, берет на себя АРС. Это не только облегчает работу сотрудников отделов ОТ, но и предотвращает возможное появление ошибок. Кроме того, при расчетах часто используется информация, получаемая из справочных таблиц, АРС содержит многие из них внутри себя, что устраняет необходимость искать необходимые данные в многотомных справочниках. При разработке такой АРС важное значение приобретает тот факт, что система ориентирована на пользователей, имеющих в большинстве своем чрезвычайно небольшой опыт обращения с ЭВМ. Это приводит к необходимости создания развернутой системы помощи, которая в каждый момент времени давала бы пользователю необходимые сведения о возможных действиях. Кроме того, должна быть обеспечена проверка введенных пользователем данных, чтобы не возникло сбоев системы. Вообще, система должна корректно реагировать на любое действие пользователя, например, выполнять требуемое действие или выдавать сообщение об ошибке, в противном случае пользователь перестанет понимать, что он должен делать, что в конечном итоге приведет к отказу от использования системы.
Состав и содержание расчетов, составляющих АРС "Охрана труда", определялись в соответствии с консультациями, получаемыми на кафедре "Охрана труда". Состав работ выбирался, исходя из анализа проблем, стоящих перед некоторым промышленным предприятием, и сравнительной сложности расчетов.
АОС представляет собой комплекс однотипных программ для ЭВМ IBM PC AT 286. Каждая программа обеспечивает расчет и моделирование зависимостей выходных параметров соответствующего оборудования от входных.
Работа с системой предполагает выполнение студентами ряда лабораторных работ с использованием этих программ (темы работ соответствуют названиям программ). Для каждой лабораторной работы членами группы написаны методические указания.
3.2.1.1. Постановка задачи оценки степени загрязнения атмосферы выбросами из низких источников
При проектировании промышленных предприятий требуется в соответствии с санитарными нормами проводить расчет возможного загрязнения атмосферного воздуха вентиляционными и технологическими выбросами. Расчет проводят с целью проверки эффективности предусмотренных проектом мероприятий по обеспечению чистоты атмосферного воздуха населенных пунктов, а также воздуха на площадках предприятий у приемных отверстий систем вентиляции и кондиционирования воздуха и у аэрационных приточных проемов. Полученные расчетом концентрации вредных веществ в атмосферном воздухе населенных пунктов не должны превышать максимальных разовых концентраций, а в воздухе, поступающем внутрь зданий и сооружений через приемные отверстия систем вентиляции и кондиционирования воздуха и через аэрационные проемы, - 30% предельно допустимых концентраций (Спдк) этих веществ в рабочей зоне производственных помещений. При превышении этих пределов следует разработать дополнительные мероприятия по снижению уровня загрязнения, например предусмотреть повышение эффективности очистных устройств, сооружение новых газоочистных установок, совершенствование отдельных технологических узлов и установок, увеличение высоты труб, уменьшение выбросов соседних предприятий. Степень загрязнения наружного воздуха, определенная расчетным путем, будет соответствовать действительному состоянию воздуха только в том случае, если при расчете использованы достоверные данные, учитывающие весь комплекс одновременно действующих источников выделения вредных веществ, а также существующий фон загрязнения.
3.2.2. Обоснование проектных решений
Как отмечено в постановке задачи, АРС по ОТ рассчитана на непрофессионального пользователя, поэтому особенностью системы является простота использования АРС. Ввод данных, получение результатов и получение справочной информации осуществляется в диалоговом режиме с использованием системы меню.
При входе в систему пользователь получает возможность выбирать из главного меню одну из следующих альтернатив:
* получить меню для выбора одной из работ для выполнения;
* закончить работу в АРС.
* ввести исходные данные
* провести расчет
* посмотреть сгенерированный расчет
Таким образом, основным эффектом разработанной АРС является освобождение пользователя от трудоемких расчетов.
Для обеспечения работы программы необходимы следующие программные и технические средства:
- IBM PC AT 286 или совместимая ПЭВМ;
- объем оперативной памяти не менее 640 К;
- требуется наличие свободного места на жестком диске не менее 3Мб;
- операционная среда MS-DOS 5.0 и выше.
Тексты программы приведены в Приложении 5.
3.2.2.1. Математическая модель определения степени загрязнения атмосферы
3.2.2.1.1. Обозначения используемые при построении математической модели
С, Сх, Су концентрация вредных веществ в наружном воздухе, мг/м3;
М - количество вредных веществ, выбрасываемых источником в атмосферу, мг/с;
k - безразмерный коэффициент, учитывающий влияние возвышения устья источника на уровень загрязнения ;
v - расчетная скорость ветра, принимаемая по рекомендации Главного санитарно-эпидемиологического управления равной 1м/с;
Нзд - высота здания от поверхности земли до его крыши при плоской кровле, до конька крыши при двускатной кровле, до верха карниза фонаря при продольных фонарях, расположенных ближе 3 м от наветренной стены здания, м;
1 - длина здания (размер, перпендикулярный направлению ветра), м;
b - ширина здания (размер вдоль направления ветра), м;
х - расстояние от заветренной стены здания до точки, в которой определяется концентрация, м;
S, S1, S2, S3, S4 - вспомогательная безразмерная величина, позволяющая определять концентрации вредных веществ на расстоянии у, м, по перпендикуляру от оси факела выброса из точечных источников;
b1 - расстояние в пределах крыши широкого здания от его наветренной стороны до точки, в которой определяется концентрация, м;
b2 - расстояние в пределах крыши широкого здания от источника до точки, в которой определяется концентрация, м;
L - количество газовоздушной смеси, выбрасываемой из источника м3/с;
m - безразмерный коэффициент, показывающий какое количество выделяемых источником примесей участвует в загрязнении циркуляционных зон;
b3 - расстояние в пределах крыши широкого здания от источника до заветренной стены здания, м; - относительная высота здания, равная
(Н-1,8Нзд)/(Нгр-1,8Нзд)
при расположении устья источника вне единой или межкорпусной зоны узкого здания и над наветренной зоной широкого здания и равная
(Н-Нзд)/(Нгр-Нзд)
при расположении устья источника вне наветренной, над заветренной или над межкорпусной зоной широкого здания;
Нгр - предельная высота низких источников, м;
X1 - расстояние между зданиями.
3.2.2.1.2 Область применения расчетных формул
При расчете степени загрязнения, решении различных вопросов по сокращению выбросов и выборе мест расположения приемных отверстий систем вентиляции и кондиционирования воздуха необходимо учитывать возникновение вблизи зданий при обтекании их воздушным потоком циркуляционных (замкнутых плохо проветриваемых) зон. При обтекании воздушным потоком узкого здания над и за ним возникает единая циркуляционная зона, распространяющаяся от заветренной стены здания на расстояние шесть его высот (6 Нзд). Высота этой зоны в среднем составляет 1,8 Нзд. При обтекании воздушным потоком широкого здания над ним возникает наветренная циркуляционная зона длиной 2,5 Нзд и высотой 0,8 Нзд, а за ним - заветренная циркуляционная зона длиной 4 Нзд и высотой около Нзд. При обтекании воздушным потоком группы зданий между двумя смежными зданиями возникает межкорпусная циркуляционная зона длиной до 10 Нзд, если первое по потоку здание узкое и до 8 Нзд, если первое по потоку здание широкое. При больших межкорпусных расстояниях здания можно рассматривать как отдельно стоящие.
Источники вредных веществ, загрязняющие циркуляционные зоны зданий, следует относить к низким.
Граничное положение устья источника, до которого он действует как низкий, находят по формулам:
для узкого отдельно стоящего здания
Нгр = 0.36b3+2.5Нзд , (3.1)
для широкого отдельно стоящего здания
Нгр = 0.36b3+1.7Нзд , (3.2)
для группы зданий
Нгр = 0.36(bз+x1)+Нзд , (3.3)
где bз - расстояние от источника, расположенного в пределах крыши, до заветренной стены здания.
Источники, выбрасывающие вредные вещества на высоте, превышающей Нгр и не загрязняющие циркуляционные зоны над и за зданием, следует относить к высоким.
Загрязнение, создаваемое низкими источниками, рассчитывают в соответствии с "Руководством по расчету загрязнения воздуха на промышленных площадках", разработанным ЦНИИПромзданий и ВЦНИИОТ в 1975 г.
3.2.2.1.3. Расчетные формулы для выбросов из низких источников
Формулы для расчета концентраций вредных веществ в наружном воздухе при загрязнении его выбросами из низких источников выбирают в зависимости от вида здания (узкое или широкое отдельно стоящее, группа зданий), вида источника (точечный или линейный), места расположения устья источника и места определения концентраций.
Узкое отдельно стоящее
В единой циркуляционной зоне или над ней.
В единой циркуляционной зоне при 0<х<6Нэд
;
; (3.4 a)
;
Вне циркуляционной зоны за зданием при х>6Нзд
;
; (3.4 б)
.
Широкое отдельно стоящее
На крыше в наветренной циркуляционной зоне при b12,5Hзд
; (3.5 a)
;
На крыше вне наветренной циркуляционной зоны при b12,5Hзд
;
; (3.5 б)
.
В заветренной циркуляционной зоне при 0<х4Нзд
;
; (3.5 в)
;
Вне заветренной циркуляционной зоны за зданием при x>4Нзд
;
; (3.5 г)
Вне наваренной циркуляционной зоны над крышей при <0,3.
На крыше вне наветренной циркуляционной зоны при b1>2,5H~
;
; (3.6 а)
;
В заветренной циркуляционной зоне при 0<х<4Нзд
;
; (3.6 б)
;
Вне заветренной циркуляционной зоны за зданием при х>4Нзд
;
; (3.6 в)
;
Вне наветренной циркуляционной зоны над крышей при >0,3
На крыше вне наветренной циркуляционной зоны при b12,8(Н-Нзд)
и у<(Н-Hзд)
;
; (3.7 а)
В заветренной циркуляционной зоне при 0<х<4Нэд
;
; (3.7 б)
;
Вне заветренной циркуляционной зоны за зданием при х>4Нзд
;
; (3.7 в)
;
В заветренной циркуляционной зоне или над ней.
В заветренной циркуляционной зоне при 0<х4Нзд
;
; (3.8 а)
;
Вне заверенной циркуляционной зоны за зданием при х>4Нзд
;
; (3.8 б)
;
Группа зданий
В наветренной циркуляционной зоне первого по потоку широкого здания
В межкорпусной циркуляционной зоне при Нзд
; (3.9 а)
;
В межкорпусной циркуляционной зоне при 4Нзд
; (3.9 б)
;
Вне наветренной циркуляционной зоны первого по потоку широкого здания на крыше при <0,3
В межкорпусной циркуляционной зоне при Нзд
; (3.10 а)
В межкорпусной циркуляционной зоне при 4Нзд
; (3.10 б)
;
Вне наветренной циркуляционной зоны первого по потоку широкого здания на крыше при >0,3
В межкорпусной циркуляционной зоне при Нзд
;
В межкорпусной циркуляционной зоне при 4Нзд
;
В межкорпусной циркуляционной зоне при первом по потоку широком здании и <0,3
В межкорпусной циркуляционной зоне при Нзд
; (3.12 а)
;
В межкорпусной циркуляционной зоне при 4Нзд
; (3.12 б)
;
Над межкорпусной циркуляционной зоной при первом по потоку широком здании и >0,3
В межкорпусной циркуляционной зоне при Нзд
;
В межкорпусной циркуляционной зоне при 4Нзд
;
В межкорпусной циркуляционной зоне или над ней при первом по потоку узком здании
В межкорпусной циркуляционной зоне при Нзд
; (3.14 а)
;
В межкорпусной циркуляционной зоне при 6Нэд<Х1<10Нзд
;
; (3.14 б)
;
За расчетное принимают направление ветра, перпендикулярное продольной стороне здания.
При действии линейных источников (аэрационных фонарей, ряда близко расположенных шахт и труб) концентрации вредных веществ в единой, заветренной или межкорпусной циркуляционной зоне достаточно рассчитать для любой точки зоны, так как они одинаковы в пределах каждой зоны.
При действии точечных источников концентрации вредных веществ рассчитывают на оси их факела x, где они будут наибольшими.
Понижающие коэффициенты S, S1, S2, S3 и S4, вводимые при выборе мест воздухозаборов и решении других задач, связанных с определением концентраций, подсчитывают по формулам:
;
;
; (3.15)
;
;
При расчете концентрации вредных веществ за вторым и последующими зданиями по направлению ветра поступление вредных веществ определяют с учетом расстояния x по оси факела и расстояния у, перпендикулярного оси факела.
3.3 Автоматизированная обучающая система по курсу экономики
3.3.1 Постановка задачи и ее спецификация
Разрабатываемый модуль должен обеспечивать расчет одной из следующих неизвестных величин:
1) Приведенная стоимость;
2) Наращенная стоимость;
3) Длина интервала наращения;
4) Эффективная годовая ставка;
5) Интенсивность роста;
6) Коэффициента дисконтирования;
7) Коэффициента наращения.
Необходимо обеспечить удобство работы с программой пользователю, не являющемуся программистом. Модуль также должен удовлетворять требованиям, предъявленным при интегрировании его в состав целостного продукта.
Обучение пользователя желательно проводить на рабочих местах, что позволяет снизить затраты и повысить эффективность обучения и контроля. Наиболее удобным в этом случае является использование ПЭВМ, установленных на рабочих местах обучаемых. В настоящее время ПЭВМ все шире используется в самых различных областях человеческой деятельности. Это привело к тому, что большинство государственных предприятий и частных фирм имеют в своем распоряжении рабочие места с установленными на них ПЭВМ. За использование ПЭВМ также говорит и то, что малые ЭВМ серии СМ, которые также можно рассматривать в качестве технического средства для реализации, не удовлетворяют пользователя по скорости работы и отсутствию удобства в интерфейсе. С другой стороны, использование больших супер-ЭВМ, обладающих высокой скоростью обработки данных, также является нецелесообразным из-за дефицита машинного времени и вычислительных ресурсов, разделяемых между задачами большой важности и срочности.
Кроме того, следует принять во внимание психологический аспект использования персональных ЭВМ, находящихся в подразделениях, особенно человеком, по роду профессиональных занятий не связанному с вычислительной техникой, гораздо проще, чем посещение занятий на специализированном стенде, где техника отделена от пользователя и общение с ней происходит через операторов и системных программистов.
По мнению разработчиков, сказанное выше является достаточным основанием для выбора профессиональной ПЭВМ в качества аппаратных средств. Это позволяет реализовать диалоговый режим реального времени, работу с цветными панелями и меню, использование звуковых эффектов и тому подобное.
Также в соответствии с требованиями к системе, изложенными выше, были выбраны и программные средства для разработки системы. Было решено проводить разработку в системе MSM Workstation 2.0 Пользовательский диалог в стиле Windows знаком многим пользователям ПЭВМ, удобен в работе , требует распространенной среды MS Windows, не требует для своей работы мощных аппаратных средств.
Более подробно требования к аппаратным средствам сформулированы ниже:
- персональная ЭВМ, совместимая с IBM PC AT с тактовой частотой процессора не ниже 40 МГц;
- наличие цветного графического адаптера VGA;
- оперативная память не менее 16 МБайт;
- наличие операционной системы MS Windows 95 и выше.
- наличие жесткого диска и дисководов для 3.5” флоппи-дисков.
3.3.2. Обоснование проектных решений
3.3.2.1. Анализ при постоянной интенсивности наращения
Модель непрерывного начисления процентов
В банковской практике — особенно при электронных методах производства и регистрации финансовых операций - проценты могут начисляться за 1 сутки или даже за несколько часов. Например, коммерческий банк, находящийся в Москве, может одолжить определенную сумму денег банку, находящемуся во Владивостоке, на 12 часов — с 20 часов сегодняшнего дня до 8 часов следующего дня по московскому времени. За счет разницы во времени владивостокский банк может добавить эти деньги к своему фонду краткосрочных ссуд, а затем вернуть долг с определенным процентом (или долями процента) к началу работы московского банка. Очевидно, что в этом и другом аналогичных случаях возникает задача начисления процентов за очень малые промежутки времени, т.е. по существу речь идет о непрерывном начислении процентов и их непрерывной капитализации.
При анализе инвестиций также возникает аналогичная задача, поскольку многие производственные и экономические процессы непрерывны по своей природе и такой же должна быть соответствующая им финансовая модель. В главах 1 и 2 мы построили несколько моделей начисления процентов приразличной длине периода начисления (конверсионного периода) — от 1 дня до 1 года. Устремляя длину периода начисления к 0, построим теперь математическую модель непрерывного начисления процентов, рассмотрим способы практического применения непрерывной модели, а также сравним результаты дискретного и непрерывного начисления процентов. Для краткости иногда говорят "непрерывные проценты" , имея в виду непрерывное начисление и капитализацию процентов, т.е. бесконечно малый период начисления.
Постоянная интенсивность наращения
Примем за базовый период 1 год и обозначим целое число периодов начисления за год через т, а длину периода начисления через h = 1/т лет, m = 1,2,3,... . Тогда — соответствующая положительная годовая ставка, и в силу формулы она связана с эффективной годовой ставкой — — соотношением
Для простоты обозначим i — номинальная процентная ставка за один период начисления длиной h лет. Тогда из при h = m = 1 получаем
Для практики эффективную годовую ставку удобнее обозначать просто i.
Сделаем небольшое математическое пояснение. Для этого запишем коэффициент А(h) наращения эа любой период
(t, t + h) длиной h = 1/m на рассматриваемом интервале (О, T) в виде
Поскольку h мало, то различие между простыми и сложными процентами пренебрежимо мало. Так как A(0)=1, то
— приращение 1 ден. ед. за малое время h (рис. 9.1, где h и т измеряются в годах).
Если А(т) дифференцируема в точке 0 справа, то
где g — угол наклона касательной к А(т) в точке т = 0.
Из определения рассматриваемых ставок и результатов п. 2 § 8 следует, что если эффективная ставка i фиксирована, то номинальная ставка , при т —> и h = 1/т —> О монотонно убывает, оставаясь положительной. Поэтому у существует положительное предельное значение, которое мы обозначим через:
ОПРЕДЕЛЕНИЕ. Предел 6 номинальной ставки при т —> называется силой роста или интенсивностью наращения за год при непрерывном начислении процентов. Величину 8 можно назвать также номинальной годовой ставкой при непрерывном начислении процентов.
ТЕОРЕМА 3.1. Эффективная годовая ставка i и номинальная годовая ставка связаны соотношением
Доказательство. В курсе "Алгебра и начала анализа" доказывается, что
е = 2,718282 ... — замечательное число Эйлера (основание натуральных логарифмов). Поэтому в нашем случае
СЛЕДСТВИЕ.
Справедлива и следующая двойственная к теореме 3.1
ТЕОРЕМА 9.2. Эффективная годовая ставка d дисконтирования и номинальная годовая ставка связаны соотношением
Для доказательства достаточно перейти к пределу в (3.7) при, использовав при этом вышеприведенные формулы.
Формула (3.6) и соотношение и (3.2) позволяют составить табл. 3.1, иллюстрирующую связь для нескольких значений i от 0,01 до 2) и при малых 1 до 0,10 достаточно близки. Однако с ростом 1" различие между тремя эквивалентными ставками быстро растет.
Таблица 3.1
D
G
I
0,00990
0,00995
0,01
0,04761
0,04879
0,05
0,09091
0,09531
0,10
0,16667
0,18232
0,20
0,20000
0,22314
0,25
0,33333
0,40547
0,50
0,42857
0,55962
0,75
0,50000
0,69315
1,00
Пример 3.1. Найдем наращенное за 5 лет значение суммы S(0)=10 руб., если оно реинвестируется по постоянной ставке = 25% при следующих значениях m:
а) 1 раз в год,
б) 2 раза в год,
в) непрерывно.
г) Вычислим g для непрерывного начисления процентов.
Пример 3.2. Найдем коэффициент наращения A(т) за т = 1 год при реинвестировании по постоянной ставке = 1 ежегодно, ежеквартально, ежемесячно, ежечасно ежеминутно и непрерывно. Вычислим для каждого из случаев.
Таблица 3.2
Период начисления
m
A(1)=(1+1/m)m
iэф = A(1)-1
Ежегодное
Ежеквартальное
Ежемесячное
Ежедневное
Ежечасное
Ежеминутное
Непрерывное
1
4
12
360
8640
518400
(1+1/1)1 =2
(1+1/4)4 =2,441406
(1+1/12)12 =2,613035
(1+1/360)360 =2,714516
(1+1/8640)8640 =2,718125
(1+1/518400)51840=2,718276
e=2,718282
1
1,441406
1,613035
1,714516
1,718125
1,718276
1,718282
Функциональная связь между любыми парами из основных параметров
В зависимости от условий задачи может оказаться удобным принять один из четырех основных параметров , i, v и d за исходный и выразить через него значения трех остальных. В табл. 3.3 объединены ранее полученные соотношения.
Каждая строка этой таблицы показывает, как параметр, стоящий в обозначении этой строки, выражается через три остальные. Каждый столбец таблицы показывает, как через параметр, стоящий в обозначении этого столбца, выражаются три остальные.
Приближенная связь между основными параметрами
Из теории рядов известно, что при малых х с точностью до членов третьего порядка малости включительно
Подставляя первую из этих формул в (3.4), а вторую — в (3.6) и пренебрегая членами третьего порядка, получим, что при i или не более 0,10-0,20 можно пользоваться приближенными соотношениями: Аналогичным образом из формулы для суммы бесконечного числа членов сходящейся прогрессии следует, что при малых i
Этими приближенными формулами можно пользоваться для ориентировочных расчетов. Однако в финансовой практике надо пользоваться калькулятором или таблицами даже при малых i и
Коэффициенты наращения и дисконтирования при непрерывном наращении процентов
Предположим, что в настоящий момент tо производится инвестиция в сумме S(tо) по постоянной эффективной годовой ставке i. Тогда в силу формулы (3.5) для сложных процентов наращенная к моменту t = tо + т сумма АV1 составит
где время измеряется в годах, а i и g = ln(1+i) — десятичные дроби.
Если же нам предстоит в будущий момент t > tо уплатить или получить сумму S(t), то ее современная приведенная стоимость РV в настоящий момент tо составит
Итак, нами доказана следующая важная
ТЕОРЕМА 3.3. При постоянной эффективной годовой ставке i к номинальной годовой ставке = ln(1 + i) коэффициент наращения зависит лишь от длины т интервала наращения, измеренной в годах, и составляет
Коэффициент дисконтирования за т лет равен
Заметим теперь, что А(т) — коэффициент наращения 1 ден. ед. на интервале (tо, tо + т} при движении по этому интервалу слева направо, т.е. в положительном направлении.
Равенство
можно интерпретировать как отрицательное наращение, совпадающее с дисконтированием, поскольку движение по интервалу (t, t + т) происходит справа налево, т.е. в отрицательном направлении. Аналогичным образом интерпретируется равенство
Следовательно, в рассматриваемом случае коэффициенты наращения и дисконтирования взаимозаменяемы и с математической точки зрения можно было бы пользоваться только одним из них. Однако для наглядности удобнее пользоваться двумя коэффициентами в соответствии с прямым содержательным смыслом каждого из них.
Таким образом, как при дискретном, так и при непрерывном начислении сложных процентов справедливо фундаментальное соотношение
В частности, при т = 1 получаем из (9.13)-(9.15) ранее установленные соотношения
Заметим теперь, что если функцию е задать на интервале то (рис. 9.2) при т > 0 она совпадает с А(т), а при т < 0 — с v(т):
При этом А'{0) = — интенсивность наращения за базовую единицу времени.
Пример 3.3. Сумма 2000 долл. положена в банк под схему непрерывного начисления процентов с постоянной интенсивностью роста = 10% за год. Найдем наращенную в конце года t сумму S(t) при t= 1, 2, 3, 5 и 10.
Решение. Здесь S(t) = 2000е , и ответ содержится в табл. 3.4.
Таблица 3.4
t, лет
0
1
2
3
5
10
S(t), $
2000
2210,34
2442,81
2699,72
3297,44
5436,56
Пример 3.5. Заемщик В должен уплатить кредитору А
по векселю
1000 долл. на 01.01.96,
2500 долл. на 01.01.97,
3000 долл. на 01.07.97.
Найдем современную стоимость долга С(t) на моменты:
а) 01.01.94 и б) 01.04.95 при = 0,06 за год.
3.3.2.2. Анализ при переменной интенсивности наращения
Описание модели и основная теорема
В настоящее время в мире действует много электронных бирж, связанных в единую мирону ю систему с несколькими центрами — в Нью-Иорке, Лондоне, Франкфурте и Токио. По существу, финансовые операции производятся круглые сутки, много раз за одну секунду. Поэтому даже за минуту на электронной бирже происходят колебания взаимных курсов основных валют, акций, облигаций и т.д. Эти колебания обычно небольшие, но наряду с интервалами относительной стабильности могут появляться и интервалы с устойчивой тенденцией к понижению (отрицательный тренд) или повышению (положительный трена) курса тех или иных денежных инструментов, а иногда происходят скачки курса. Возникает много сложных и интересных проблем, связанных с анализом и прогнозированием курса валют и связанных с ним курсов ценных бумаг. Все это оказывает влияние и на процентные ставки по обыкновенным вкладам и депозитам, которые также изменяются, хотя и не так часто, как валютный курс.
В качестве примера на рис. 10.1 приводится график среднемесячного дохода в процентах по вкладам в облагаемые налогами взаимные фонды денежного рынка США за 1975-1986 гг., заимствованный из [7]. Взаимные фонды денежного рынка (рис. 10.2) распределяют доходы от своих активов среди акционеров. Поэтому доходы акционеров увеличиваются или уменьшаются в зависимости от изменения годовых процентных ставок на краткосрочные ценные бумаги, в которые взаимные фонды вкладывают свои средства.
Период бурного роста активов взаимных фондов (от менее 10 млрд. долл. в 1974 г. до более 200 млрд. долл. в 1981 г., см. рис. 10.2) связан с резким подъемом до 12-16% ставок годового дохода в конце 70-х — начале 80-х годов.
Поэтому необходимо иметь аналитическую модель, в которой 6 и, следовательно, все другие процентные ставки зависят от времени. С этой целью рассмотрим коэффициент А(t, t + h) наращения на интервале (t, t + h) и примем
Здесь ih(t) — мгновенное значение в момент t годовой номинальной процентной ставки, которая зависит не только от
длины Д интервала наращения, но и от момента t его начала. Поэтому коэффициент наращения А(t, t + h) также зависит теперь не только от hг, но и от t. Примем, что при всех t в рассматриваемом интервале существует предел
где (t) — мгновенное значение интенсивности роста за базовую единицу времени (обычно 1 год) в момент t. Из (3.12), (3.12) следует, что
Здесь означает производную по второму аргументу функции A(t, w) в точке w = t при произвольном, но фиксированном t.
Можно доказать, что справедлива следующая фундаментальная теорема.
ТЕОРЕМА 3.11. Примем, что (t) и А(tо,t) — непрерывные функция времени при и что в этом интервале выполняется принцип стабильности рынка. (4.7).
3.3.3 Разработка программной документации
Анализ непрерывного начисления процентов и непрерывного дисконтирования включает следующие блоки:
Расчет параметров непрерывного начисления процентов и непрерывного дисконтирования;
3.3.4. Результаты опытной эксплуатации игры и технические предложения по ее развитию
Модуль анализа непрерывного начисления процентов и непрерывного дисконтирования был разработан в полном объеме и отлажен по тестовым примерам расчетов.
Также по итогам опытной эксплуатации модуля разработчиками были сформулированы технические предложения по развитию системы, представленные ниже.
Программный комплекс должен в будущем создаваться совместными усилиями всех студентов, что объясняется схожими потребностями будь то предприятие, общественная организация, медицинское учреждение или учебное заведение, а также пожеланиями консультанта.
Структура программного комплекса должна определяться требованиями Заказчика, спецификой предметной области и задачами, которые должен решать этот программный комплекс, в том числе:
- представлять теоретические сведения;
- в интерактивном режиме запрашивать необходимые исходные данные, производить расчеты и немедленно выводить результаты, что позволит изменяя значения параметров, определять зависимости;
- создать "дружественную" среду работающему пользователю, оставляя возможность в любой момент прекратить сеанс диалога с программой, предлагая производить необходимые действия в удобной для того форме, блокируя неразрешенные манипуляции, сопровождая работу постоянной помощью в виде подсказок и меню.
Одни из выше перечисленных функций должны быть реализованы отдельными программными модулями, другие реализуются параллельно другими модулями.
С учетом вышесказанного структура предполагает наличие следующих компонент:
- модуль главного меню;
- модуль ввода параметров системы;
- модуль расчета непрерывного начисления процентов и непрерывного дисконтирования;
- модуль вывода расчетных значений;
- модуль работы с выходными данными в аналитическом виде;
Резюмируя вышесказанное, подведем итоги. Итак, в данной главе проекта содержатся описания разработок прикладных программных систем по курсам «Гражданская оборона», “Экология и охрана труда» и «Экономика», выполненных по заданиям соответствующих кафедр МИРЭА. Эти задания выполнены коллективом студентов дополнительно к основной работе - МО автоматизированной системы документооборота учереждения.
Перечисленные системы предназначены для использования в учебных целях - для выполнения лабораторных и практических работ по обучению, например для оценки последствий вторичных поражающих факторов ядерных взрывов или исследований загрязнения атмосферы.
СПИСОК ЛИТЕРАТУРЫ
1. G. Salton. Automatic Text Processing. Addison-Wesley Publishing Company, Inc., Reading, MA, 1989.
2. G. Salton, J. Allan, and C. Buckley. Automatic structuring and retrieval of large text files. Communications of the ACM, 37(2):97-108, February 1994.
3. S. Deerwester, S. Dumais, G. Furnas, T. Landauer, and R. Harshman. Indexing by latent semantic analysis. Journal of the American Society for Information Science, 41(6):391--407, 1990.
4. G. Golub and C. Van Loan. Matrix Computations. Johns-Hopkins, Baltimore, Maryland, second edition, 1989
5. S. Dumais. Improving the retrieval of information from external sources. Behavior Research Methods, Instruments, & Computers, 23(2):229--236, 1991.
6. Todd A. Letsche and Michael W. Berry. Large-Scale Information Retrieval with Latent Semantic Indexing.
7. Gustavo Arocena. WebOQL: Exploiting document structure in web queries. MasterТs thesis, University of Toronto, 1997.
8. S. Abiteboul and V. Vianu. Queries and computation on the Web. In Proc. of the Int. Conf. on Database Theory (ICDT), Delphi, Greece, 1997.
9. Paolo Atzeni, Giansalvatore Mecca, and Paolo Merialdo. To weave the web. In Proc. of the Int. Conf. on Very Large Data Bases (VLDB), 1997.
10. Gustavo Arocena. WebOQL: Exploiting document structure in web queries. MasterТs thesis, University of Toronto, 1997.
ЗАКЛЮЧЕНИЕ
Данный дипломный проект на тему «Реализация функций поиска и архивации» является составной частью комплексного дипломного проекта “Математическое обеспечение автоматизированной системы документооборота учереждения”.
Комплексный дипломный проект выполнялся группой студентов в составе:
Главный конструктор – Беляев А.И-М. Тема ДП - "Общая задача документооборота".
Заместитель главного конструктора – Яковлев Д.В. Тема ДП - "МО системы обеспечения информационной безопасности".
Заместитель главного конструктора – Игнатов-Радохов Д.В. Тема ДП - КЗ "Реализация функций поиска и архивации".
Перед группой ставились следующие задачи:
1. Провести системный анализ и синтез системы.
2. Разработать математическое и программное обеспечение для КЗ "Аавтоматизированная система документооборота учереждения".
3. Разработать рекомендации по защите населения и персонала для учебного тренажера по курсу "Гражданская оборона".
4. Разработать информационное и программное обеспечение для автоматизированной обучающей системы по курсу "Экология и охрана труда".
5. Разработать и отладить программное обеспечение для системы оценки финансового состояния предприятия по курсу "Экономика".
Итак, тема предлагаемого вашему вниманию КДП - МО КЗ "Автоматизированная система документооборота учереждения".
В первой главе проведен системный анализ и синтез ситемы.
Объектом автоматизации нашей группы является Министерство Торговли Российской Федерации.
В соответствии с требованиями заказчика в рамках КДП была разработана архитектура системы, приведенная на Плакате 1.
Вторая глава ДП посвящена математическому обеспечению прикладной задачи "Реализация функций поиска и архивации".
Большая часть разработанного математического аппарата относится к решению проблемы поиска. В результате проведенного во 2-й главе данного ДП анализу существующих способов поиска и методов индексирования документов был выбран наиболее подходящий для данной задачи метод поиска по реквизитам и контексту и соответствующая ему полнотекстовая индексация с предварительной нормализацией слов. Был существенно улучшен процесс индексации, что увеличило эффективность поиска.
Несмотря на вышесказанное качество формируемого в процессе поиска индекса иногда оставляет желать лучшего. В первую очередь это обусловлено наличием большого количества специфической лексики, используемой в документах Министерства Торговли РФ. Проблему можно будет решить в будущем, используя «нечеткий поиск», который требует больших вычислительных ресурсов и в настоящее время не удовлетворяет требованиям, предъявляемым к качеству поиска, из-за чрезмерного шума в выдаваемом результате.
В рамках реализации функции архивации на основе проведенного анализа требований заказчика была выработана архитектура хранилища документов а также даны рекомендации на использование аппаратуры в рамках данной архитектуры. В процессе использовани предложенной архитектуры допускается ее последующая модификация для конкретной задачи, а также учитывая постоянно изменяющиеся требования к производительности системы.
Глава 3 посвещена разработке МО прикладных задач.
По курсу "Гражданская оборона" автором был разработан блок по выработке рекомендаций по защите от поражающих факторов ядерного взрыва.
По курсу "Экономика" автором был разработан программный модуль по непрерывному начислению процентов и непрерывному дисконтированию. Алгорим работы программы представлен на плакате 4.
По курсу "Экология и охрана труда" автором был разработан программный модуль моделирования загрязнения атмосферы из низких источников.
Результаты разработок нашли практическое применение, о чем свидетельствуют полученные акты внедрения.
Доклад закончен. Благодарю за внимание.
ПРИЛОЖЕНИЕ 1. АКТ ВНЕДРЕНИЯ
«УТВЕРЖДАЮ»
Зав. кафедрой ПО АСУ, профессор
__________ Б.Д. Залещанский
«___»_______________ 2000 г.
АКТ ВНЕДРЕНИЯ
комплексного дипломного проекта
студента группы ИП-2-94 Игнатова-Радохова Д.В.
Настоящий акт составлен консультантом по спецчасти, начальником отдела ГУП АССНаз Елизаровым О.И., в том, что результаты дипломного проекта студента Игнатова-Радохова Д.В. используются в системе документооборота Министерства Торговли Российской Федерации.
Председатель комиссии, руководитель дипломного проекта
_________ В.В. Радионов
Члены комиссии
Начальник отдела ГУП АССНаз
_________ О.И. Елизаров
Начальник НТЦ АССНаз
_________ В.К. Щеглов
_________
_________
_________
ДОКЛАД
Уважаемый председатель и члены комиссии! Вашему вниманию предлагается дипломный проект на тему «Система документооборота Министерства Торговли РФ. Реализация функций поиска и архивации информации».
Наиболее интересной в плане разработки в данном дипломном проекте является проблема реализации функции поиска. Суть проблемы в том, что, несмотря на все многообразие существующих на сегодняшний день систем управления документами, реализованные в них методы поиска не вполне удовлетворяют требованиям к поиску русскоязычных текстов. В использованном в качестве основы для построения системы документооборота программном продукте Microsoft Exchange функция поиска не приспособлена к морфологическим особенностям русского языка, поиск осуществляется недостаточно быстро.
Прежде чем говорить о решениях, предложенных и реализованных для повышения эффективности поиска, коснемся основных моментов проблемы поиска.
Проблема существует с момента возникновения первых систем управления документами. К решению проблемы применяется множество разнообразных подходов.
Рассмотрим модели поиска. Здесь существует два подхода. Первый состоит в том, что в процессе поиска вы ищете документ, который точно существует в системе, и ваша задача - свести процесс к его нахождению. Второй подход состоит в том, что вы ищете все документы, которые могут относиться к интересующему вас вопросу. Для этого подхода характерны такие термины, как полнота поиска - соответствие между найденными документами по данному запросу и действительному списку документов; шум при поиске - соотношение (соответствие) соответствующих и несоответствующих запросу документов.
Теперь о типах поиска. Существует два основных типа: атрибутивный (реквизитный), когда каждому документу присваивается набор определенных атрибутов (полей). При сохранении документа в архив поля заполняются определенными значениями, в дальнейшем при поиске проверяется совпадение значений этих полей запросу. Второй тип поиска носит название полнотекстовый. В этом случае автоматически обрабатывается все содержание, как правило предварительно проиндексированного, документа, и затем его можно найти по любому входящему в него слову. Также существует так называемый "нечеткй поиск". Данное понятие в приложении к системам управления документами связано с продуктом компании Excalibur Technologies – системой Excalibur EFS. В основе системы лежит технология так называемого "адаптивного распознавания образов", позволяющая, с точки зрения разработчиков, обеспечить эффективный поиск в распознанных документах, непрошедших трудоемкий этап выявления и исправления ошибок. Таким образом, декларируется возможность работы с документами, заведомо содержащими ошибки. На самом деле у данного метода больше минусов, чем плюсов. Системы, использующие данный метод поиска требуют больших вычислительных ресурсов, налагаются определенные требования к минимальной длине запроса, в ответе содержится слишком много шума, а значит пользователю прийдется вручную отсеивать лишние документы.
В данном дипломном проекте реализованы полнотекстовый и атрибутный поиск.
Поиск документа более полный, если в результате запроса будут найдены не только документы, которые точно соответствуют слову в запросе, но и те, в которых присутствуют различные его словоформы. Данная технология носит название нормализации. Причем эффективность поиска зависит от применяемого алгоритма. Для русского языка наиболее эффективен применяемый в данном дипломном проекте словарный метод, когда слово нормализуется на основе словарей, в которых содержатся основы слов.
Для повышения эффективности поиска в созданной системе были реализованы некоторые процедуры. Одни из них направлены на повышения скорости поиска, другие – на улучшение достоверности поиска.
Так, для повышения достоверности поиска индекс документа предварительно заполняется терминами, широко используемыми в Министерстве Торговли РФ. Это позволяет в дальнейшем эффективно распознавать эти термины, в то время как обычная система поиска как правило исказила бы их при занесении в индекс и сделала бы затруднительным поиск по данным терминам.
В качестве мер для повышения скорости поиска было предложено объеденить индексы документов в единый индекс определенного формата. Это также целесообразно с точки зрения экономии дискового пространства.
Для того чтобы подтвердить эффективность разработанного алгоритма, были проведены испытания, дающие определенное представление о скорости и качестве поиска при использовании различных средств поиска.
Для испытаний использовался ПК с процессором Pentium – 166MMX, RAM 64 Mb, HDD Quantum Fireball TM 2,1 GB и операционной системой MS Windows NT 4.0 Workstation.
Массив данных для поиска: 473 файла в 54 каталогах, общим объемом 53,5 Mb.
Испытываемые средства поиска:
Windows NT Server Explorer;
Medialingua Text Pilot (программа смыслового поиска документов "Следопыт" российской компании "Медиалингва");
"Евфрат 99", система автоматизации делопроизводства компании Cognitive Technologies.
Программа, реализующая алгоритм, предложенный в данном дипломном проекте.
Для составления запроса использовались слова "поиск", все словоформы которого содержат исходное слово и "автоматизация", не обладающее этим свойством.
Полученные результаты:
Время поиска: 30, 15, 13 и 9 секунд соответственно.
Количество обнаруженных документов: для слова "поиск" – 34 документа для каждого средства поиска, для слова "автоматизация" – 2, 16, 18 и 22 документов соответственно.
Проведенное исследование не претендует на абсолютную объективность. Тем не менее, очевидно, что применение предложенных мер существенно увеличивает эффективность поиска.
Теперь коснемся архивации информации.
Принцип организации хранения документов в системе изолирует пользователя от физического хранилища документов по двум причинам:
1. При доступе к библиотеке, пользователь не знает, где располагается база данных, и не знает, где располагается сервер, который открывает доступ к базе. Вся эта информация находится под управлением специального приложения.
2. Внутри библиотеки, пользователи работают с логической организацией документов. Они ничего не знают о физической организации библиотеки.
Физическое хранилище скрыто от пользователей, но может в полной мере контролироваться разработчиками и администраторами. Система хранит объекты документов в базе данных.
Не существует ограничения на количество объектов хранения, которые могут использоваться всеми базами данных.
Устройства хранения.
Как уже отмечалось, все данные в системе могут находиться в двух видах: индекс документа и собственно сам документ. Из-за высоких требований к скорости доступа к индексу документа и его целостности, он должен храниться в высокоскоростных отказоустойчивых системах хранения вместе с оперативной базой документов, например RAID-массивах.
Для архивного хранения самих документов использование магнитных дисковых носителей не представляется возможным вследствие их высокой стоимости. Наиболее подходящими носителями могут быть магнитооптические (МО), фазоинверсные (PD/CD), компакт- (CD-R) и WORM-диски (см. таблицу). Для автоматизации поиска информации, размещенной на этих дисках, ее извлечения и работе собственно с дисками используются автоматические библиотеки или, как их еще называют, оптические дисковые автоматы (JukeBox). Сегодня известны библиотеки, имеющие до 60-ти дисководов и до 3 тыс. гнезд для дисков, выбираемых механизированным способом. Автоматические библиотеки могут быть многофункциональными, например, одновременно поддерживать магнитооптические, фазоинверсные и компакт-диски.
Преимущество магнитооптических дисков перед компакт-дисками основана на том, что первые позволяют перезаписывать информацию. Большинство технологических решений электронного архивирования поддерживает технологию миграции данных именно на магнитооптические диски, которые более устойчивы к ошибкам записи, имеют более высокую скорость чтения, однако уступают компакт-дискам в гарантийном сроке хранения информации и стоимости. Если магнитооптические диски, в лучшем случае, декларируют сохранность информации в течение 50 лет, то гарантия на компакт-диски может составлять 100 лет и более. Что касается стоимости систем хранения на базе магнитооптических и компакт-дисков, то она может отличаться в 4 раза.
Не вызывает сомнения, что вся информация в системе должна иметь резервные копии. Для хранения документов и меняющейся поисковой информации в качестве сохранных накопителей удобнее использовать системы резервного копирования на магнитных лентах. Применяемые в персональных системах технологии (DC2000/Travan, DC6000, DAT) непригодны из-за ограничений в объеме. Возможным вариантом могут стать DLT-стримеры, восьмимиллиметровые библиотеки Exabyte (Mammoth) или специализированные катушечные системы. Наиболее распространены DLT-стримеры.