Совершенствование системы правовой информации: от банков данных к базам знаний
(Кашинский Ю. И.) ("Информационное право", 2006, N 2) Текст документаСОВЕРШЕНСТВОВАНИЕ СИСТЕМЫ ПРАВОВОЙ ИНФОРМАЦИИ: ОТ БАНКОВ ДАННЫХ К БАЗАМ ЗНАНИЙ
Ю. И. КАШИНСКИЙ
Кашинский Ю. И., директор Национального центра правовой информации Республики Беларусь, кандидат экономических наук.
В настоящее время, как образно утверждает Председатель Конституционного Суда Республики Беларусь Г. А. Василевич, "в стране создана практически не имеющая аналогов в СНГ государственная система управления правовым ресурсом, которая позволила сформировать и постоянно поддерживать в актуальном состоянии единый официальный и полный государственный нормативно-правовой информационный ресурс" <*>. -------------------------------- <*> Василевич Г. А. Информационные технологии в Республике Беларусь: правовые реалии и перспективы // Проблемы правовой информатизации. Минск, 2005. N 2(10). С. 6 - 12. Современные компьютерные технологии в системах правовой информации (Правовая информатизация - 2002) // Материалы Междунар. науч.-практ. конф. Минск, 21 - 22 ноября 2002 г. Минск: НЦПИ, 2002. Информационные технологии и право (Правовая информатизация - 2004) // Материалы Междунар. науч.-практ. конф. Минск, 28 - 29 октября 2004 г. Минск: НЦПИ, 2004.
Основанная на интенсивном применении современных информационных технологий и предназначенная для оперативного обеспечения полной и достоверной правовой информацией всех государственных органов, юридических и физических лиц, существующая модель государственной системы правовой информации Республики Беларусь (ГСПИ) в полной мере содействует оптимизации правотворческой, правоохранительной и правоприменительной деятельности <*>. Парадигмой построения этой модели стали: -------------------------------- <*> Журнал "Проблемы правовой информатизации". Минск, 1997 - 2005. N 1 - 10.
- комплексная концентрация правовой информации, ее юридическая обработка и системный анализ в едином государственном научно-практическом центре - Национальном центре правовой информации Республики Беларусь (НЦПИ); - проведение систематизации законодательства на основе единой для всех нормотворческих и правоприменительных органов системы классификации нормативных правовых актов, разработанной в НЦПИ согласно Указу Президента Республики Беларусь от 4 января 1999 г. N 1 "Об утверждении Единого правового классификатора Республики Беларусь"; - формирование и ведение в соответствии с Указом Президента Республики Беларусь от 20 июля 1998 г. N 369 "О Национальном реестре правовых актов Республики Беларусь" Национального реестра правовых актов Республики Беларусь (НРПА) как государственной системы учета, регистрации и опубликования правовых актов, которая определяет перечень видов документов, включаемых в НРПА, а также перечень органов, которые направляют в него принятые (изданные) нормативные правовые акты, и требования к оформлению (базовому формату) направляемых правовых актов; - построение системной информационно-компьютерной технологии (единого организационно-методического, программно-технического, информационного, лингвистического, научного и кадрового обеспечения) на основе комплексного подхода к формированию информационного нормативно-правового ресурса; - создание копии информационно-правового ресурса, представляющего собой совокупность эталонного банка данных правовой информации (ЭБДПИ) и других банков данных правовой информации; - организация и осуществление распространения правовых актов только на основе официальной информации из НРПА и ЭБДПИ; - подключение к ГСПИ всех организаций государственной и негосударственной форм собственности при распространении правовой информации из единого ЭБДПИ. Несомненным признанием актуальности достижений НЦПИ по созданию ГСПИ является положение п. 17 "Тунисского обязательства" (ноябрь 2005 г.), который гласит и предписывает: "Мы настоятельно призываем правительства, используя потенциал ИКТ, создать государственные системы информации о законах и нормативных положениях, предусматривающие более широкое развитие сети пунктов коллективного доступа и обеспечивающие достаточное наличие этой информации" - и который есть результат последовательных достижений и предложений НЦПИ Республики Беларусь, представленных в том числе в итоговом документе Международной конференции "Правовая информатизация - 2004" <*>. -------------------------------- <*> Информационные технологии и право (Правовая информатизация - 2004) // Материалы Междунар. науч.-практ. конф. Минск, 28 - 29 октября 2004 г. Минск: НЦПИ, 2004.
В настоящей работе выделим в этом утверждении более узкую область, а именно - государственный ин формационный ресурс правовой информации (ГИРПИ). С одной стороны, ГИРПИ должен обладать важнейшим показателем - способностью оперативно и на высоком качественном уровне, максимально полно и точно удовлетворять потребности заинтересованных организаций и лиц, а с другой - этот показатель должен достигаться при минимальных затратах, к числу которых мы можем отнести затраты на подготовку и сопровождение компонентов ГИРПИ, а также проектирование и эксплуатацию системы управления этим ресурсом (СУГИР). Анализ (см., в частности, работы В. А. Чеушева, А. Н. Курбацкого <*>) показывает, что достигнутый сегодня уровень формирования и представления потребителям ГИРПИ, обладая множеством позитивных характеристик, все еще далек от того, который может быть достигнут на основе современных достижений науки и информационных технологий. Имеются большие резервы в улучшении качества удовлетворения информационных потребностей пользователя (ИПП) и оказания юридических услуг, причем это улучшение может быть обеспечено при одновременном снижении затрат на создание, сопровождение, передачу потребителям ГИРПИ, проектирование технологических компонентов и систем. -------------------------------- <*> Чеушев В. А. Некоторые направления совершенствования систем управления государственными информационными ресурсами: анализ проблемы // Проблемы правовой информатизации. Минск, 2004. N 2(8). С. 29 - 32. Курбацкий А. Н., Чеушев В. А. Архитектура данных для систем управления государственными информационными ресурсами // Материалы III научно-практической конференции "Управление информационными ресурсами". Минск, 2005.
Рассматриваемый подход к достижению этих целей базируется на идее создания юридических баз знаний (БЗ), основанных на формальном аппарате семантических сетей (СС). Семантическая сеть. Остановимся кратко на том, что с формальной точки зрения представляет собой семантическая сеть. Основные сущности семантической сети и базы знаний на ее основе - это объекты, отношения, правила вывода. Объектом в СС может быть представлен любой элемент информационных ресурсов (ИР), рассматриваемый как единое целое, например правовой акт, его структурная часть, субъект, организация, понятие и т. д. Объекту с помощью одного из отношений приписывается тип. Каждый объект данного типа наследует по иерархии свойства, определенные для объектов данного типа. Объекты СС связываются друг с другом семантическими отношениями. Например, объект типа правовой акт может быть связан с объектом типа организация отношением типа орган принятия. Отношения также являются объектами СС и могут связываться между собой отношениями. Важную категорию объектов образуют факты, связывающие воедино определенную группу объектов и отношений СС. Например, можно формулировать и сохранять в БЗ такие факты, как принятие правового акта, внесение в него изменений, факт изменения названия организации (с внесением в этот факт данных о дате события, причинах, связанных с этим документом и другой информации) и т. д. Важнейшую роль в БЗ играют правила вывода. Путем следования по цепочке отношений правила вывода способны, например, находить объекты по их связям с другими объектами, выявлять неявную информацию путем каскадного следования по имеющимся в СС явным отношениям между объектами и т. д. Правила вывода могут формулироваться до любого уровня сложности, в том числе путем "сборки" из ранее определенных правил. Формирование парадигмы. Один из наиболее распространенных сегодня на практике подходов к проектированию информационных систем (ИС) коротко можно охарактеризовать следующим образом. Для ИР системы (по меньшей мере для той ее части, которая может быть структурирована) проектируется реляционная модель, создается база данных ИР, далее для каждого типа объекта и каждой задачи, связанной с созданием компонентов ИР, их сопровождением и передачей потребителю, проектируется программный код. Иными словами, имеет место жесткая привязка структуры ИР и программных компонентов системы к заданным на этапе проектирования типам объектов и определенным на этом же этапе задачам по манипуляции с этими объектами. Таким образом, структуры информационных объектов, их взаимосвязи, другая метаинформация закладываются в программный код системы, при этом малейшие ее изменения требуют изменения кода, т. е. перепроектирования, пусть даже незначительного по объему. Такой подход прост в понимании и хорошо испытан. Этим, вероятно, объясняется то, что при планировании новой системы к нему часто склоняются в первую очередь. Конечный же пользователь такого рода системы имеет в своем распоряжении только ту функциональность, которая жестко заложена в системе. В отношении некоторых функций такая жесткость не представляет пользователю проблем, напротив, жестко "привязанный" к объекту и задаче программный код может быть реализован максимально эффективно в смысле вычислительных затрат при его выполнении (затрат на его реализацию и выполнение его у пользователя в реальном масштабе времени). Если же говорить о поисковых, навигационных и ряде других функций ИС, то здесь жесткость сильно ограничивает ее потенциальные возможности. В то же время на этапе проектирования невозможно предусмотреть все информационные запросы, которые могут понадобиться конечному пользователю, и даже если определить их достаточно много, то реализация каждого потребует больших затрат ресурсов проектирования. В принципе на основе данного подхода могут быть созданы и создаются достаточно эффективные и высокоэффективные системы для тех ситуаций, когда метод решения задачи оказывается адекватным самой задаче, т. е. когда данным ИР и задачам по их обработке присуща высокая жесткость. Например, это имеет место в случае жестко заданных на многие годы вперед структур данных и жестко регламентированных (по определению, а не потому, что недостаточно гибки поисковые возможности системы) поисковых и других функций. Вытекающая из жесткости "тяжеловесность" (неадаптируемость, негибкость, ненастраиваемость) системы в таких случаях оправданна. В современной практике более распространены случаи, когда описанный подход к проектированию неадекватен задаче. Так, если структура и взаимосвязи элементов ИР динамичны, то перепроектирование при каждом изменении свойств ИР требует затрат и задерживает развитие системы. Еще более важный фактор - гибкость поисковых и навигационных возможностей системы, которая в конечном счете обеспечивает качество удовлетворения ИР. В контексте этих приоритетов традиционный подход чаще всего не позволяет реализовать гибкую и прозрачную систему информационных запросов. В этой связи уместно готовить изменения проектной парадигмы для обеспечения высокой гибкости ИС как относительно организации данных, так и относительно реализации функций. В БЗ на основе семантической сети объекты и связи между ними создаются на основе общих принципов построения СС (или же могут быть созданы поддерживающие эти принципы виртуальные структуры). Одна из главных особенностей состоит в том, что метаописание объектов и связей между ними строится по тем же принципам и составляет неотъемлемую часть СС. Наличие такой метаинформации дает возможность проектировать общий программный код, который может манипулировать объектами любого типа и связями между ними. С другой стороны, для каждого типа объектов в системе могут быть переопределены нужные участки кода, что обеспечивает реализацию специфической для объектов данного типа функциональности. Единство алгоритмических и программных решений для множества различных объектов позволяет разработать унифицированный программный код с высокой степенью эффективности и широким набором типовых функций по управлению объектами, их структурированию, поиску, навигации и др. При таком подходе к проектированию новые типы объектов ИР и связи между ними могут создаваться или переопределяться в считанные минуты, при этом вновь созданный тип объекта получает "в готовом виде" всю типовую функциональность по управлению объектами, поиску, навигации и другим функциям. Важно отметить, что многие проблемы и задачи, с которыми сталкиваются проектировщики, решаются при таком подходе уже на уровне формальных моделей СС. К числу важнейших из этих проблем следует отнести отражение иерархических структур (причем с допущением вхождения объекта сразу в несколько иерархий) и иерархическое наследование свойств <*>, упорядочение групп объектов (причем с возможностью существования нескольких упорядочений для одних и тех же объектов), проблему синонимии (синонимия здесь понимается в широком смысле - это не только несколько терминов одного понятия, но и, например, несколько фамилий человека в течение его жизни, несколько - менявшихся во времени - названий организации, понятий, имен, названий и т. п. на разных языках и т. д.). Успешное решение этих и других часто встречающихся проблем на формальном уровне, тщательная проработка методических, алгоритмических, программных их решений на уровне базовой функциональности СС позволяет охватить этой базовой функциональностью большой круг проектных задач, а также достаточно легко преодолевать барьеры конкретной проектной задачи. -------------------------------- <*> Чеушев В. А. Некоторые направления совершенствования систем управления государственными информационными ресурсами: Модель "Диаграмма решений" для организации данных ИР // Проблемы правовой информатизации. Минск, 2005. N 1(9). С. 62 - 66.
Таким образом, подход к проектированию ИС на основе семантических сетей позволяет получить гораздо большую гибкость в манипулировании данными, более богатые функциональные возможности при одновременном снижении затрат на проектирование. Применение жестких схем хранения информации в банке данных (БД), неполное отражение связей между элементами данных порождают ограничение функциональных возможностей, предоставляемых конечным пользователям. В итоге многие современные юридические БД ограничивают возможности пользователя лишь поиском (не всегда точным и полным) правовых документов по заданным реквизитам и фрагментам текста, тогда как практика требует, например, точного и полного удовлетворения потребностей пользователя по формулировке его проблемной ситуации. От юридических БД к юридическим БЗ. Для достижения качественно нового уровня использования правовой информации, обеспечения полноты и точности удовлетворения информационных потребностей пользователя необходимо <*>: -------------------------------- <*> Чеушев В. А. Некоторые направления совершенствования систем управления государственными информационными ресурсами: анализ проблемы // Проблемы правовой информатизации. Минск, 2004. N 2(8). С. 29 - 32.
повысить уровень детализации данных информационного ресурса; связать компоненты ИР существенно большим количеством разнородных семантических связей; предложить пользователям гибкие унифицированные инструменты поиска, анализа и навигации, которые позволили бы в том числе реализовывать информационные запросы, не предусмотренные на этапе проектирования. Аппарат семантических сетей как раз и представляет средства решения данной проблемы. В первую очередь он предоставляет беспрецедентные возможности поиска и навигации. Свойства поискового механизма по СС позволяют утверждать, что пользователь будет иметь возможность за одну или несколько итераций выполнить практически любой важный для него запрос и достичь любого объекта СС. Такие возможности СС обеспечивает уже на уровне базовой функциональности. Впоследствии с разработкой специализированных библиотек правил вывода появится возможность решать различные специализированно-поисковые, аналитические, экспертные и другие задачи. Понятно, что создание и внедрение в практику юридических баз знаний - это рассчитанный на долгосрочную перспективу многоэтапный процесс. Уже лишь первичные эксперименты в этом направлении показывают, что реализация и апробация в БЗ некой новой функции или возможности "подливают масла в огонь", подсказывая новые решения и создавая предпосылки для реализации все новых и новых возможностей. Поэтому планирование развития БЗ на долгосрочную перспективу - в известной мере нечеткая задача, поскольку перед реализацией каждого следующего этапа нужно проводить корректировку планов с учетом полученных результатов. К счастью, эта корректировка, как правило, имеет один вектор - увеличение возможностей, а аппарат БЗ изначально направлен на саморазвитие. По всей видимости, наиболее естественным первым этапом в создании юридических БЗ должно стать отображение на СС существующих объектов, структур и взаимосвязей элементов правового информационного ресурса. Основными объектами начальной версии СС должны стать те объекты, которые различимы как самостоятельные сущности в существующей системе, т. е. правовые акты, органы их принятия, используемые сегодня классификационные справочники <*> и т. д. -------------------------------- <*> Голуб Т. Ф., Филипович О. В. Классификаторы правовой информации в составе информационно-поисковых языков ЭБДПИ // Проблемы правовой информатизации. Минск, 2004. N 2(8). С. 53 - 56.
В развитии объектами СС должны становиться не только правовые акты и их структурные части, но и субъекты законотворческой деятельности, объекты, на которые направлены нормы правовых актов, проблемные ситуации, которые регулируются правовыми актами, и ряд других, в совокупности задающие точные "координаты точек" применения правовых актов. Существенно повысив качество удовлетворения потребностей пользователей в юридической информации, такая система будет ограничена в выявлении семантических связей между элементами правовых актов и как следствие - в решении таких задач, как выявление несогласованностей между правовыми актами, полноты правовой обеспеченности заданных проблемных ситуаций и т. п. Поэтому на следующем этапе развития юридических БЗ объектами семантической сети должны стать также нормы права. Это позволит достичь существенно более высокого уровня интеллектуализации юридической БЗ на основе установления причинно-следственных и других семантических связей между нормами права. Создание юридических БЗ на основе изложенных принципов создаст необходимый фундамент для построения юридических экспертных и экспертно-поисковых систем. С позиций информационного обеспечения решаемых ими задач целесообразно внесение в БЗ информацию о прецедентах применения правовых норм в различных проблемных ситуациях, отмеченных несогласованиях в правовых актах и т. п. В числе решаемых задач могут рассматриваться задачи анализа непротиворечивости законодательства, полноты правовой обеспеченности проблемных ситуаций и другие задачи, важные как в законотворческой деятельности, так и в повседневной юридической практике. Важным направлением в расширении сфер применения юридических БЗ может стать создание систем поддержки принятия решений (СППР). В числе задач, решаемых такой системой, можно отметить следующие: анализ достаточности выполнения определенного множества условий для перехода к следующему уровню решения задачи принятия решения; количественная оценка этапов решения задачи; оптимизация процесса принятия решения с выбором на каждом шаге оптимального пути решения. Здесь мы отметили несколько "утонченных" задач, решаемых с помощью БЗ на основе количественных методов анализа и оптимизации. Понятно, что информационное обеспечение ППР - естественная функция БЗ в такой системе. Создание и применение юридических БЗ на основе семантических сетей мы рассматриваем как очередной виток эволюции правовой информатизации, на котором может быть достигнут качественно новый уровень удовлетворения потребностей общества в правовой информации, оказания юридических услуг, информационного обеспечения процессов принятия управленческих решений. Задачи, которые будут решать данные БЗ, уже достаточно давно поставлены практикой, поэтому трудно усомниться в актуальности и перспективности исследований и разработок в данном направлении. Более того, переход от баз и банков данных к базам знаний, по всей видимости, диалектически неизбежен, хотя реализовываться может конечно же в различных формах.
------------------------------------------------------------------
Название документа