Интеллектуальная обработка запросов

 

С точки зрения пользователя одним из основных критериев ка­чества любой автоматизированной системы, работающей с тек­стовой базой данных, и прежде всего с базой текстов норма­тивных актов, является гарантия того, что вся необходимая информация по интересующей проблеме будет найдена. Ведь конечная цель работы с информационной системой состоит не столько в получении правовой информации, сколько в приня­тии на основе полученной информации юридически выверен­ного решения на основе всех имеющихся правовых актов.

Ответ системы на запрос представляет собой, как правило, список нормативных документов, имеющих отношение к инте­ресующей пользователя проблеме. Полнота этого списка зави­сит от того, насколько полной является сама правовая база. Но не менее важно и то, насколько верно система поняла запрос и включила в ответ всю информацию, которая может заинтере­совать пользователя.

Для автоматизированной информационной правовой систе­мы очень важны те возможности, которые она предоставляет пользователю для диалога, порядок и условия организации за­проса к базе данных, обеспечиваемые системой, а также досто­верность списка документов, сформированного в результате произведенного системой отбора в ответ на запрос пользовате­ля.

ЮСИС помимо достоверности поиска отличает достаточно понятный принцип отбора документов для правового анализа. Подразумевается, что вопрос пользователя системе по интере­сующей его проблеме - это некоторая последовательность слов, выражающих эту проблему, вероятнее всего находящихся в абзаце или в предложении текста документа.

Каждый документ, включаемый в базу данных ЮСИС, ав­томатически обрабатывается специальным комплексом про­грамм (процессором), проводящим морфологический анализ текста документа на присутствие в нем всех частей речи русско­го языка. Процессор «не имеет права» пропустить ни одного слова. Если слово для него «незнакомо», он просит подтвер­ждения на то, чтобы в дальнейшем оно распознавалось им без затруднений. В результате подобной обработки -создается спе­циальная база данных, содержащая исчерпывающую информа­цию о том, в каких текстах находится каждое слово и какие слова окружают его в пределах всего текста, а также любого абзаца и предложения во всех документах.

Созданная процессором база данных и представляет собой то уникальное ядро, с которым пользователь ведет диалог. Та­ким образом, ЮСИС заранее «знает», в каких абзацах или предложениях текстов нормативных документов находится любое нужное пользователю сочетание слов.

Для обеспечения диалога с системой формируется основной словарь, содержащий слова уже в нормализованной граммати­ческой форме (именительный падеж, единственное число, муж­ской род). Словарь нужен для того, чтобы пользователь при формировании запроса не задумывался над тем, в какой грам­матической форме слово может находиться в конкретном тек­сте нормативного акта. Тем не менее в ответе на запрос будут , представлены все нормативные документы, содержащие фрагменты текстов, в которых присутствуют искомые слова в любых грамматических формах.