С семантическим индексированием документов


Проблемы организации электронного архива

 

И.С. Кононенко, Е.А. Сидорова, Ю.А. Загорулько, Ю.В. Костов

Российский НИИ Искусственного Интеллекта,

Институт систем информатики СО РАН

 

Наличие в базе знаний системы InDoc структурированной информации о предметной области позволяет отказаться от традиционных методов полнотекстового поиска и применить технологию семантического индексирования.

Развитие базы данных в базе знаний заключается во все возрастающей независимости содержащихся в ней знаний от обрабатывающих программ и возрастании их целостности и полноты относительно классов решаемых задач. База данных постепенно превращается в целостную и независимую модель проблемной среды.

База знаний имеет двухуровневую структуру: концептуальная БЗ и БД. Это обеспечивает должную эффективность представления обобщенных знаний и метазнаний на верхнем уровне и конкретной информации на нижнем уровне.

Современные СУБД используются на нижнем уровне: они удобны для конкретного описания проблемной среды. На концептуальном уровне среда описывается обобщенно, появляются метазнания, т.е. знания о структуре БЗ и методах манипулирования хранящимися знаниями. Представление знаний на каждом уровне осуществляется применением некоторого Языка представления знаний.

Пример. Методика генерации вставки объекта (Добавление операции «Нагрев», вспомогательного инструмента и т.д.)

Интеллектуальный интерфейс включает все средства уровня конечного пользователя, обеспечивающие взаимодействие между конечным пользователем и вычислительной системой в процессе решения задачи.

В составе ИИн можно выделить Решатель и Систему общения.

Решатель – совокупность средств, обеспечивающих в процессе диалога с пользователем автоматический синтез программ решения задачи.

Система общения – совокупность трансляторов, осуществляющих трансляцию с языка пользователя на Язык представления знаний в БЗ и обратно.

Синтез программ возможен на трех уровнях:

· операций;

· программных модулей;

· пакетов прикладных программ.

Входной информацией является запрос на получение некоторого значения и (при необходимости) последующее сообщение дополнительных сведений о задаче. Решатель на основании содержащихся в БЗ знаний о возможностях решения различных подзадач формирует из решающих эти подзадачи программ последовательность, позволяющую получить требуемое решение на основании введенных исходных данных. Таким образом, Решатель осуществляет собственно решение задачи: анализ ее условий; выделение подзадач со стандартным механизмом решения; объединение решений в программу и т.д.