Повышение эффективности процесса представления знаний

Введение

С развитием общества трудовые ресурсы из сферы материального производства перераспределяются в сферу информационного обслуживания. Если вначале XX в. информационной деятельностью занималось до 10% общества, то к началу XXI в. до 50%. Резко уменьшилось время накопления знаний. Удвоение научных знаний происходит за 2-3 года. Знания, полученные специалистом в высшей школе, устаревают за 5-7 лет. Материальные затраты общества на информационные процессы уже превышают в целом затраты на энергетику. Информация становится предметом труда, и в результате этой трудовой деятельности возникает новый вид ресурса – информационный ресурс, который отражает интеллектуальный потенциал общества и переходит в экономическую категорию.

Экономический ресурс – основа развития наукоемкого производства, результаты которого проявляются в изделиях, превышающих по своим параметрам лицевые образцы. Информационный ресурс проявляется также в виде невещественной продукции – в лицензиях и патентах.

Технология регулирования информационного ресурса содержит: накопление данных, формирование знаний, организацию данных и представление знаний.

Накопление данных

Данные – это информация, представленная в форматизированном виде, что позволяет передавать и обрабатывать ее на базе технических средств.

Знание – отражение на основе мышления реальной действительности, регулируется человеком. Переход информации в знания осуществляется за счет интеллектуальной деятельности человека.

Если данные организовать под какую-либо задачу, то на их основе человек может принять решение по управлению и такие данные уже можно рассматривать как информацию.

Формирование знаний

Информацией является используемые для принятия решений данные. Данные предоставляются в виде информации, на основе которой могут быть приняты решения по управлению.

В знаниях выделяют три основные составные части:

Декларативные знания отражают количественные и качественные характеристики объектов. Они хранятся в базе данных.

Системные (понятийные) знания содержат не только определение понятий, но и описание свойств понятий и взаимосвязей между ними.

Алгоритмические (процедурные) знания задают способ решения задачи.

Для каждой задачи формируется алгоритм решения и программа решения. Совокупность алгоритмов решения взаимосвязанных задач в АСУ составляет алгоритмическую модель. Эта модель в отличие от информационного ресурса содержит не данные, а информацию. Включение ЭВМ в контур управления невозможно без наличия соответствующих программ.

Совокупность декларативных, понятийных и процедурных знаний хранится в базе знаний.

Информатизация общества

Информатизация – это комплекс мер, обеспечивающих наиболее полное применение достоверного знания во всех общественно значимых видах человеческой деятельности.

Управление производством во многом зависит от рационализации делопроизводства, своевременной передачи и получения необходимой оперативной финансово-бухгалтерской, отчетно-статистической и другой информации. Любой проект сопровождает большой объем нормативной, справочной и пояснительной документации. Это парализует деятельность служащих и технических работников. В делопроизводстве в России ежегодно используется до 4 трлн. страниц бумаги. В этих условиях решение проблемы информатизации общества возможно за счет ряда факторов:

Использование средств вычислительной техники во всех общественно значимых сферах общества. Это означает создание автоматизированных рабочих мест (АРМ), которые не только позволяют сократить объем бумажной продукции по прогнозам вдвое, но и на порядок уменьшают время оперативной и достоверной передачи информации при одновременном повышении ее качества и снижении количества исполнителей. Деловую корреспонденцию должны обеспечить службы электронной почты.

Поднятие престижа информационной деятельности и повышение производительности труда служащих в сфере управления производством. ЛПР должны обладать доступом в вычислительную среду, овладеть методами общения с ЭВМ. Языки общения с ЭВМ должны упрощаться при переходе к квазиестественным языкам.

Охват информацией всех слоев населения. Создание развитых каналов связи, снижение стоимости ПЭВМ, возможность подключения к телефонной сети для доступа к информационному ресурсу.

1 ПРЕДСТАВЛЕНИЕ ЗНАНИЙ И ВЫВОД НА ЗНАНИЯХ

Данные и знания

При изучении интеллектуальных систем возникает вопрос – что же такое знания и чем они отличаются от обычных данных. Предложены несколько рабочих определений, в рамках которых это становится очевидным.

Данные – это отдельные факты, характеризующие объекты, процессы и явления предметной области, а также их свойства.

При обработке на ЭВМ данные преобразуются, условно проходя следующие этапы:

D1 – данные как результат измерений и наблюдений;

D2 – данные на материальных носителях информации в виде таблиц, протоколов, справок;

D3 – модели (структуры) данных в виде функций, диаграмм, графиков;

D4 – данные в компьютере на языке описания данных;

D5 – базы данных на машинных носителях информации.

Знания основаны на данных, полученных опытным (эмпирическим) путем. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания – это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

При обработке на ЭВМ знания преобразуются (трансформируются) аналогично данным:

Z1 – знания в памяти человека как результат мышления;

Z2 – материальные носители знаний (учебники, методические пособия);

Z3 – поле знаний – условное описание основных объектов предметной области и закономерностей их связующих;

Z4 – знания, описанные на языках представления знаний (моделях представления знаний) – продукционные языки или модели, семантические сети, фреймы, формальные логические модели;

Z5 – база знаний на машинных носителях информации.

Часто используется краткое определение понятия «знания»:

Знание – это хорошо структурированные данные, или данные о данных, или метаданные.

Для хранения данных используются базы данных, которые характеризуются большим объемом и сравнительно небольшой удельной стоимостью информации.

Для хранения знаний используются базы знаний, которые характеризуются небольшим объемом, но исключительно дорогими информационными массивами. База знаний – основа любой интеллектуальной системы.

Знания квалифицируют по двум категориям: поверхностные и  глубинные.

Поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в пределах области. Глубинные – абстрактные, аналогии или схемы, отображающие структуру и природу процессов, объясняют явления и могут использоваться для прогнозирования поведения объектов. Пример поверхностных знаний: «при нажатии на кнопку звонка раздается звук». Пример глубинных знаний: «изучение принципиальной схемы звонка и электропроводки объясняют возникновение звука».

Современные экспертные системы работают в основном с поверхностными знаниями. Это связано с тем, что в настоящее время еще не разработаны универсальные методики, позволяющие выявлять и работать с глубинными структурами знаний.

В учебниках по ИИ знания делят на процедурные и  декларативные.

Исторически первичными были процедурные знания, управляющие данными в алгоритмических программах. Для изменения процедурных знаний требовалось изменять программы.

Однако с развитием ИИ увеличивалась роль декларативных знаний. И сегодня знаниями считаются предложения, записанные на языках представления знаний, приближенных к естественному и понятных неспециалисту.

Классы моделей представления знаний

Множество моделей (или языков) представления знаний для различных предметных областей может быть сведено к следующим классам:

Продукционные модели;

Семантические сети;

Фреймы;

Формальные логические модели.

Продукционная модель

Продукционная модель позволяет представить знания в виде предложений типа «Если (условие), то (действие)».

Продукционная модель – модель, основанная на правилах. Под «условием» понимается предложение – как образец, по которому осуществляется поиск в базе знаний.

Под «действием» понимаются действия, выполняемые при успешном исходе поиска. Консеквентные действия могут быть промежуточными или терминальными.

Промежуточные – консеквентные действия выступают далее в качестве условий – антецедентов.

Терминальные – концевые действия являются целевыми, завершающими работу системы.

Чаще всего вывод на такой базе знаний бывает прямой (от данных к поиску цели) или обратный (от цели к исходным данным), подтверждающий вывод. Данные – это исходные факты, хранящиеся в базе фактов, на основании которых запускается интерпретатор правил, перебирающий правила из продукционной базы знаний.

Продукционная модель чаще всего применяется в промышленных экспертных системах – ЭС. Достоинства такой модели в наглядности, высокой модульности, легкости внесения дополнений и изменений и простом механизме логического вывода.

Семантические сети

Семантика – это наука, устанавливающая отношения между символами и объектами, которые они обозначают. Термин «семантическая» означает «смысловая»

Семантическая сеть – это ориентированный граф, вершины которого – понятия, а дуги - отношения между ними. В качестве «понятий» выступают объекты, а «отношения» – это связи типа: «это» – (АКО), «имеет частью», «принадлежит».

Для семантических сетей характерной особенностью является обязательное наличие трех типов отношений: класс – элемент класса (цветок – роза); свойство – значение (цвет – желтый); пример элемента класса (роза – чайная).

­­­­­­­­­­­­Поиск решения в базе знаний типа семантической сети сводится к поиску фрагмента сети, соответствующей подсети, которая отражает запрос, поставленный к базе.

 SHAPE  * MERGEFORMAT

Иванов

Двигатель

Вид транспорта

Человек

Красный

Цвет

Волга

Автомобиль

  значение

свойство

  принадлежит

имеет

например

это

имеет частью

Рис. 1.1 Семантическая сеть.

Основным преимуществом данной модели представления знаний является то, что она более других соответствует  современным представлениям об организации долговременной памяти человека. Недостатком – сложность организации процедуры поиска вывода на семантической сети.

Фреймы

Термин фрейм («каркас» или «рамка») предложен Минским в 70-е годы для обозначения структуры знаний для восприятия пространственных сцен. Так же, как и семантическая сеть, эта модель имеет психологическое обвенование. Фрейм – это абстрактный образ для представления некоего стереотипа восприятия. В философии и психологии известного понятия абстрактного образа. Например, произнесение вслух слова «комната» порождает у слушающих образ комнаты: жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2. Из этого описания нечего нельзя убрать. Например, убрав окна, мы уже получим не комнату, а чулан. Но в этом описании есть «дырки» или «слоты» - это незаполненные значения некоторых атрибутов – например количество окон, цвет стен, высота потолка, покрытие пола и др.

В теории фреймов такой образ комнаты называется фреймом комнаты, фреймом комнаты также называется и формализованная модель для отображения образа.

Различают фреймы-образцы или прототипы, которые хранятся в базе знаний и фреймы-экземпляры, которые создаются для отображения реальных фактических ситуаций на основе поступающих данных.

Модель фрейма является достаточно универсальная, поскольку позволяет отображать все многообразие знаний о мире через: фреймы-структуры, которые используются для обозначения объектов и понятий (заем, залог, вексель); фреймы-роли (менеджер, кассир, клиент); фреймы-сценарии (банкротство, собрание акционеров); фреймы-ситуации (тревога, авария, рабочий режим и др.)

Описание способа получения слотом его значения и возможность присоединения к слоту специальных процедур запускается в теории фреймов. В качестве значения слота может выступать имя другого фрейма, образуя сети фреймов.

Важнейшим свойством теории фреймов является заимствование из теории семантических сетей – так называемое наследование свойств, которое происходит по АКО - связям. Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то есть переносятся, значения аналогичных слотов.

Например в сети фреймов на рис.1.2 понятие «ученик» наследует свойства фреймов «ребенок» и «человек», которые находятся на более высоком уровне иерархии. Так, на вопрос «любят ли ученики сладкое» следует ответ – «да», так как эти свойством обладают все дети, что указано во фрейме «ребенок». Наследование свойств может быть частичным, так как возраст для учеников не наследуется из фрейма «ребенок», поскольку указан явно в своем собственном фрейме – «ученик».

 SHAPE  * MERGEFORMAT

человек

     млекопитающее

мыслить

 АКО

 

  «это»

  умеет

ребенок

  человек

0-16 лет

50 – 180 см

сладкое

АКО

 Возраст

Рост

  Любит

ученик

ребенок

В школе

7-17 лет

форму

АКО

учится

  возраст

носит

Рис.1.2 Сеть фреймов

Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а так же её гибкость и наглядность.

Формальные логические модели.

В представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов первого порядка, когда предметная область (или задача) описывается в виде набора аксиом. В промышленных ЭС исчисление предикатов первого порядка практически не используется. Эта логическая модель применяется в основном в исследовательских «игрушечных» системах, так как предъявляет очень высокие требования и ограничения к предметной области.

В истории искусственного интеллекта решаемая задача описывается в логической модели представления знаний определенными утверждениями на некотором логическом языке (прологоподобные языки). Тогда знания составляют множество аксиом, а решаемая задача представляет собой доказываемую теорему. Процесс доказательства теоремы и составляет логическую модель представления знаний.

Логическая модель описания задачи включает в себя язык, аксиомы, правила вывода. Задача включает в себя множество подзадач и взаимосвязей между ними. На нижнем уровне существует некоторая элементарная задача, для которой известна программа, выполняемая ЭВМ без участия пользователя. Отсюда, решение задачи есть нахождение правил, которые задают последовательность решения элементарных задач в зависимости от требуемого результата и исходных данных, имеющихся у пользователя.

Применение логической модели позволяет оценивать результаты решения каждой элементарной подзадачи. На основе этого можно установить принадлежность любой подзадачи к решению исходной задачи.

Последовательность описания решаемой задачи определяется правилами подстановки описаний составляющих её подзадач.

Логической модели представления знаний и задач соответствует графическое изображение в виде графа редукции или графа пространства состояний. Вершины графа редукции соответствуют именам задач. Имя корневой вершины есть имя исходной задачи. Имена дочерних вершин – это имена подзадач связи между подзадачами отображаются дугами. Для конъюнкции используется гипердуга типа «И». Для дизъюнкции используется дуга типа «ИЛИ». Применение логической модели позволяет оценивать результаты решения каждой элементарной подзадачи.

Вывод на знаниях

Наибольшее распространение получила продукционная модель представления знаний. При использовании продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил, называется машинной вывода или интерпретатором правил.

В большинстве систем, основанных на знаниях, машина вывода представляет собой небольшую по объему программу. Эта программа реализует собственно вывод и одновременно управляет процессом вывода. Действие вывода основано на применении правила: «Если известно, что истинно утверждение А и одновременно существует правило вида – если А, то В – тогда утверждение В также истинно». Правила срабатывают, когда находятся факты, удовлетворяющие их левой части: если истина посылка, то должно быть истинно и заключение.

При разработке стратегии управления выводом важно определить:

ü 

ü 

В системах с прямым выводом по известным фактам отыскивается заключение, которое следует из этих фактов. Если такое заключение удаётся найти, то оно заносится в рабочую память. Прямой вывод часто называют выводом, управляемым или иначе – выводом, управляемым антецедентами.

Обратный поиск применяется в тех случаях, когда цели известны и их сравнительно немного. При обратном порядке вывода вначале выдвигается некоторая гипотеза, а затем механизм вывода как бы возвращается назад, переходя к фактам и пытаясь найти те из них, которые подтверждают выдвинутую гипотезу. Если первая гипотеза оказалась правильной, то выбирается следующая гипотеза, которая детализирует первую и является по отношению к ней подцелью. Далее отыскиваются факты, подтверждающие истинность подчинённой гипотезы. Вывод такого типа называется управляемым целями, или иначе – управляемым консеквентами.

Существуют также системы, в которых вывод основывается на сочетании двух упомянутых выше методов – ограниченно прямого и обратного. Такой комбинированный метод получил название – циклического.

При поиске в глубину в качестве очередной подцели выбирается та, которая соответствует следующему, более детальному уровню описания задачи.

При поиске в ширину система вначале проанализирует все признаки, находящиеся на одном уровне пространства состояний и лишь затем перейдет к признакам следующего уровня.

Нечеткие знания

В задачах, решаемых интеллектуальными системами, часто приходится пользоваться неточными знаниями, которые не могут быть представлены как полностью истинные или ложны. Существуют знания, достоверность которых выражается не 0/1, а промежуточным значением, например 0,7. Как представить формально подобные нечеткие знания? Для разрешения таких проблем в 1990 г. положено начало одной из ветвей ИН под названием – мягкие вычисления. Одно из главных понятий в нечеткой логике – понятие лингвистической переменной (ЛП).

Лингвистическая переменная – это переменная, значение которой определяется набором словесных (вербальных) характеристик некоторого свойства.

Например, лингвистическая переменная «рост» определяется через набор словесных характеристик: карликовый, низкий, средний, высокий, очень высокий.

Значения лингвистической переменной определяются через так называемые нечеткие множества (НМ). НМ определены на базовом наборе значений (базовой числовой шкале), имеющих размерность. Каждое значение ЛП определяется как НМ. Нечеткое множество определяется через базовую шкалу – В и функцию принадлежности НМ-М(х), х

Например, для ЛП – «возраст» базовая шкала – это числовая шкала от 0 до 120, обозначающая число прожитых лет, а функция принадлежности определяет, насколько мы уверенны в том, что данное количество лет можно отнести к данной категории возраста.

Заключение

Чаще всего интеллектуальные системы (ИС) применяют для решения задач, основная сложность которых связана с использованием слабо-формализованных знаний специалистов – практиков и где смысловая (или логическая) обработка информации преобладает над вычислительной. Например, понимание естественного языка, принятия решений в сложной ситуации, управление диспетчерскими пультами и т.п. Системы, ядром которых является база знаний или модель предметной области, описанная на языке сверхвысокого уровня, приближенном к собственному, называют интеллектуальными. Такой язык сверхвысокого уровня называют языком представления знаний (ЯПЗ).

Перспективным путём совершенствования и дальнейшего развития экспертных систем является создание инструментальных средств, базирующихся на совместном использовании различных моделей представления знаний: продукционных, семантических, фреймов и логических моделей. Все эти модели являются математическим средством построения перспективных интеллектуальных автоматизированных систем обработки информации и управления (АСОИУ).

Список использованных источников

1. Базы и банки данных и знаний. Учебник/Г.И. Ревунков, Э.Н. Самохвалов, В.В. Чистов./ – М.: Высш.шк., 1992.

2. Системы управления базами данных и знаний. Справ. изд./А.Н. Наумов, А.М. Вендров, В.К. Иванов и др.; Под ред. А.Н. Наумова. – М.: Финансы и статистика, 1991.

3. Экспертные системы. Принцип работы и примеры. Пер. с англ./А.Брукинг, П. Джонс, Ф. Кокс и др.; Под ред. Р. Форсайта. – М.: Радио и связь, 1987.

4. Попов Э.В. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. – М.: Наука, 1987.

5. Экспертные системы: Сб./Ред. Б.М. Васильев. – М.: Знание, 1990.

6. Экспертные системы. Материалы семинара. – М.: МДНТП, 1986.

Интернет-ресурсы

1. http://www.sprut.ru/stat/sapr0998.php#Введение

2. http://www.arko.ru/

3. http://www.extech.msk.su/s_e/min_s/

4. http://synopsis.kubsu.ru/informatic/master/lecture/themes8_2_3.php

5. http://www.buzdalin.ru/text/banks/t8/intel.php

6. http://migsm.narod.ru/zk27.php

7. http://www.lektor5.narod.ru/inf/inf3.php

8. http://www.cos.ru/index.shtml?section=51&subsection=193&article=232