Общие положения.
Обобщение и классификация знаний.
Пополнение знаний.
Опыт показывает, что в процессе приобретения знаний может возникнуть ситуация, при которой представленные знания оказываются воспринятыми, но не до конца понятыми или понятыми неоднозначно. Подобная ситуация обуславливается тем, что, нередко, возникают трудности в передачи смыслового компонента информации, как в рамках естественного языка, так и в формализованном виде. По этой причине, например, сложно реализовать адекватную процедуру «понимания» текстовых файлов; с подобной проблематикой приходится сталкиваться в учебном процессе, при анализе ситуаций и др.
Стандартный путь разрешения подобных проблем осуществляется посредством процедуры, которая сводится к пополнению имеющихся знаний дополнительной информацией до уровня адекватного понимания интересующей ситуации. В связи с этим необходимы механизмы восстановления недостающей информации по представленным и приобретенным знаниям. Такие механизмы хорошо известны в и, например, в рамках учебного процесса один из таких механизмов реализуется с помощью вопросов, которые учащиеся задают учителю после (или в процессе) объяснения им нового материала в целях устранения возникшего недопонимания представленных знаний. Для пополнения знаний в ИИ-системах требуются определенные формализованные процедуры, среди которых наиболее известны: модель «здравого смысла» (Р. Шенк, 1980), сценарии (Литвинцева Л.В., 1986) и описание закономерностей внешнего мира в рамках псевдофизических логик с соответствующими правилами вывода (Поспелов Д.А., 1986) [1]. Следует отметить, что путем пополнения базы знаний можно создать мощные стимулы для установления новых фактов из тех, которые имеются в этой базе, и, следовательно, таким образом, может формироваться определенная стратегия обучения.
Способность человеческого мышления к обобщению лежит в основе любого научного исследования. С психологической точки зрения, обобщение – это мыслительная процедура, представляющая одну из характеристик когнитивных процессов, которая реализуется посредством абстракции, анализа и сравнения, и состоит в выделении и фиксации достаточно устойчивых инвариантных свойств рассматриваемых предметов и их отношений. С логической точки зрения, обобщение – это некоторое правило вывода, которое строится следующим образом: по совокупности фактов F, в рамках определенных правил и требований, формируется гипотеза H, однозначно объясняющая факты F. В формализованном виде это правило представляется следующим образом: , где H – называют обобщением фактов совокупности F. С кибернетической точки зрения, в системах, моделирующих мышление, обобщение рассматривается как процесс получения знаний, объясняющих имеющиеся факты, и, способных объяснить, классифицировать и предсказывать новые знания.
Модели обобщения определяются целями обобщения, способами представления знаний, общими характеристиками обобщаемых фактов, критериями оценки гипотез и др. Согласно [1], можно выделить модели обобщения по выборкам и модели обобщения по данным. В первом случае совокупность фактов F задается обучающей выборкой в виде множества объектов, с каждым из которых сопоставлен определенный класс элементов из F. В рамках этой модели целью обобщения может быть:
1). Формирование понятий путем установления по данным обучающей выборки для каждого класса максимального набора его общих характеристик.
2). Классификация фактов, т.е. определение базисного набора характеристик, позволяющих однозначно идентифицировать каждый класс в совокупности F.
В моделях обобщения по данным априорное разбиение F на классы не задается, что позволяет рассматривать следующие задачи:
1). Формирование гипотезы, обобщающей данные факты.
2). Проводить группировку данных по признакам, с последующим формированием понятий.
В зависимости от способа представления знаний и характеризации обобщаемых фактов, методы обобщения делятся на методы обобщения по признакам и структурно-логические методы. В первом случае элементы F представляются векторами, координаты которых определяют набор необходимых признаков для идентификации элементов F. Структурно-логические методы предназначены для реализации обобщений в формально-логических системах и в этом случае обычно называются индуктивным выводом, с общим правилом, представленным выше.
Таким образом, обобщение, в рамках формирования понятий, классификации фактов и структуризации данной предметной области знаний, фактически, реализует формирование учебной научной дисциплины, при условии, что указанная триада операций со знаниями проводится в надлежащем соответствии с дидактическими принципами. В этом ключе можно рассматривать задачи оптимизации формирования предметного материала учебной дисциплины из знаний, причем, параметром управления в данном случае являются гипотезы, выдвигаемые при обобщении знаний. Поэтому процедура выдвижения гипотез должны формироваться посредством некоторого критерия предпочтения (доминирования) между альтернативными гипотезами. Обычно, доминирующей считается гипотеза, которая «проще» и «более совместима с исходными данными». Следовательно, для сравнения гипотез и должны задаваться два отношения и , называемые соответственно, отношением предпочтения и совместимости:
«H1 проще H2»; (7.1)
«H совместима с обучающей выборкой V»; (7.2)
на основе которых формулируется необходимый критерий предпочтения:
«H1 лучше H2», (7.3)
позволяющий оптимизировать процедуру выдвижения гипотез.
Лекция 8. Дедуктивный вывод на знаниях.
В дедуктивных моделях представления и обработки знаний решаемая проблема записывается в виде утверждений формальной логики. Цель – в виде утверждения, справедливость которого следует установить или опровергнуть на основании аксиом (общих законов) и правил вывода формальной системы. В качестве формальной системы обычно используется исчисление предикатов 1-го порядка [4;5].
В соответствии с правилами, установленными в формальной системе, заключительному утверждению – теореме, полученной из начальной системы утверждений (аксиом, посылок), приписывается значение 1 (истина), если каждой посылке и аксиоме также приписано значение 1. Формула В является логическим следствием формул тогда и только тогда, когда для любой интерпретации, в которой конъюнкция истинна, формула В также истинна.
Доказательством теоремы называется поиск ответа на вопрос: следует ли логическая формула В из заданного множества формул , что равносильно доказательству общезначимости формулы или противоречивости (невыполнимости) формулы . Практически, проще доказывать противоречивость формулы, причем, процедура установления невыполнимости формулы называется процедурой опровержения.
В формальной логике установлено [4;5], что не существует эффективной разрешающей процедуры (алгоритма) для исчисления предикатов 1-го порядка, позволяющей выяснить по заданной формуле, является ли она теоремой или нет. Однако это ограничение, следуя тезису Гильберта (п.5.2), в большинстве случаев преодолевается в рамках усиленных вариантов формальной логики 1-го порядка [6;7].