Типы знаний.
Под термином знания в искусственном интеллекте понимают совокупность специализированных (ориентированных на решение многих задач из ограниченной предметной области) фактов, правил их обработки, условий применения правил к конкретным фактам, методов получения новых фактов и способов организации процемма логического вывода.
Знания. База знаний.
Представление знаний о внешнем мире в интеллектуальных системах
Лекция 2
В рамках направления «представление знаний» решаются задачи, связанные с формализацией представлением знаний в памяти ИС. Для этого разрабатываются специальные модели представления знаний и языки для описания знаний, выделяются различные типы знаний. Основными вопросами при представлении знаний являются определение состава знаний, т. е. определение того «что представлять» и «как представлять» знания.
При представлении знаний решаются следующее задачи:
- определение состава представляемых знаний;
- организация знаний;
- определение проблемной среды;
- разработка архитектуры ИС;
- определение потребностей и целей пользователей;
- выбор языка общения.
Для функционирования ИС требуются следующие знания:
- знания о процессе решения задачи;
- знания о языке общения и способах организации диалога, используемые лингвинистическим процессором;
- знания о способах представления модификации знаний, используемые компонентом приобретения знаний;
- поддерживающие структурные и управляющие знания, используемые объяснительным компонентом;
- знания о методах взаимодействия с внешним окружением;
- знания о модели внешнего мира.
Состав знаний зависит от требований пользователя и проявляется в следующем:
- какие задачи и с какими данными хочет решать пользователь;
- каковы предпочтительные способы и методы решения;
- при каких ограничениях на количество результатов и способы их получения должна быть решена задача;
- каковы требования к языку общения и организации диалога;
- какова степень конкретности знаний о пробдемной области,доступная пользователю;
- каковы цели пользователей.
Интеллектуальная деятельность человека связана с поиском решений (действий, закономерностей), в новых, нестандартных ситуациях. Любая интеллектуальная деятельность опирается на знания о предметной области, в которой ставятся и решаются задачи.
Данные – это факты, сведения и идеи, представленные в формализованном виде, позволяющем передавать или обрабатывать их Ред.:Под термином "знания" подразумевается не только та информация, которая поступает в мозг через органы чувств. Такого типа знания чрезвычайно важны, но недостаточны для интеллектуальной деятельности. Дело в том, что объекты окружающей нас среды обладают свойством не только воздействовать на органы чувств, но и находиться друг с другом в определенных отношениях. Ясно, что для того, чтобы осуществлять в окружающей среде интеллектуальную деятельность (или хотя бы просто существовать), необходимо иметь в системе знаний модель этого мира. В этой информационной модели окружающей среды реальные объекты, их свойства и отношения между ними не только отображаются и запоминаются, но и могут мысленно "целенаправленно преобразовываться". При этом существенно то, что формирование модели внешней среды происходит "в процессе обучения на опыте и адаптации к разнообразным обстоятельствам".
Японский словарь - "знания" – результат, полученный познанием; система суждений, основанная на объективной закономерности.
Русский словарь - "знания"– проверенный практикой результат познания действительности, верное её отражение в мышлении человека.
Другие определения:
. Знания – это совокупность сведений, образующих целостное представление, соответствующее определенному уровню осведомленности о некотором вопросе, предмете, проблеме, явлении. Знания описывают основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи. Знания являются основным понятием в ИС. Можно выделить еще ряд определений:
1. Знания – это результат, полученный познанием окружающего мира и его объектов.
2. Знания – это система суждений с принципиальной и единой организацией, основанная на объективной закономерности.
3. Знания – это формализованная информация, на которую ссылаются или которую используют в процессе логического вывода.
4. Под знанием понимается совокупность фактов и правил манипулирования фактами.
Проблема выделения знаний, прежде всего, относится к областям преобладания эмпирического знания, где накопление фактов опережает развитие теории. Знания важны там, где определения размыты, понятия меняются, ситуация зависит от множества контекстов, где велика неопределенность и нечеткость информации (контекст – относительно законченная в смысловом отношении часть текста высказывания). Таким образом, знания – это специальная форма представления смысловой информации, позволяющая хранить, воспроизводить и понимать эту информацию.
Знания обычно представляют в форме фактов, характерных для окружающего мира, и правил манипулирования фактами. Причем под фактом понимают элементарное высказывание с некоторой оценкой. Любую осмысленную часть факта считают данными, т.е. факты – это совокупности данных.
Данные сами по себе не несут смысловой нагрузки. Например, число 16.40 не имеет в себе смысла до тех пор, пока мы не узнаем, что это время отправления поезда или цена товара, т.е. данные нуждаются в интерпретации. В отличие от данных знания несут в себе определенную смысловую нагрузку, представляя собой нечто большее, чем просто последовательность символов. Этот смысл позволяет путем символьной обработки получать новую информацию.
Знания отличаются от данных рядом существенных свойств:
- единицей обрабатываемой информации является факт, а нен запись данных;
- знания обладают внутренней интерпретированностью – понимание смысла, семантики информационных единиц обеспечивается внутри модели, а не только в сознании исследователя; Данные в ЭВМ могут интерпретироваться только соответствующей программой. Знания отличаются тем, что в них присутствует возможность содержательной интерпретации. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомянуто.
- знания обладают активностью – появление новых фактов в системе приводит к инициации процедур, обрабатывающих уже известные системе факты, т.е. данные управляют программой;
- знания обладают структурируемостью. Структурированность знаний проявляется при использовании отношений типа « элемент-класс» и «часть- целое», что позволяет выделять реализовать возможность вложения одних знаний в другие; Информационные единицы должны обладать гибкой структурой. Разнообразные формы хранения данных не обеспечивают возможности компактного описания всех связей между различными типами данных. При переходе к знаниям между отдельными единицами знаний можно установить такие отношения как «элемент-множество», «тип-подтип», «ситуация-подситуация», «часть-целое», отражающие характер их взаимосвязей. Каждая информационная единица может быть включена в состав другой, и из каждой информационной единицы можно выделить некоторые составляющие ее информационные единицы.
- знания обладают связностью – между фактами и правилами имеется возможность установления функциональных, казуальных, структурных, семантических отношений, отношений эквивалентности (подобия, тождества), противоположности и др. В информационной базе между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Прежде всего, эти связи могут характеризовать отношения между информационными единицами. Семантика отношений может носить декларативный или процедурный характер. Например, две или более информационные единицы могут быть связаны отношением «одновременно», две информационные единицы – отношением «причина-следствие». Эти отношения характеризуют декларативные знания. Если между информационными единицами установлено отношение «аргумент-функция», то оно характеризует процедурное знание. Различают отношения структуризации, функциональные отношения, казуальные отношения и семантические. С помощью первых задаются иерархии информационных единиц, вторые несут процедурную информацию, третьи задают причинно-следственные связи, четвертые соответствуют всем остальным отношениям.
- Знания обладают семантической метрикой – отношение близости понятий, силы ассоциативной связи между ними. Ее наличие позволяет выделять информацию, относящуюся к типовым и степень неопределенности информации о предметной области в процессе перехода к очередному этапу решения интеллектуальной задачи. Это ситуациям, например, «выход из строя элемента системы», «блокировка пакетов» и т.п.;
- знания обладают конвертируемостью представления. Конвертируемость представления – свойство изменять форму представления, уровень детализации и степень неопределенности информации о предметной области в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, формально отражает динамичность знаний и связано с обучением системы.
Формально под фактом подразумевается запись:
F = «N, V, C,L,M»
N – имя или идентификатор факта;
V – значение факта, определяемое на численной шкале с метрикой, логической, нечеткой или лингвинистической шкалеж
С – степень уверенности;
L – множество связей факта с другими знаниями;
M – множество допустимых функций, преобразований, операций, способов вычисления значения факта, имеющих смысл в рассматриваемой предметной области.
Другими словами, факт – это запись данных, наделенная семантикой.
Правилами в общем случае являются знания вида:
« Если Х есть А, то Y есть В, иначе есть С».
Условия применимости правил, а также знания относительно способов использования фактов и правил относятся к метазнаниям ( знаниям о знаниях), которые необходимы для управления выводом, пополнения знаний и.т.п. Часто такие правила и способы являются эвристическими. виде система семантической обработки информации, основанная на концепции баз знаний , включает:
- базу знаний, состоящую из база фактов и правил как декларативной части, а также базы процедур и функций, как процедурной части описания объекта;
- механизм логического вывода – высокоуровневый интерпретатор, обеспечивающий обработку фактов на основе правил и процедур формирования решений для задач пользователя;
- интерфейс с пользователем на языке, близком к естественному;
- базу целей, содержащую механизм целеполагания в рамках исследуемой предметной области и целевые установки самой системы.
Для того чтобы данные превратились в знания, они должны быть определенным образом структурированы. Знание с этих позиций - некоторая организационная форма мышления, отражающая существенные свойства, связи и отношения предметов и явлений. Полезные знания – это данные, организованные в понятия.
Знания представляют собой иерархические структуры. Общие знания, касающиеся целых подобластей данной предметной области, включают в себя более узкие, касающиеся каких-то отдельных признаков или специальных вопросов из предметной области.
Между элементами и объектами знаний существуют функциональные и казуальные (причинностные) отношения. Функциональные отношения несут процедурную информацию, позволяющую определять или вычислять одни объекты через другие. Казуальные отношения задают причинно-следственные связи.
Семантика (смысловое значение, содержание) отношений между объектами может носить декларативный (данные) или процедурный (программы) характер
Перечисленные особенности информационных единиц определяю ту грань, за которой данные превращаются в знания, а базы данных перерастает в базы знаний. Совокупность средств, обеспечивающих работу с знаниями, образует систему управления базой знаний.
Классификация знаний.
Знания делятся на формализованные и неформализованные. Формализованные знания выражаются в виде законов, формул, алгоритмов, моделей и т.п. Такие знания описываются в книгах и руководствах и отражают точные и универсальные знания в виде строгих суждений.
Неформализованные знания (вербальные - словесные) субъективны и приблизительны. Они являются результатом обобщения многолетнего опыта работы и интуиции специалиста и представляют собой некоторое множество эмпирических приемов и правил логического вывода. Это - ключевые понятия для ИИ.
Поверхностные знания - это в основном приблизительные знания, эвристики и некоторые закономерности, устанавливаемые опытным путем. Такие знания в силу их приблизительности называют также экспертными.
Глубинные – отражают наиболее общие принципы, в соответствии с которыми развиваются все процессы в предметной области и свойства этих процессов. К глубинным относятся знания, основанные на теориях, абстракциях и аналогиях, в которых отражается понимание структуры предметной области. Для получения глубинных знаний необходимо понять внутренние механизмы, действующие в предметной области, и, прежде всего, основные закономерности, которые обуславливают принятие правильных решений. Глубинные знания используются прежде всего при решении неординарных ситуаций.
Процедурные знания – это знания, которые могут быть представлены процедурой или процессом. В компьютерной программе эти знания хранятся как код, а не как данные. Программные алгоритмы являются формой процедурных знаний, т.к. они содержат информацию о том, как решить конкретную задачу.
Декларативные – это знания, которые хранятся как данные. В декларативном представлении легко добавлять или изменять знания, т.к. они независимы от программы.
Статистические – тип знаний, которые не изменяются в процессе решения задачи.
Динамические – могут приобретаться с течением времени.
Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях.
Мягкие знания допускают множественные, расплывчатые решения и различные варианты рекомендаций.
Кроме указанных понятий используется понятие метазнания (знания о знаниях). Оно используется для обозначения знаний о способах использования знаний и свойств знаний.
В общем виде знания в ЭВМ представляются некоторой знаковой (семиотической) системой. С понятием «знак» непосредственно связаны понятия денотат и концент. Денотат – это объект, обозначаемый данным знаком. Концент – свойства денотата.
Экстенсионал знака определяет класс всех его допустимых денотатов. Интенсионал знака определяет содержание связанных с ним понятий.
Интенсиональные знания описывают абстрактные объекты, события, отношения. Например, поставщик, потребитель, транспорт. Экстенсиональные знания представляют собой данные, характеризующие конкретные объекты, их состояние, значения параметров в определенные отрезки времени. Экстенсионалом поставщика может быть завод, потребителя – предприятие, транспорта – автомобиль.
В семиотической (знаковой) системе выделяют три аспекта: синтаксический, семантический и прагматический.
Синтаксис описывает внутреннее устройство знаковой системы, т.е. правила построения и преобразования сложных знаковых выражений. Семантика определяет отношения между знаками и их концентами, т.е. задает смысл или обозначения конкретных знаков. Прагматика определяет знак с точки зрения конкретной сферы применения, либо субъекта, использующего данную знаковую систему.
Для хранения данных и знаний используются базы данных и базы знаний. База данных – это совокупность связанных данных, хранящихся с минимальной избыточностью и используемых различными приложениями посредством системы управления базами данных. База знаний – это совокупность описывающих предметную область правил и фактов, позволяющих с помощью механизма вывода решать вопросы, ответ на которые в явном виде в базе отсутствует. БЗ как программное средство обеспечивает поиск, хранение, преобразование и запись в память ПК сложно структурированных информационных единиц – знаний.
Совокупность модели представления знаний и связанных с ней процедур образуют систему представления знаний. База знаний и база данных рассматриваются как разные уровни информации, хранящейся в интеллектуальном банке информации. Системы управления базами знаний являются развитием систем управления базами данных..
Знания в ИС можно представить следующей схемой преобразования (рис.3).
Рис.3 Схема преобразования знаний.
Блок представления знаний БПЗ связан с внешним миром (окружающей средой) двумя блоками преобразователей БП1 и БП2, которые преобразуют знания о предметной области из внешнего представления ВшП во внутреннее ВтП и наоборот.
|
|
|
БПЗ
|
Рис.4. Модель блока представления знаний
Где БИ – блок интерпретаций, ИБД – интелл. банк данных,
БО – блок обучения, БЗ, БД – база знаний, база данных.
БВР – блок вывода решений,
С учетом архитектуры ИС знания целесообразно делить на интерпретируемы и неинтерпретируемые. К первому типу относятся те знания, которые способен интерпретировать решатель. Все остальные знания относятся ко второму типу. Неинтерпретируемые знания подразделяются на вспомогательные, хранящие информацию о лексике и грамматике языка общения, информацию о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно-языковой компонентой. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания выполняют роль описаний (обоснований) как интерпретируемых знаний, так и действий системы. Поддерживающие знания подразделяются на технологические и семантические. Технологические содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т. п. Семантические содержат смысловое описание этих знаний. Они содержат информацию о причинах ввода знаний, о назначении знаний, описывают способ использования знаний и получаемый эффект.
Интерпретируемые знания можно разделить на предметные, управляющие и знания о представлении. Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. В предметных знаниях выделяют описатели и собственно предметные знания. Предметные знания разбиваются на факты и исполняемые утверждения. Факты определяют возможные значения сущностей и характеристик предметной области. Исполняемые утверждения содержат информацию о том, как можно изменять описание предметной области в ходе решения задачи, т. е. это знания, задающие процедуры обработки. Описатели содержат определенную информацию о предметных знаниях, такую, как коэффициент определенности правил и данных, меры важности и сложности.
Управляющие знания можно разделить на фокусирующие и решающие. Фокусирующие описывают, какие знания следует использовать в той или иной ситуации. Решающие знания содержат информацию, используемую для выбора способа интерпретации знаний, подходящего к текущей ситуации. Эти знания используются для выбора стратегий или эвристик.
Качественные и количественные показатели ИС могут быть значительно улучшены за счет использования метазнаний, т. е. знаний о знаниях. Метазнания не представляют некоторую единую сущность, они могут применяться для достижения различных целей. Возможные назначения метазнаний:
- в виде стратегических метаправил они используются для выбора необходимых правил;
- используются для обоснования целесообразности применения правил;
- используются для обнаружения синтаксических и семантических ошибок в предметных правилах;
- позволяют системе адаптироваться к окружению путем перестройки предметных правил и функций;
- позволяют явно указать возможности и ограничения системы, т. е. Определить, что система знает, а чего не знает.