Лекция 10. Данные и знания.
Термины: данные и знания, база данных и база знаний, поверхностные и глубинные знания, процедурные и декларативные знания.
План темы:
· 10.1. Данные и знания
· 10.2. Модели представления знаний
Вспомнить вопросы:
· Что представляют собой базы данных?
· В чём отличия процедурного и декларативного программирования?
10.1. Данные и знания
При изучении интеллектуальных систем традиционно возникает вопрос - что же такое знания и чем они отличаются от обычных данных, десятилетиями обрабатываемых ЭВМ. Можно предложить несколько рабочих определений, в рамках которых это становится очевидным. Данные - это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.
При обработке на ЭВМ данные трансформируются, условно проходя следующие этапы:
· данные как результат измерений и наблюдений;
· данные на материальных носителях информации (таблицы, протоколы, справочники);
· модели (структуры) данных в виде диаграмм, графиков, функций;
· данные в компьютере на языке описания данных;
· базы данных на машинных носителях.
Знания связаны с данными, основываются на них, но представляют результат мыслительной деятельности человека, обобщают его опыт, полученный в ходе выполнения какой-либо практической деятельности. Они получаются эмпирическим путем. Знания - это выявленные закономерности предметной области (принципы, связи, законы), позволяющие решать задачи в этой области.
При обработке на ЭВМ знания трансформируются аналогично данным:
· знания в памяти человека как результат мышления;
· материальные носители знаний (учебники, методические пособия);
· поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
· знания, описанные на языках представления знаний (продукционные языки, семантические сети, фреймы - см. далее);
· базы знаний.
Часто используются такие определения знаний: знания - это хорошо структурированные данные, или данные о данных, или мета-данные. Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний - базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний - основа любой интеллектуальной системы.
10.2. Модели представления знаний
Знания могут быть классифицированы по следующим категориям:
· поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;
· глубинные - абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.
Современные экспертные системы работают в основном с поверхностными знаниями. Это связано с тем, что на данный момент нет адекватных моделей, позволяющих работать с глубинными знаниями.
Кроме того, знания можно разделить на процедурные и декларативные. Исторически первичными были процедурные знания, т.е. знания, "растворенные" в алгоритмах. Они управляли данными. Для их изменения требовалось изменять программы. Однако с развитием искусственного интеллекта приоритет данных постепенно изменялся, и все большая часть знаний сосредоточивалась в структурах данных (таблицы, списки, абстрактные типы данных), т.е. увеличивалась роль декларативных знаний.
Сегодня знания приобрели чисто декларативную форму, т.е. знаниями считаются предложения, записанные на языках представления знаний, приближенных к естественному и понятных неспециалистам.
Существует множество способов определять понятия. Один из широко применяемых способов основан на идее интенсионала. Интенсионал понятия - это определение через понятие более высокого уровня абстракции с указанием специфических свойств. Этот способ определяет знания. Другой способ определяет понятие через перечисление понятий более низкого уровня иерархии или фактов, относящихся к определяемому. Это есть определение через данные, или экстенсионал понятия.
Пример 10.1. Понятие "персональный компьютер". Его интенсионал: "Персональный компьютер - это дружественная ЭВМ, которую можно поставить на стол и купить менее чем за $2000". Экстенсионал этого понятия: "Персональный компьютер - это Mac, IBM PC, Sinkler...".
Существуют десятки моделей (или языков) представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:
· формальные логические модели;
· продукционные;
· семантические сети;
· фреймы.
Таким образом: Данные - это отдельные факты, характеризующие объекты и их свойства. Знания - это выявленные закономерности предметной области, представляют результат мыслительной деятельности человека. Знания могут быть классифицированы как поверхностные и глубинные, а также на процедурные и декларативные. Современные экспертные системы работают в основном с поверхностными и декларативными знаниями. Существуют десятки моделей и языков представления знаний для различных предметных областей.
Вопросы:
· Чем отличаются данные и знания?
· Чем отличаются база данных и база знаний?
· В чём особенности поверхностных и глубинных знаний?
· Чем отличаются процедурные и декларативные знания?
Дополнительные ссылки: