Решающие правила экспертов

Граничные элементы классификации

Основные идеи метода экспертной классификации

Формальная постановка задачи классификации

Экспертные знания в задачах классификации с явными признаками

Задачи классификации объектов, описываемых многими признаками, широко распространены на практике. Приведем примера.

1. Наиболее часто встречающаяся профессиональная задача г повседневной деятельности врача — диагностика заболевания о совокупности клинических и инструментальных признаков, Дописывающих состояние пациента.

2. Одна из распространенных задач в геологии — поиск ме­сторождения полезных ископаемых. Сбор информации позво­ляет характеризовать различные районы по совокупности при-. знаков, в той или иной степени типичных для месторожде­ний. По этим признакам определяют наиболее перспективные районы [8].

3. Поиск причин неисправностей, поломок в сложной ма­шине или механизме. Каждая поломка может быть описана со­вокупностью признаков. Именно по этим признакам инженер определяет тип неисправности [8].

Что же общего в деятельности инженера, геолога, врача? Это общее можно представить в формальном виде следующим образом. Имеются объекты, описываемые многими признака­ми. Необходимо отнести эти объекты к определенным классам решений. Наиболее важная характеристика таких задач приня­тия решений - их повторяемость: люди решают данные задачи многократно, вырабатывая навыки наиболее успешного, эффек­тивного решения. Количество повторных решений различно для разных областей профессиональной деятельности. Врач по­вседневно решает задачи распознавания одного и того же объ­екта — признаков заболеваний в различных их сочетаниях. За­дачи, связанные с выбором района для разработки, решает многократно и геолог. В отличие от врача и геолога инженер имеет дело с изменяющимися объектами (новые конструкции машин, механизмов).

Общим в приведенных выше примерах является то, что имеется полный для конкретной профессиональной задачи на­бор признаков, их значений и классов решений.

Признаки, значения которых характеризуют объект и по­зволяют отнести его к тому или иному классу, заданы так, что и их измерения могут, как правило, осуществляться либо другим человеком, либо прибором. Так, измерение-процента содержа­ния в почве какого-то минерала определяется по желанию экс­перта-геолога, но он не обязательно участвует в этих измерени­ях. Врач-эксперт определяет состав признаков, необходимых для диагностики определенного заболевания, но он использует данные электрокардиограммы или эхокардиограммы, снятых его помощником. Он может также давать советы по телефону либо по Интернету, используя описание пациента, данное дру­гим врачом.

Совсем по-иному обстоит дело у шахматистов. Первичным материалом является расположение фигур. Анализируя распо­ложение фигур, шахматист характеризует его для себя оцен­ками по ряду признаков, таких как, например, возможность развития атаки, угрозы королю и т.д. Здесь даже измерение значений признаков — искусство (умение) эксперта.

Назовем задачами классификации с явно заданными при­знаками такие задачи, в которых искусство эксперта проявля­ется в основном в умении «увидеть» через заданную совокуп­ность значений отдельных признаков целостный образ объекта. Задачи классификации с явными признаками широко распро­странены в человеческой практике. Далее речь будет идти только о таких задачах.

Задача классификации с явными диагностическими приз­наками может быть сформулирована следующим образом [7]. -

Дано: N — число диагностических признаков; Si - число упорядоченных и, как правило, вербальных оценок качества на шкале i-го диагностического признака;

множество оценок на шкале i-го признака; Q - количество ди­агностических классов (Рi,Р2,...,,Рq), к которым могут при­надлежать классифицируемые объекты.

Декартово произведение А шкал признаков определяет множество всех гипотетически возможных- состояний, опи­сываемых диагностическими признаками. Состояние аi при­надлежащее А, описывается вектором (аi1, аi2,...,аiN), где j-м "компонентом является одно из значений на шкале i-го диагно­стического признака.

Требуется: на основе знаний эксперта классифицировать все векторы ai, отнеся каждый из них к одному или несколь­ким классам решений.

Особенностью данной постановки задачи является следую­щее. Предположим, что эксперт (врач, геолог, инженер) опре­делил полный набор диагностических признаков, необходимых ему при решении задачи классификации. Этим задано полное пространство всех возможных состояний объекта исследования (больного, месторождения, механизма и т.д.). В приведенной выше постановке задачи впервые ставится целью построение полной классификации, т.е. классификации всех возможных состояний объекта исследования. В отличие от этого в других постановках речь обычно идет о выявлении какой-то части знаний [9].

Данная постановка задачи основана на предположении, что эксперт обладает полнотой знаний. Необходим подход, позво­ляющий их выявить.

Для решения поставленной выше задачи были разработаны методы, основанные на идеях [7], рассмотренных далее.

11.1. Структуризация проблем

Чтобы передать знания компьютеру, нужен общий язык, характеризующий конкретную предметную область. Удобен язык признаков (или характеристик), описывающих объект ис­следования. Таким объектом при построении баз медицинских знаний является больной, обратившийся к врачу с жалобами на боли. Признаки или характеристики в данном случае опи­сывают состояние больного: локализация болей, их характер, иррадиация, частота пульса, артериальное давление, темпера­тура и т.д.

Как определить перечень признаков, адекватно представ­ляющий состояние объекта исследования? Для этой цели раз­работана человекомашинная процедура АРИАДНА [10], кото­рая имитирует диалог по телефону между неопытным специа­листом, находящимся рядом с объектом исследования и прово­дящим измерения, и экспертом, находящимся далеко от объёкта. Диалог строится таким образом, что компьютер задает во­просы эксперту, использует его ответы для постановки новых вопросов и т.д. Приведем пример такого диалога.

Компьютер: Вас просят помочь в постановке диагноза. На­чинающий врач сообщает вам по телефону, что пациент без сознания и что подозревается диабетическая кома. Каким будет ваш первый вопрос?

Эксперт: Начало заболевания - постепенное или внезапное?

Компьютер: А что более характерно для диабетической комы?

Эксперт: Постепенное начало.

Компьютер: Предположим, что начало было постепенное. Каким будет ваш следующий вопрос?

В ходе диалога эксперт называет признаки и их возможные значения, упорядочивает признаки по характерности для дан­ного заболевания, решая привычные для себя задачи постанов­ки диагноза.

В системе АРИАДНА использованы идеи «диагностических игр», предложенные И.М. Гельфандом [11].

Итак, при подобном подходе процедуры структуризации могут быть представлены следующим образом. Компьютер ста­вит вопросы эксперту, приглашая его классифицировать объект исследования и называть один за другим признаки, используе­мые при классификации и их возможные значения для каждо­го класса решений.

Результатом этого этапа является совокупность признаков, необходимая для полной классификации объектов определенно­го типа, все возможные значения этих признаков, а также пе­речень классов решений.

11.2. Классификация состояний объекта исследования

Представленные выше характерные особенности эксперт­ных знаний позволяют считать адекватным способом получе­ния информации от эксперта тот, при котором эксперт решает привычную для себя задачу. Для проблем классификации с яв­ными признаками такой задачей является анализ описания объекта исследований, данного как совокупность значений ди­агностических признаков. Этот анализ привычен для эксперта. Можно ожидать, что при таком анализе полностью проявляются его знания.

В качестве примера приведем задачу дифференциальной диагностики тромбоэмболии легочной артерии (ТЭЛА) и остро­го инфаркта миокарда (ОИМ) [12,15]. Перечень диагностических признаков, указанных экспертами: 1) анамнез, факторы риска; 2) боль; 3) цвет кожи; 4) дыхание; 5) артериальное дав­ление; 6) электрокардиограмма; 7) рентгенограмма грудной клетки; 8) эхокардиограмма; 9) ферменты крови.

На шкале каждого из признаков эксперты выделили несколько значений, причем два из них наиболее характерны со­ответственно - одно для ТЭЛА, другое для ОИМ. Например, для первого диагностического признака шкала имеет вид:

• в анамнезе операция, травма, роды, тромбофлебит, опухоли;

• в анамнезе стенокардия, ишемическая болезнь сердца; . в анамнезе патологии нет.

Описание проблемы вводится в компьютер. Комбинируя значения диагностических признаков, компьютер предъявляет эксперту одно из возможных состояний объекта исследования (больного) в виде клинической ситуации. Кроме того, эксперту предоставляется перечень классов решений, к одному или не­скольким из которых он относит клиническую ситуацию.

11.3. Гипотеза о характерности

При получении информации от эксперта активно использу­ется гипотеза о различной характерности значений диагности­ческого признака по отношению к каждому из классов. Иначе говоря, предполагается, что эксперт может упорядочить все значения каждого диагностического признака по их характер­ности для каждого из классов решений и что это упорядочение не зависит от значений других признаков.

Возьмем i-й диагностический признак. Два любых значе­ния на его шкале Xli и Xki находятся в следующем отношении

характерности для класса Рj :

Xli,Xki є Dpj

 

где DPj отношение доминирования по "характерности для класса Рj . Другими словами, мы ввели бинарное отношение

доминирования для значений одного диагностического призна­ка ( Xli более характерен для класса Рj ).

Вернемся к проблеме дифференциальной диагностики тромбоэмболии легочной артерии и инфаркта миокарда. Одним из диагностических признаков, используемых врачом-экспер­том, является цвет кожи в момент осмотра больного. Шкала данного признака имеет следующие значения;

1) резкий цианоз лица, шеи, верхней половины туловища;

2) бледность кожных покровов, акроцианоз;

3) нормальный цвет кожи.

По характерности для ТЭЛА эти значения могут быть упо­рядочены так: 3—2—1. Для ИМ упорядочение по характерности иное: 2-3-1.

Используя бинарные отношения характерности по отдель­ным признакам, можно построить отношение доминирования по характерности для каждого класса на множестве состояний (векторов аi ):

 

(ai,ai)єDpi

 

если для каждого из диагностических признаков значение со­ответствующего компонента вектора аi не менее характерно по

отношению к классу Рj , чем значение компонента вектора аi ,

и хотя бы для одного компонента более характерно, то выпол­няется условие доминирования по характерности, приведенное выше,

Использование гипотезы о характерности позволяет суще­ственно уменьшить число вопросов эксперту, необходимое для построения полной классификации.

Пусть эксперт отнес к классу Рi какое-то состояние аi

объекта исследования. Это означает, что сложившийся у него (по описанию) образ объекта характерен для данного класса. В то же время отдельные признаки не обязательно имеют са­мые характерные значения для класса Рi . Логично предположить, что другие состояния, описание которых совпадает с аi , кроме значений тех диагностических признаков, которые заме­нены на более характерные для класса Р^ , также относятся к классу Pi На формальном языке можно утверждать, что ис­пользование сформулированной выше гипотезы доминирования по характерности позволяет построить на множестве состояний А конус доминирования по характерности. Один ответ экс­перта позволяет классифицировать сразу группу состояний.

Мы называем используемое правило гипотезой потому, что могут быть случаи, когда распространение по характерности некорректно. Подобные случаи возникают при зависимости диагностических признаков. Поэтому применение гипотезы о характерности должно сопровождаться ее проверкой (см. далее).

11.4. Проверка информации эксперта и гипотезы о характерности

Как отмечалось, не ошибающихся экспертов не бывает. По­этому информацию эксперта следует подвергать проверке, осно­ванной на использовании условий доминирования по харак­терности.

Формально такую проверку можно представить следующим образом. Пусть на каком-то этапе диалога «компьютер—экс­перт» состояние аi: было отнесено к классу Рi: аi є Рi. После каждого ответа эксперта осуществлялось распространение по доминированию. Построенные конусы доминирования по ха­рактерности в общем случае пересекаются. Это означает, что некоторые состояния могут быть классифицированы несколько раз. Предположим, что при этом классификации какого-то со­стояния а„ различаются. Тогда, например, (аv,аj)єDPi, но aj єP1, т.е. ау более характерно для класса Р, , чем аj, однако аV оказалось отнесенным (при другом ответе эксперта) к классу Рl .Этот факт может быть как ошибкой эксперта, так и прояв­лением зависимости диагностических признаков.

При выявлении противоречия в классификации компьютер предъявляет эксперту на экране описания двух состояний и просит еще раз их проанализировать. Если эксперт обнаружи­вает свою ошибку, он ее устраняет и опрос продолжается. Если эксперт подтверждает обе противоречивые классификации, то:

· с помощью эксперта выделяется подмножество зависимых диагностических признаков;

· с помощью эксперта выделяется подмножество зависимых диагностических признаков;

 

Аналитические оценки показывают, что в среднем около 25% ответов экспертов проверяются, что позволяет считать созданную базу знаний непротиворечивой и надежно отражаю­щей экспертные знания.

 

11.5. Определение последовательности состояний для предъявления эксперту в процессе классификации

 

Как было показано выше, классификация состояния объек­та исследования позволяет косвенно классифицировать ряд других состояний (либо уменьшить неопределенность). Это дает возможность построить полную классификацию, т.е. решить поставленную задачу, предъявив эксперту сравнительно не­большое число состояний. Для реализации такой возможности необходимо найти стратегию выбора очередного состояния для предъявления эксперту.

Система КЛАСС [7], а также последовавшие за ней системы ДИФКЛАСС [13], СТЕПКЛАСС [14] и КЛАНШ [15] отличаются друг от друга стратегией предъявления состояний эксперту.

Так, в системе КЛАСС осуществляется выбор наиболее ин­формативного состояния. Предполагается, что все возможные ответы эксперта для любого неизвестного состояния объекта равновероятны. Для каждого неклассифицированного со­стояния вычисляются количества косвенно классифицируемых состояний при всех возможных ответах эксперта. Далее под­считывается среднее количество, которое и характеризует ин­формативность предъявления конкретного вектора. Компьютер осуществляет перебор всех неквалифицированных на данный момент состояний и выбирает то, для которого ожидаемое сред­нее количество косвенно классифицированных состояний мак­симально.

Существенно более эффективными (по числу обращений к эксперту) являются методы ДИФКЛАСС и КЛАНШ.

 

11.6. Трудоемкость построения баз знаний

 

Компьютерные системы построения полных и непротиво­речивых баз знаний ставят эксперту вопрос за вопросом до тех пор, пока все состояния (все векторы ai из множества А) не будут отнесены к одному или нескольким классам. Для создания таких баз знаний требуется от одной—двух недель до одного-двух месяцев работы с опытным экспертом (в зависимости от объема базы знаний).

Приведем конкретные данные по системе КЛАСС [7]. Для - создания базы знаний по семи коматозным заболеваниям (клас­сифицируются 2304 состояния пациента) потребовалось 12 ч работы эксперта, по 14 болезням, начинающимся с болевого синдрома в области живота (около 20 тыс. состояний), - 60 ч. Разработка первой базы знаний заняла примерно семь дней, второй — около месяца.

Система ДИФКЛАСС позволяет классифицировать в сред­нем до 700 состояний объекта исследования в час [13].

 

11.7. Проверка качества баз знаний

 

Основным критерием проверки построенных баз знаний яв­ляется степень совпадения решений, содержащихся в ней и принятых экспертом, который участвовал в создании этой базы знаний. Для небольших по размеру задач (порядка 100 диагно­стических правил) эксперт мог оценить каждую ситуацию. Че­рез некоторое время (две - три недели) он строил ту же базу знаний с помощью разработанной человекомашинной системы. Появлялась возможность сравнить ответы экспертов, получен­ные двумя разными способами.

Эксперты, решавшие задачу с малым числом противоре­чий, т.е. имевшие четкие правила, показали почти полное сов­падение своих решений. Для больших баз знаний сравнение проводилось по отдельным ситуациям; совпадение было прак­тически полным. Следовательно, созданная база знаний служит хорошим отражением личности эксперта, его «двойником» в определенной предметной области.

Построенную классификацию можно охарактеризовать с помощью граничных элементов. Назовем граничным элементом состояние, которое в соответствии с построенной классифика­цией: а) принадлежит множеству Э-П; б) может оказаться в другом классе при изменении только одного значения одного диагностического признака. Граничные элементы называются так потому, что они находятся на границе между двумя клас­сами решений (они имеют значения признаков, характерных для каждого из классов).

Отметим, что при построении классификации граничные элементы не могут быть проверены при помощи отношения до­минирования по характерности, поэтому они предъявляются эксперту повторно после построения классификации. Оказыва­ется, что граничные элементы могут быть применены для опи­сания правил классификации, подсознательно используемых экспертами.

 

Исследования показали [10], что граничные объекты клас­сов могут быть достаточно точно описаны сравнительно не­большим числом правил, имеющих структуру дерева (рис. 9.1).

На рис. 9.1 верхний кружок (корень дерева) представляет совокупность значений диагностических признаков, наиболее важных для данного класса (с точки зрения эксперта). К ним добавляется определенное количество характерных для данного класса значений менее важных признаков (нижние кружки). Например, при пяти диагностических признаках правило для класса Р, может иметь вид: характерные для первого класса значения второго и четвертого признаков (они обязательно присутствуют), к которым нужно добавить любые два харак­терных для Р, значения из оставшихся трех признаков.