Самообучающиеся нейросетевые экспертные системы в медицине теория, методология, инструментарий, внедрение
Россиев Дмитрий Анатольевич
Самообучающиеся нейросетевые экспертные системы в медицине: теория, методология, инструментарий, внедрение
По мотивам диссертации на соискание ученой степени доктора медицинских наук Красноярск – 1995-2000
Оглавление
ВВЕДЕНИЕ.............................................................................................................................................................................................. 3 НЕЙРОСЕТЕВЫЕ КОМПЬЮТЕРНЫЕ ЭКСПЕРТНЫЕ СИСТЕМЫ В МЕДИЦИНЕ (ОБЗОР ЛИТЕРАТУРЫ) ...................................................................................................................................................................................... 8 ТЕОРЕТИЧЕСКИЕ И МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ СОЗДАНИЯ МЕДИЦИНСКИХ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ .............................................................................................................................. 15 ЗАДАЧИ, РЕШАЕМЫЕ НЕЙРОННЫМИ СЕТЯМИ............................................................................................................................... 15 АРХИТЕКТУРА НЕЙРОННОЙ СЕТИ ................................................................................................................................................. 16 ФУНКЦИОНИРОВАНИЕ НЕЙРОНА .................................................................................................................................................. 17 ФУНКЦИОНИРОВАНИЕ НЕЙРОСЕТИ............................................................................................................................................... 18 ОБЩАЯ СХЕМА ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ .............................................................................................................................. 19 ОБУЧЕНИЕ НЕЙРОСЕТЕЙ-КЛАССИФИКАТОРОВ ............................................................................................................................. 19 ОБУЧЕНИЕ НЕЙРОСЕТЕЙ-ПРЕДИКТОРОВ ....................................................................................................................................... 22 МЕТОДОЛОГИЧЕСКИЕ АСПЕКТЫ ОБУЧЕНИЯ НЕЙРОСЕТЕЙ ........................................................................................................... 23 ТЕСТИРОВАНИЕ ПРИМЕРОВ........................................................................................................................................................... 24 ОБЩИЕ АСПЕКТЫ СОЗДАНИЯ МЕДИЦИНСКИХ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ............................................................. 25 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 27 ПРЕДСТАВЛЕНИЕ ОБУЧАЮЩИХ ДАННЫХ ................................................................................................................................... 28 ИНИЦИАЛИЗАЦИЯ НЕЙРОННОЙ СЕТИ ......................................................................................................................................... 29 СТРАТЕГИЯ И ТАКТИКА ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ............................................................................................................. 35 ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ НЕЙРОСЕТЕЙ И АВТОМАТИЗИРОВАННЫЕ СТРАТЕГИЯ И ТАКТИКА ОБУЧЕНИЯ.................. 38 ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ И МЕТОДОЛОГИИ СОЗДАНИЯ НЕЙРОСЕТЕВЫХ МЕДИЦИНСКИХ ЭКСПЕРТНЫХ СИСТЕМ ....... 41 ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ ДЛЯ СОЗДАНИЯ НЕЙРОСЕТЕВЫХ ЭКСПЕРТНЫХ СИСТЕМ ................................................................................................................................................................................................ 41 ПРОГНОЗИРОВАНИЕ ОСЛОЖНЕНИЙ ИНФАРКТА МИОКАРДА................................................................. 42 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 44 ОБУЧАЮЩАЯ ВЫБОРКА И ВХОДНЫЕ ПАРАМЕТРЫ ...................................................................................................................... 45 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ФИБРИЛЛЯЦИИ ПРЕДСЕРДИЙ.......................................................... 47 ПРОГНОЗИРОВАНИЕ ВОЗНИКНОВЕНИЯ ПЕРИКАРДИТА................................................................................................................ 52 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ТРОМБОЭМБОЛИЧЕСКИХ ОСЛОЖНЕНИЙ ........................................ 53 ПРОГНОЗИРОВАНИЕ ФАКТА И ВРЕМЕНИ ВОЗНИКНОВЕНИЯ ИЛИ УСУГУБЛЕНИЯ СЕРДЕЧНОЙ НЕДОСТАТОЧНОСТИ.................... 55 ИЗУЧЕНИЕ ВЛИЯНИЯ ИССЛЕДУЕМЫХ ПАРАМЕТРОВ НА ПРОГНОЗ ОСЛОЖНЕНИЙ ИНФАРКТА МИОКАРДА ................................. 56 РАННЯЯ ДИАГНОСТИКА И ДИФФЕРЕНЦИАЛЬНАЯ ДИАГНОСТИКА ЗЛОКАЧЕСТВЕННЫХ ОПУХОЛЕЙ СОСУДИСТОЙ ОБОЛОЧКИ ГЛАЗА..................................................................................................................... 60 МЕТОДЫ ДИАГНОСТИКИ УВЕАЛЬНЫХ МЕЛАНОМ......................................................................................................................... 60 МЕТОД ИССЛЕДОВАНИЯ ПИГМЕНТА РЕСНИЦ ДЛЯ ДИАГНОСТИКИ УВЕАЛЬНЫХ МЕЛАНОМ......................................................... 61 ФОРМАЛЬНЫЙ СПОСОБ ИНТЕРПРЕТАЦИИ ДАННЫХ МЕТОДА ....................................................................................................... 62 ПОСТАНОВКА ЗАДАЧИ .................................................................................................................................................................. 62 ВХОДНЫЕ ПАРАМЕТРЫ И ОБУЧАЮЩАЯ ВЫБОРКА........................................................................................................................ 63 ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДОВ ДИАГНОСТИКИ МЕЛАНОМЫ ХОРИОИДЕИ......................................................................... 65 ОЦЕНКА ЭФФЕКТИВНОСТИ МЕТОДА ДИАГНОСТИКИ МЕЛАНОМ СОСУДИСТОГО ТРАКТА ГЛАЗА С ПОМОЩЬЮ ИЗУЧЕНИЯ ПИГМЕНТА РЕСНИЦ............................................................................................................................................................................... 66 КОМПЛЕКС НЕЙРОННЫХ СЕТЕЙ.................................................................................................................................................... 67 МОДЕЛИРОВАНИЕ ЛЕЧЕНИЯ И ПРОГНОЗИРОВАНИЕ ЕГО НЕПОСРЕДСТВЕННЫХ РЕЗУЛЬТАТОВ У БОЛЬНЫХ ОБЛИТЕРИРУЮЩИМ ТРОМБАНГИИТОМ ..................................................................... 70 ХАРАКТЕРИСТИКА ОБСЛЕДОВАННЫХ БОЛЬНЫХ......................................................................................................................... 71 ОБУЧАЮЩИЕ ПАРАМЕТРЫ И ОТВЕТЫ ......................................................................................................................................... 73 ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................. 75 СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ В ИССЛЕДУЕМЫХ ПОДГРУППАХ................................................................................. 79 СОЗДАНИЕ И ОБУЧЕНИЕ НЕЙРОННЫХ СЕТЕЙ .............................................................................................................................. 80 АНАЛИЗ ЗНАЧИМОСТИ ОБУЧАЮЩИХ ПАРАМЕТРОВ.................................................................................................................... 80 МИНИМИЗАЦИЯ НАБОРА ВХОДНЫХ ПАРАМЕТРОВ...................................................................................................................... 81 ТЕСТИРОВАНИЕ ЭКСПЕРТНОЙ СИСТЕМЫ .................................................................................................................................... 83 НЕЙРОСЕТЕВАЯ ЭКСПЕРТНАЯ СИСТЕМА ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ "ОСТРОГО ЖИВОТА".............................................................................................................................................................................................. 84 ХАРАКТЕРИСТИКА ИССЛЕДОВАННЫХ КЛИНИЧЕСКИХ ПРИМЕРОВ ............................................................................................ 85VII.2. ПОСТАНОВКА ЗАДАЧИ................................................................................................................................................................ 90
VII.3. РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ..................................................................................................................................................... 91
VII.4. МИНИМИЗАЦИЯ ОБУЧАЮЩИХ ПАРАМЕТРОВ ............................................................................................................................ 93
ГЛАВА VIII. НЕЙРОСЕТИ ДЛЯ ИЗУЧЕНИЯ ИММУНОРЕАКТИВНОСТИ........................................................................ 95
VIII.1. ПОСТАНОВКА ЗАДАЧИ И РЕЗУЛЬТАТЫ ОБУЧЕНИЯ НЕЙРОСЕТЕЙ.............................................................................................. 95
VIII.2. ПРИМЕНЕНИЕ ОБУЧЕННЫХ НЕЙРОСЕТЕЙ ДЛЯ ИЗУЧЕНИЯ ИММУНОРЕАКТИВНОСТИ ПРИ ЯЗВЕННОЙ БОЛЕЗНИ ЖЕЛУДКА И ДВЕНАДЦАТИПЕРСТНОЙ КИШКИ .......................................................................................................................................................... 98
ЗАКЛЮЧЕНИЕ .................................................................................................................................................................................. 103
ЛИТЕРАТУРА..................................................................................................................................................................................... 105
Введение
Повышение эффективности работы лечебно-профилактических учреждений, особенно в условиях меди-цинского страхования, во многом связано с преобразованием всех аспектов деятельности и оформлением их в виде четкой и высокопроизводительной системы технологий.
В понятие технологии мы включаем 5 требований -элементов, которые должны быть проработаны для оптимизации, например, лечебной или диагностической процедуры.
- Культура участников технологии;
- Квалификация участников технологии;
- Информационное обеспечение технологии;
- Методология;
- Техническое обеспечение технологии.
В последнее время очень сильно возрастает значение информационного обеспечения. Оно становится критическим фактором развития технологий практически во всех областях знания. Это связано со следующими основными особенностями современного производства: максимальное разделение труда, особенно в сложных наукоемких производствах; постоянно увеличивающиеся объемы информации, требующие быстрой обработки; повышающиеся требования к качеству продукции и услуг; внедрение технических средств. Поэтому разработка и внедрение высокопроизводительных информационных систем является на сегодняшний день одной из самых актуальных задач.
Массовый выпуск персональных компьютеров, снижение их стоимости и доступность самого разнообраз-ного программного обеспечения позволили повысить качество технологий во многих областях медицины. Анализ особенностей применения персональных ЭВМ в медицинских учреждениях показывает, что наибольшее исполь-зование компьютеров идет в следующих направлениях: обработка текстовой документации, хранение и обработ-ка баз данных, статистика и финансовые расчеты. Отдельный парк персональных ЭВМ используется совместно с различными диагностическими и лечебными приборами, которые оперируют с данными сложного характера.
В подавляющем большинстве этих областей использования ЭВМ применяют стандартное программное обеспечение -текстовые редакторы, системы управления базами данных, статистические пакеты и прочее. Одна-ко, общеизвестно, что некоторые из важнейших участков лечебно-диагностических технологий практически не используют ЭВМ. Прежде всего это диагностика, назначение лечебных мероприятий, прогнозирование течения заболеваний и их исходов. Причины слабого применения компьютеров в этих областях носят чрезвычайно слож-ный характер и постоянно дискутируются многими исследователями. Рассмотрим основные из них.
- Отсутствие технической базы. Причина носит временный характер, так как с развитием и снижением стоимости ЭВМ они получают все большее распространение.
- Отсутствие компьютерной грамотности у участников технологий. Подобно предыдущей, эта причина вскоре также потеряет свою актуальность в связи со становлением информационного общества.
- Психологический аспект. Наиболее серьезная причина, связанная с характером работы врача. С одной стороны, врач является исследователем, и его работа носит творческий характер. С другой стороны, врач несет прямую ответственность за результат своей деятельности. Исходя из этого, врач, принимая решение о диагнозе или назначении лечебных мероприятий, опирается на знания и опыт, причем как свои собственные, так и коллег,
- являющихся для него авторитетом. Очень важно при этом обоснование решения, если оно подсказывается со стороны. Результат, подсказанный компьютерной программой, работающей по алгоритму, созданному другим человеком, как показывает практика, во многом лишает исследователя творческой инициативы. Навязанное та-ким образом решение, даже будучи достоверным, психологически подвергается серьезному сомнению.
- Особенности медико-биологической информации. Еще одно серьезное препятствие на пути внедрения информационных технологий в медицину заключается в том, что большинство медицинских данных имеют опи-сательный характер, т.е. выражаются с помощью формализмов, подверженных крайней вариабельности. Остав-шаяся часть данных, даже выражаемая с помощью чисел, также в большинстве случаев не может быть упорядо-чена и классифицируема, т.к. изменяется в зависимости от клинических традиций различных школ, геосоциаль-ных особенностей регионов и даже отдельных учреждений, а также от времени.
Таким образом, указанные причины определяют крайне слабое использование существующих медицин-ских систем принятия решений и огромные трудности в разработке новых.
Исходя из вышесказанного, все задачи, решение которых актуально в медицинских технологиях, можно подразделить на две большие категории.
- Задачи, решаемые по четким алгоритмам. К этой категории относятся задачи делопроизводства, хране-ния и обработки информации. Они с успехом решаются с помощью стандартного программного обеспечения, быстро и широко распространяющегося.
- Задачи принятия решений, результат в которых выводится исходя из опыта и знаний. Для этого класса задач характерен очень сложный алгоритм, и чаще всего -полная невозможность его актуализировать.
Поэтому можно выделить два способа решения задачи -логический и интуитивный. Логический метод оперирует набором формальных правил [109], интуитивный -накопленным опытом. При решении задачи первым способом она обычно разбивается на подзадачи, каждая из которых, в свою очередь, разбивается на несколько элементарных функций с известным алгоритмом вычислений. Зная алгоритм каждой элементарной функции, можно решать сложнейшие задачи, соединяя элементарные функции в нужной последовательности. Традицион-ное программирование как раз и обеспечивает такую возможность. При попытке применить такой метод к реше-нию интуитивных задач программист может столкнуться с невозможностью выделить алгоритм элементарной функции или вообще разбить задачу на такие функции.
Современный компьютер, обрабатывая информацию с большой скоростью, делает это на основе алгорит-мов, написанных программистом. Естественно, что с усложнением задач резко возрастает время, затрачиваемое на написание алгоритмов их решения. Поэтому трудности разработки экспертных систем определяется уже не техническими, а человеческими факторами.
Растущие объемы информации, появление новейших диагностических и лечебных технологий требуют принципиально иных подходов к обработке и интерпретации медицинских данных, возможности накопления, хранения и использования опыта квалифицированных специалистов. Аналогично, для научных исследований в медицине уже совершенно недостаточно использовать стандартные наборы статистических методов для обработ-ки материала. Требуются универсальные инструменты с возможностью гибкой постановки задач, применимые ко всем областям биологии и медицины, обладающие большой информационной емкостью и помехоустойчивостью, не нуждающиеся в длительном времени для разработки. Всем вышеперечисленным требованиям могут отвечать системы, способные самонастраиваться на решение задач. Созданные только один раз исходно одинаковыми, они должны обучаться решать совершенно различные задачи.
Отсюда вытекает еще один важный вывод. Возможности настройки нового класса экспертных систем должны распространяться вплоть до индивидуального пользователя, например до конкретного врача, имеющего возможность обучать экспертную систему на своем собственном опыте и тех данных, которые доступны этому врачу. Это означает, что необходимо коренное изменение технологии производства таких систем. Существую-щие традиционные системы принятия решений, основанные на четких правилах вывода, создаются, как правило, группой специалистов, в числе которых -математики, программисты и предметные специалисты, ставящие зада-чи. Возможности настройки таких систем на конечного потребителя почти всегда сведены к минимуму, и он, приобретая такую систему, часто сталкивается с ее неприменимостью к конкретным условиям его работы (например, другой спектр лабораторных анализов или методов обследования, принятых в данной клинике). Вы-ход -дать специалисту возможность самому конструировать экспертную систему исходя из конкретных условий, собственного опыта и опыта коллег. Такое конструирование должно производиться без знания предметным спе-циалистом математического аппарата, требуя только обычных навыков работы на персональном компьютере. Кроме того, в этой ситуации снимается психологическая проблема доверия к заключениям экспертной системы, которая работает , опираясь на опыт и знания того специалиста, который ее сконструировал, его коллег, которым он доверяет, и реальные данные, которые он сам получил в результате наблюдений.
Мы сформулировали основные требования, которым должны удовлетворять самообучающиеся медицин-ские экспертные системы принятия решений, диагностики, назначения лечебно-профилактических мероприятий и прогнозирования.
- Индивидуализация (настройка на традиции клинических школ, геосоциальные особенности региона примене-ния, наборы медико-биологических данных, особенности лечебно-диагностических технологий, индивидуаль-ный опыт и знания специалиста);
- Динамическое развитие (накопление опыта системы в процессе функционирования, следуя изменениям в пунктах, перечисленных в предыдущем требовании);
- Возможность перенастройки при резком изменении условий, например, при перенесении в другой регион;
- Способность к экстраполяции результата. Требование, обратное индивидуальности. Система не должна резко терять качество работы при изменении условий;
- Возможность конструирования с нуля конечным пользователем (специалист должен иметь возможность при-думать совершенно новую экспертную систему и иметь возможность просто и быстро создать ее);
- “Нечеткий” характер результата. Важное требование, подразумевающее, что решение выдаваемое системой, не должно быть окончательным. Оно может быть, например, вероятностным, или предлагать сразу несколько вариантов на выбор. Это дает возможность специалисту критически оценивать решение системы и не лишает его инициативы в принятии окончательного решения.
- Экспертная система является только советчиком специалиста, не претендуя на абсолютную точность решения. Она должна накапливать опыт и знания и значительно ускорять доступ к ним, моделировать результат при из-менении условий задачи. При этом ответственность за решение всегда лежит на специалисте.
Анализ существующих методов обработки информации и метаалгоритмов решения задач показал, что вышеперечисленным требованиям достаточно хорошо удовлетворяют нейроинформационные технологии, бази-рующиеся на искусственных нейронных сетях. В основе функционирования нейронных сетей лежат алгоритмы, моделирующие распространение сигналов по нейронам и синапсам нервной системы. Существует достаточно большой набор архитектур и метаалгоритмов функционирования нейронных сетей, при этом задачи, решаемые современной нейроинформатикой, в большинстве случаев требуют подгонки архитектуры и алгоритмов обучения нейросетей под определенный класс задач или даже конкретную задачу. Поэтому, разработка универсальной тех-нологии создания медицинских экспертных систем, включающей оптимизацию архитектур и метаалгоритмов функционирования нейронных сетей, теоретические и методологические основы функционирования нейросетей при работе с медико-биологической информацией, является актуальной задачей.
Цель исследования.
Разработка теории и методологии создания медицинских самообучающихся нейросетевых экспертных систем принятия решений, диагностики и прогнозирования для практического здравоохранения, медико-биологических научных исследований; создание и внедрение в практику приложений.
Задачи исследования.
- Изучение свойств и поведения нейронных сетей при решении задач, связанных с медико-биологическими па-раметрами;
- Оптимизация структуры и параметров нейронных сетей для решения задач медицинской диагностики и про-гнозирования;
- Разработка методов оценки информативности медико-биологических параметров нейронными сетями;
- Создание универсальной компьютерной программной среды (инструментария) для разработки самообучаю-щихся медицинских экспертных систем;
- Создание и внедрение нейросетевых экспертных систем медицинской диагностики, прогнозирования и приня-тия решений.
Структура (архитектура) искусственных нейронных сетей, состоящих из большого числа простых элемен-тов (нейронов -чувствительных и моторных) и межнейронных связей (синапсов), похожа (конечно, в очень упрощенном виде) на структуру нервной системы. При функционировании искусственной нейронной сети также моделируются базовые процессы, происходящие в нервной системе -поступление информации из внешнего мира в нейросеть, обмен нейронов сигналами через синапсы, вывод информации из нейросети во внешний мир.
Задачи медицинской диагностики и прогнозирования не имеют четких (явных) алгоритмов решения. В условия таких задач входит большое число сложно комбинирующихся факторов. Способ решения этих задач человеком лишь в малой степени основан на четких правилах. В основном используется опыт (явная или неявная память о предыдущих ситуациях), подразумевающий правильное решение не только в случае повторения ситуа-ции, но и при возникновении совершенно новой, не встречавшейся ранее ситуации.
Таким образом, нейронные сети, работая по неявным алгоритмам и решая задачи, не имеющие явного решения, достаточно хорошо моделируют (конечно, только внешне) способ принятия решений человеком. Одна-ко принципиальные различия работы нейронной сети и глубинного функционирования сознания и подсознания никак не отражается на конечном результате, поэтому при разработке нейроинформационных технологий не ста-вятся задачи достижения как можно большего структурного и функционального сходства искусственных объек-тов и реального мозга. Разработка архитектуры и алгоритмов нейронных сетей не базируется на моделировании структуры и физиологии головного мозга, а исходит из целей функционирования создаваемой системы. Появле-ние некоторого сходства является, по-видимому, проявлением некоторых общих закономерностей, а никак не результатом сознательного действия. Поэтому, разработка теории и методологии создания нейросетевых экс-пертных систем в медицине и биологии является движением в сторону создания искусственного интеллекта, ба-зирующегося не на принципах копирования структуры (как показали многочисленные попытки, этот путь никуда не привел), а на концепции постановки и достижения целей.
Нейросеть имеет определенное сходство с биологическими объектами еще и потому, что обладает “пове-дением”, не поддающимся абсолютно точному прогнозированию. Этот факт связан с тем, что нейросеть, имею-щая даже всего несколько нейронов, может иметь многие миллиарды различных состояний, причем каждое со-стояние приведет к уникальному ответу нейросети после подачи ей информации из внешнего мира. Поэтому изу-чение закономерностей функционирования нейросетей при их работе с медико-биологической информацией также является актуальной задачей, так как может открыть совершенно новые области их применения.
Нейросети могут служить в качестве математического инструмента для научных исследований при поис-ке взаимосвязей и закономерностей в больших информационных структурах, изучения взаимного влияния раз-личных факторов и моделирования сложных динамических процессов. Поэтому разработка методов нейросетево-го моделирования и анализа информации также является актуальной задачей.
Практическое применение нейросетей позволяет поставить создание медицинских экспертных систем на качественно иную основу.
- Прежде всего, самообучающиеся экспертные системы производятся очень быстро. При создании традицион-ных экспертных систем основное время затрачивается на разработку алгоритма, а сбор данных обычно зани-мает равное или меньшее время. При конструировании нейросетевых экспертных систем время на разработку фактически определяется длительностью сбора данных: обучение сети занимает минуты, в крайнем случае, часы машинного времени и не требует прямого вмешательства оператора. Кроме того, стартовое обучение может производиться уже на небольшом количестве данных, а их дальнейший сбор может продолжиться уже после создания системы во время ее эксплуатации с доучиванием;
- Нейросетевые системы могут создаваться непосредственно предметными специалистами, владеющими лишь пользовательскими навыками работы с персональными компьютерами. Это обеспечивается универсальностью предлагаемой архитектуры и метаалгоритмов обучения и функционирования нейросетей при работе с любыми задачами, решаемыми на основе опыта.
- Программы-эмуляторы нейронных сетей могут работать на обычных широкоиспользуемых персональных компьютерах. Разработанные архитектуры и метаалгоритмы функционирования нейросетей не требуют какой-либо специальной техники;
- Экспертные нейросистемы чрезвычайно компактны, не требуют большого количества оперативной и постоян-ной памяти ЭВМ (не вытесняют другие необходимые программы). Не обязательно и хранение банков данных, на которых обучалась система.
- Экспертные нейросистемы динамично развиваются в процессе использования, накапливая опыт многих спе-циалистов и/или обучаясь на реальном фактическом материале.
- Нейросетевые системы могут работать в условиях недостаточной информации, что в медицине является обычной ситуацией, когда, например, отсутствуют данные каких-либо анализов или методов обследования или сведения из анамнеза пациента.
- Нейронные сети могут работать с информацией любого типа, вплоть до субъективных определений. Требуется лишь элементарная, достаточно произвольная кодировка в числовой вид.
- Время выдачи ответа обученной нейросетью (с момента подачи ей условий задачи) исчисляется долями се-кунды, что позволяет применять нейротехнологии в системах, работающих в режиме реального времени и требующих практически мгновенного решения задачи.
- Экспертные нейросистемы обладают большой гибкостью, например, при использовании в разных регионах с различными характеристиками, влияющими на здоровье, а следовательно, и на показатели нормы и патологии, одна и та же система будет работать одинаково хорошо после адаптации (дообучения на локальных данных).
10.Обученная нейросистема может использоваться как инструмент для моделирования и изучения объектов, с которыми она связана.
11.Применение нейросетевых систем позволит значительно ускорить работу специалистов, освободив большое количество времени, повысить качество профилактических, лечебных и диагностических технологий.
12.Гибко настраиваемые на конкретное лечебное учреждение нейросетевые экспертные системы прогнозирова-ния позволят оптимизировать планирование лечебных и профилактических мероприятий как конкретным больным (профилактика осложнений), так и по лечебному учреждению в целом, что приведет к повышению качества медицинских услуг и снижению затрат.
13.Применение нейросетевых экспертных систем для прогнозирования медико-социальных и демографических показателей позволит повысить качество технологий в организации медицинской помощи населению и плани-ровании здоровья.
14.Возможность нейронных сетей анализировать информацию (в частности, определять важность и информатив-ность медико-биологических данных) позволит оптимизировать различные диагностические технологии (от-каз во многих случаях от дорогостоящего и ненужного обследования), а также технологии разработки медико-экономических стандартов.
В результате проведенных исследований разработаны теоретические и методологические основы созда-ния нейросетевых медицинских экспертных систем. Их ядром являются полносвязные сигмоидные нейронные сети, обучающиеся по усовершенствованному метаалгоритму двойственного функционирования, позволившему увеличить скорость обучения в 1000-10000 раз.
Изучение работы практических врачей с персональными компьютерами, отработка интерфейсов про-граммного обеспечения привели к созданию базового инструментария, предназначенного для конструирования нейросетевых программ пользователями-медиками. Разработанный автором программный комплекс AcceStat2000 “NeuroMaster” может применяться не только для создания профессиональных экспертных систем, но и для проведения исследований медико-биологических данных с помощью нейросетей (проверка гипотез, поиск гипо-тез, моделирование, оптимизация).
С помощью пакета комплекс AcceStat-2000 “NeuroMaster” разработаны и апробированы на практике нейросетевые экспертные системы прогнозирования осложнений инфаркта миокарда, назначения лечения и про-гнозирования его непосредственных исходов у больных облитерирующим тромбангиитом, ранней диагностики меланом хориоидеи, дифференциальной диагностики “острого живота” и др.
Положения, выносимые на защиту.
- Разработаны теория и методология создания самообучающихся медицинских экспертных систем, заключаю-щаяся в обучении полносвязных сигмоидных нейронных сетей двух типов -классификаторов и предикторов -на основе наборов примеров с известными ответами и обучающими параметрами, нормированными на диапа-зон [-1...1].
- Экспертные системы, создаваемые согласно разработанной методологии, обладают способностью постоянно-го доучивания в процессе работы, не требуя от пользователя формализации и алгоритмирования правил выво-да.
- Создан программный инструментарий -программа AcceStat-2000 “NeuroMaster”, предназначенная для созда-ния медицинскими специалистами экспертных систем, накапливающих индивидуальный и коллективный опыт и/или обучающихся на реальных данных, полученных путем измерений и наблюдений.
- Сконструированы и внедрены в практику нейросетевые экспертные системы: прогнозирования осложнений инфаркта миокарда; назначения лечения и прогнозирования его непосредственных исходов у больных облите-рирующим тромбангиитом; ранней диагностики меланом хориоидеи; дифференциальной диагностики “остро-го живота”.
Работа выполнена в Красноярской Медицинской Академии на кафедре медицинского страхования, ме-неджмента и маркетинга.
По теме диссертации опубликовано 70 работ в центральной, местной и зарубежной печати. Список работ приводится в Приложении 3.
Автор благодарит профессора М.И.Гульмана, профессора В.И.Лазаренко, профессора А .А.Модестова, профессора В.В.Фефелову, профессора В.А.Шульмана за поддержку и помощь в организации исследований.
Особую благодарность автор выражает научному консультанту, профессору А.Н.Горбаню.
Глава I. Нейросетевые компьютерные экспертные системы в медицине (об-зор литературы)
Разработка математических методов решения медико-биологических задач ведется уже не одну сотню лет. Учеными предложено огромное количество способов проверки гипотез и продукции выводов. В истории разработки этих методов прослеживаются два периода наибольшего интереса теоретиков и практиков. Первый период наблюдался в 60-е годы, когда были разработаны методы анализа, получившие некоторое распростране-ние и вызвавшие волну публикаций. Среди них -анализ Вальда [19], применяющийся до сих пор, матричные алгоритмы, основанные на анализе присутствия или отсутствия признаков [18], методы правдоподобия (анализ частот встречаемости признаков при двух или более заболеваниях [241]), алгоритмы, основанные на логике фазо-вого интервала (состояние выражается в виде совокупности точек в пространстве признаков [17,18]), вероятност-ные методы [308]. Довольно широкую популярность приобрели алгоритмы, основанные на поиске клинического прецедента [4]. Общим признаком, объединяющим все эти и другие традиционные методы, несмотря на их раз-нообразие, является наличие явных алгоритмов принятия решений [28]. “Диагностический алгоритм включает в себя совокупность правил, определяющих порядок переработки медицинской информации с целью постановки диагноза” [64]. Несмотря на то, что наиболее популярные методы до сих пор активно используются в теоретиче-ской биологии и медицине [53,55], в практической медицине они не нашли широкого применения. Это связано, во-первых, с тем, что методы, ориентированные на обработку групповых данных, слабо применимы к отдельным объектам, а во-вторых, с особенностями самой медико-биологической информации [125]. Решения в медицин-ских и биологических задачах зависят от огромного количества неодинаковых по значимости факторов [70,91]. Поэтому, даже если удается выстроить правила вывода, связывающие условия задачи с решением, метод, как правило, хорошо работает только на той группе объектов, на которой производились исследования. Естественно, создать универсальный алгоритм невозможно, и при использовании метода для другой подобной группы объек-тов его приходится полностью переконструировать практически заново.
Многолетние исследования, проводимые с самыми различными явными алгоритмами, показали, что ме-дицинские задачи, имеющие неявный характер, решаются явными методами с точностью и удобством, совер-шенно недостаточными для широкого практического использования в конкретных задачах диагностики, прогно-зирования и принятия решений [65].
Поэтому в настоящее время наблюдается второй всплеск интереса к диагностическим системам. Он направлен на принципиально новое поколение решающих алгоритмов, являющихся неявными и обладающих способностью к самонастройке [270], которая может осуществляться на минимальном количестве данных [202]. Основной группой таких алгоритмов, развиваемой сейчас наиболее интенсивно, являются нейросетевые методы [120,295].
Поиски и изучение неявных алгоритмов, позволяющих автоматически накапливать и затем использовать опыт при обучении [178], продолжаются уже более 100 лет [54]. Однако первые серьезные попытки создания нейронных сетей были сделаны в 40-50-х годах, когда У.Маккалох и У.Питтс выдвинули основные положения теории работы головного мозга. Естественно, что с появлением дешевых ЭВМ произошел резкий скачок в этой области [34], которая в начале 80-х годов сформировалась в целую науку -нейроинформатику [305].
Неявные задачи медицины и биологии явились идеальным полем для применения нейросетевых техноло-гий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов [129,201,221].
Перейдем теперь к рассмотрению нейросетевых приложений для биологии и медицины, созданных раз-личными авторами. Общая черта, объединяющая приводимые ниже примеры -отсутствие единой универсальной технологии создания таких приложений. В публикуемых разработках используются самые разнообразные архи-тектуры [103,135,211] и алгоритмы функционирования нейронных сетей. Это приводит к тому, что для почти для каждой задачи разрабатывается своя собственная архитектура, и часто -уникальный алгоритм или уникальная модификация уже существующего. С точки зрения практического применения такие экспертные системы почти не отличаются от традиционных программ принятия решений; предложены даже методы преобразования тради-ционных экспертных систем в нейросетевые [231]. Их разработка требует участия специалистов по нейроинфор-матике, а возможности конструирования пользователем практически отсутствуют. Это делает такие системы чрезвычайно дорогими и не очень удобными для практического применения, поэтому в публикациях авторы в основном сравнивают качество работы нейросетевых алгоритмов и традиционных систем, работающих по прави-лам вывода.
Наибольший интерес для практического здравоохранения представляют системы для диагностики и диф-ференциальной диагностики заболеваний [117]. При этом для принятия решений могут использоваться самые разнообразные данные -анамнез, клинический осмотр (создаются экспертные системы диагностики, ограничи-вающиеся только этим набором [288]), результаты лабораторных тестов и сложных функциональных методов. Список областей медицины, в которых начали применяться новые технологии, чрезвычайно обширен и продол-жает расти.
В области пульмонологии начаты исследования по применению нейронных сетей для дифференциальной диагностики интерстициальных заболеваний легких [111,161]. Конструируемая система обучается различать 9 диагнозов по 20 параметрам клинического состояния и данным рентгенографии.
Появились работы с применением нейротехнологий для диагностики астмы [261], острой тромбоэмболии легких [271,309], рака легких [149].
Несколько работ посвящено решению задачи определения оптимальных параметров искусственного ды-хания [114,277,301]. Нейронные сети обучаются поддерживать оптимальный режим вентиляции легких и рабо-тают более гибко, чем системы, основанные на жестком алгоритме.
Одним из наиболее интенсивно развиваемых направлений является применение нейросетей в кардиоло-гии.
В Италии разработана чрезвычайно интересная экспертная система для диагностики и лечения артериаль-ной гипертонии [143,276]. Система включает в себя три нейросетевых модуля, причем ответы одних являются входными данными для других. В начале исследования больному проводят измерение систолического и диасто-лического давления каждые полчаса в течение суток. Данные за каждый час усредняются. Таким образом, обра-зуется массив из 48 величин артериального давления (по 24 для систолического и диастолического). После этого первый модуль, состоящий из двух трехслойных нейросетей (в каждой из которых 2 входных, 4 "скрытых" и 24 выходных нейрона), на основании данных о поле и возрасте больного рассчитывает аналогичные "должные" ве-личины и сравнивают их с реальными. Параллельно второй модуль (двухслойная нейросеть с 17 входными и 4 выходными нейронами) на основании клинических данных (симптоматика, анамнез) рассчитывает возможные сочетания гипотензивных лекарственных средств, которые могут быть использованы для лечения данного боль-ного. Данные, снятые с выходов обоих модулей, вместе с клиническими данными подаются на вход последнего, третьего модуля (6-слойная нейросеть). Этот модуль оперирует 4 группами гипотензивных препаратов (диурети-ки, бетаадреноблокаторы, ингибиторы ангиотензина, блокаторы кальциевых каналов). Цель -назначить суточный (почасовой) график приема больным лекарств каждой (если требуется) из 4 групп. Поэтому этот модуль имеет 96 выходных нейронов (4 препарата х 24 часа). С каждого выходного нейрона снимается доза, соответствующая одному препарату, назначаемому на данный час суток. Естественно, что в реальной ситуации большинство вы-ходных данных равны нулю. Таким образом, создается оптимальная для пациента схема лечения гипертонии. Нужно отметить, что система учитывает некоторые особенности приема препаратов больными, например, за-труднение приема препаратов ночью (назначает ночной прием только в крайних случаях), запрет на назначение мочегонных лекарств на ночь. Отличительной чертой системы является возможность пользователя (врача) пере-давать нейронной сети свой опыт. Для этого создателями программы предусмотрен специальный блок, который выводит на экран компьютера суточные кривые артериального давления и предлагает врачу ввести в компьютер суточную схему приема гипотензивных препаратов в необходимых, по его мнению, дозах. Введенный пример помещается в базу данных. В любое время можно инициировать доучивание нейронных сетей с новыми приме-рами.
В работе [133] описывается нейронная сеть для диагностики коронарного атеросклероза на ранних стади-ях. Диагноз выставляется на основании таких параметров, как пол, возраст, вес, рост, курительные привычки; данных семейного анамнеза, наличия у обследуемого диабета, показателей систолического и диастолического артериального давления, уровня холестерина и липопротеидов различных классов в крови.
Большое внимание уделяется применению нейросетей для диагностики атеросклероза [180].
Нейросети могут проводить диагностику и определение стадии атеросклероза по рентгенологическим данным [179] и по акустическим сигналам [105].
В одной из работ приводится метод выявления атеросклеротических бляшек в артериях [188]. Для этого применяется нейросеть, интерпретирующая флюоресцентные спектры, получаемые при исследовании тканей с помощью лазера.
Аналогичным образом проводится диагностика заболеваний периферических сосудов [107], например, определение форм артериита [115]. Описывается нейросетевая диагностика заболеваний мышц по мышечной биопсии [183],
Нейронные сети применены для оценки снабжения тканей кислородом [119] и мозгового кровотока [146,325,326], вентиляции и перфузии легких [291], капиллярного давления легких [219], диагностики микроэм-болий мозга по данным транскраниальной допплерографии [296].
Проводится комплекс исследований по использованию нейросетей для диагностики инфаркта миокарда [123,125,126]. Автор приводит данные по чувствительности (77,7%) и специфичности (97,2%) нейросетевого те-ста. В работе [124], кроме того, с помощью нейронной сети устанавливали диагностическую значимость клини-ческих параметров при диагностике инфаркта миокарда.
Нейросетевой анализ акустических сигналов позволяет проводить диагностику клапанных шумов сердца [197], и оценивать систолическую и диастолическую фазы сердечного сокращения с постановкой предваритель-ного диагноза [121].
Нейросети используются терапевтами для диагностики заболеваний п ечени по лабораторным данным исследования функций печени [268]; дифференциальной диагностики заболеваний печени [247,336] и желчного пузыря по УЗИ [286], диагностики панкреатита [226], изучения характера камней в почках [320].
Имеются немногочисленные работы по применению нейротехнологий в невропатологии и нейрохирур-гии, например, для диагностики нарушений слуха [250], изучения болезни Паркинсона [137], определения лока-лизации патологических очагов в мозге [102,150].
Нейропрограммы могут с успехом работать с медицинскими данными, относящимися к субъективным категориям, например, в психиатрии [258]. Оценка субъективных данных дает возможность распознавания пси-хических симптомов [132] и диагностики и изучения некоторых психиатрических симптомокомплексов -демен-ции [263] и аутизма [153].
Встречаются отдельные работы о попытках нейросетевого моделирования в изучении мужского беспло-дия [235], диагностики миеломной болезни [141] и аллергии [145].
Актуальная проблема диагностики злокачественных новообразований, возможно, получит новый уровень осмысления с началом применения нейроалгоритмов. Так, в работе [169] показана 80%-я точность ранней диа-гностики меланом кожи -одного из самых злокачественных заболеваний. Наличие скрытых метастазов этого же заболевания определяется с помощью нейросетевой интерпретации данных хроматографии мочи [154].
Описываются методы диагностики почечных карцином по данным УЗИ [248] и гепатоцеллюлярных кар-цином по данным ядерной морфометрии [170], ранняя диагностика рака печени по данным рентгенограмм и уль-трасонограмм [246], диагностика и прогноз рака простаты [300], диагностика остеопороза и костных образова-ний, а также дифференциальная диагностика злокачественных и доброкачественных костных опухолей [275,285].
По интерпретации данных ядерно-магнитного резонанса проводят диагностику рака кишечника на ранних стадиях [165].
Большое внимание в публикуемых работах уделяется нейросетевой диагностике опухолей молочной же-лезы, представляющих серьезную медико-социальную проблему. Так, по 9 параметрам анализа крови осуществ-ляется дифференциальная диагностика злокачественных и доброкачественных опухолей молочной железы [116]. Однако описываемая нейросеть смогла обучиться ставить верный диагноз только у 80% примеров обучающей выборки. Результат тестирования на контрольной выборке -84% верных диагнозов.
Диагностику опухолей молочной железы проводят также по данным УЗИ [190]. Лечебную тактику у больных с этим заболеванием планирует нейросеть, описанная в [254]. Некоторые авторы проводят нейросете-вой прогноз исхода заболевания [281] и появление рецидива [282]. Система, описанная в [322], осуществляет диагностику рака молочной железы и яичника; прогноз исхода лечения рака яичника с помощью нейросети опи-сан в [222].
Сделаны первые попытки обучения нейронных сетей назначению антимикробной терапии [260].
Одним из серьезных направлений применения нейронных сетей является интерпретация медицинских данных. В последние годы идет бурное развитие новых средств диагностики и лечения. При этом наблюдается как бы "вторая волна" изучения и использования древних, старинных методов, и, наоборот, применение послед-них технических новшеств. Нередко и те и другие методы при использовании предоставляют врачу массу самых разнообразных данных. При этом встает проблема их грамотной и корректной интерпретации. Поиск глубинных закономерностей между получаемыми данными и патологическими процессами начинает отставать от разработ-ки все новых и новых методов, поэтому применение для этой цели нейросетей может оказаться чрезвычайно вы-годным.
В одной из старинных методик диагностики по пульсу используются 14 характеристик пульса, измеряе-мых с нескольких точек. Распознавание и интерпретация данных требует огромного опыта врача, практически невозможного в современных условиях. Нейросеть была применена для "узкой" диагностики только по одной из точек [236], позволяющей оценивать состояние левой почки. Пульс считывается специальным датчиком, совме-щенным с микрофоном. Полученная пульсовая кривая (сфигмограмма) передается в компьютер. Вначале про-грамма анализирует несколько пульсовых волн и выстраивает "среднюю" волну. После этого по 5 точкам этой волны нейронная сеть оценивает состояние левой почки.
Классической проблемой в кардиологии является интерпретация электрокардиограмм, требующая значи-тельного опыта врача [326]. Сотрудники Университета Глазго (Великобритания) ведут исследования по приме-нению нейросетей для ЭКГ-диагностики инфарктов миокарда [332-335]. Входными данными для сетей являются избранные параметры 12-канальной электрокардиограммы и 12-канальной векторкардиограммы (длины зубцов, расстояния между зубцами). Исследователи обучили огромное количество нейросетей (167 сетей для диагности-ки инфаркта миокарда передней стенки и 139 сетей для инфаркта нижней стенки) на массиве данных из 360 элек-трокардиограмм. Обученные сети затем тестировали отдельную выборку с заранее известными ответами (493 случая). Одновременно для получения отдельной серии ответов на тестируемой выборке был использован логи-ческий метод (с заранее заданным алгоритмом). Затем сравнивались результаты тестирования выборки лучшими нейросетями и с помощью логического алгоритма. Сравнение показало, что во многих случаях чувствительность и специфичность нейросетевого теста оказались выше, чем у логического метода. Авторы делают справедливый вывод, что в случаях, когда логический алгоритм решения задачи все-таки можно выстроить, разумно комбини-ровать в экспертных системах оба подхода.
Эти же авторы [334] применили нейросети для дифференцировки фибрилляции предсердий от желудоч-ковых и наджелудочковых экстрасистолий, возникающих на фоне синусового ритма.
Интерпретация ЭКГ с помощью нейросетей [138,157,158] была применена для диагностики злокачествен-ных желудочковых аритмий [208]. Трехслойная сеть с 230 входными синапсами была обучена на 190 пациентов (114 с хронической сердечной недостаточностью и 34 с дилятационной миокардиопатией) различать наличие (у 71 пациента) и отсутствие (у 119 пациентов) желудочковой тахикардии. Результаты тестирования сравнивались с логическим методом интерпретации данных. Показано, что нейросетевой тест обладает большей чувствительно-стью (73% по сравнению с 70 для логического метода) и специфичностью (83 и 59%).
Эти же авторы [209] использовали нейронные сети для интерпретации ЭКГ в диагностике дилятационных кардиомиопатий. В других работах описывается нейросетевая интерпретация ЭКГ для распознавания фибрилля-ции предсердий [334] и других аритмий [173], детекции QRS-комплекса [329], классификации сегмента ST-T [167], дифференцировки синусового и желудочкового ритма [172].
Интересная работа описывает моделирование применения нейросетей для работы электрокардиостимуля-торов (искусственных водителей ритма) [265]. Выпускаемые за рубежом электрокардиостимуляторы задают ритм не жестко, а в зависимости от исходного ритма, генерируемого синусовым узлом сердца. Например, если синусо-вый узел при какой-либо патологии генерирует недостаточное количество импульсов, водитель ритма компенси-рует ритм. Таким образом, электрокардиостимулятор представляет собой систему вход→преобразование→выход, где входом является ритм синусового узла, выходом -собственный ритм элек-трокардиостимулятора, а преобразование осуществляется по заданному логическому алгоритму. Авторы смоде-лировали замену логического преобразователя нейронной сетью, так как взаимоотношения между генерацией импульсов в синусовом узле и требуемым ритмом не линейны и применяемые алгоритмы на практике не всегда эффективны. Нейросеть, обученная на 27 здоровых людях в ситуациях с различной физической нагрузкой, пока-зала гораздо лучшую способность задавать ритм, чем логический алгоритм, применяющийся в электрокардио-стимуляторе.
Похожую работу по моделированию взаимодействий между сердечным ритмом и кардиостимулятором опубликовали [195].
Нейросети применялись для интерпретации таких достаточно сложных данных, как электроэнцефало-граммы [251].
Сконструированы весьма сложные нейросети для анализа данных компьютерной томографии [216] и ин-терпретации миограмм [213,227,294], по которым нейросети были обучены постановке диагноза нейромускуляр-ных заболеваний [233].
Одной из самых сложных задач для нейросетей в практической медицине является обработка и распозна-вание сложных образов, например рентгенограмм [243]. В работе [196] описывается экспертная система интер-претации рентгенограмм груди у новорожденных с выбором одного и более диагнозов из 12.
Нейросети обучали также распознаванию рентгенограмм для выявления узловых образований в легких
[240,244].
Созданы нейросетевые экспертные системы для классификации опухолей молочной железы (определе-ния, доброкачественная опухоль, или злокачественная) по данным маммографии (сканограмма молочной железы) [176,179,311,323,328,337]. По данным, которые приводят авторы, точность такого вывода до применения нейросети составляла не более 75%. При тестировании системы, нейросеть, анализирующая сканограмму, давала правильный ответ в 100% случаев. При тестировании изображение, получаемое в результате метода, представля-ется в виде матрицы точек размером 1024х1024 пиксела с 10-битовой шкалой яркости. Изображение подается на нейросеть, имеющую 2 входных, 80 "скрытых" и 2 выходных нейрона. При этом один из выходных нейронов "отвечает" за доброкачественную опухоль, другой за злокачественную. Диагноз определяется в зависимости от выходного нейрона, выдавшего больший по величине ответ. Столь высокий процент правильности распознава-ния, возможно, случаен, и объясняется недостаточным количеством примеров, использовавшихся при обучении и тестировании нейросети (по 10 примеров). Сеть обучалась методом back-propagation [168,299]. Однако даже при такой малой обучающей выборке нейросеть выигрывала по сравнению с традиционным методом интерпретации сканограммы.
Способом, сходным с описанным выше, нейросети обучали выделению объектов на изображениях, полу-чаемых в результате методов ядерно-магнитного резонанса [143,275].
Несколько работ посвящены нейросетевой обработке лабораторных анализов и тестов. Приводится нейросетевой метод интерпретации лабораторных данных биохимического анализа крови [284]. В работе показа-ны преимущества нейронных сетей в сравнении с линейным дискриминантным анализом, которым параллельно обрабатывались данные. Описываются обработка нейросетями цитогенетических данных [259] и интерпретация данных иммунного анализа [319].
Нейросети использованы в офтальмологии для интерпретации данных периметрии при диагностике глау-комы [189].
Обилие медицинских данных при применении диагностических методов ставит даже проблему хранения этих данных. Нейросети были использованы и для этого. В работах [252,264] описываются нейросети для ком-прессии данных электрокардиографического исследования с целью их экономного хранения.
Особое место среди нейросетевых экспертных систем занимают прогностические модели [303], применя-емые, например, для прогнозирования исходов заболеваний [304].
В 1990 году американская фирма "Апачи Медикл Системз Инк." установила в реанимационном отделении одной из больниц штата Мичиган экспертную систему "Апачи -III" [96]. Ее цель -прогнозирование исхода забо-левания у больных, находящихся в тяжелом состоянии. Для прогноза в компьютер необходимо ввести 27 пара-метров больного: первичный диагноз, симптомы, степень утраты сознания, наличие или отсутствие СПИД и дру-гих заболеваний. После этого система выдает вероятность выживания больного в диапазоне от 0 до 100 процен-тов. Ценность применения системы заключается в том, что она позволяет очень быстро оценить динамику изме-нения состояния больного, незаметную "на глаз". Например, можно получить ответ у системы до и после введе-ния какого-либо лекарства, и, сравнив ответы, посмотреть, будет ли наблюдаться эффект от терапии. Без про-граммы же изменение состояния иногда не удается обнаружить в течение нескольких дней. Тестирование показа-ло, что 95% прогнозов, которые делает программа, сбываются с точностью до 3%, что значительно точнее, чем у лучших врачей. Необходимо отметить, что система была обучена на данных, взятых из историй болезней 17448 пациентов, лечившихся в 40 больницах штата в 1989 году. Очевидно, что если качество работы системы обеспе-чивается таким большим объемом выборки, возможности перенастройки системы не слишком велики. Идеология авторов, создавших эту систему, заключается в как можно большем охвате различных примеров и вариантов (сбор данных в 40 больницах), а не в возможности индивидуализации системы к конкретной клинике. Поэтому данная система не способна к подучиванию в процессе работы, опыт "зашит" в нее жестко. Это может быть су-щественным недостатком при установке программы в регионы, резко отличающиеся по социально-географическим условиям от тех, где проводилось обучение. Кроме того, огромный массив примеров для обуче-ния повышает стоимость программы.
Похожая система моделирования смертности больных в отделении реанимации описана в [161] и более узкоспециализированная система (больные с сердечно-легочной недостаточностью)-в [166].
Прогностические нейросетевые модели могут использоваться в демографии и организации здравоохране-ния. Создана экспертная система, предсказывающая, умрет ли человек (в возрасте 55 лет и старше) в ближайшие 10 лет. Прогноз делается по результатам ответов на 18 вопросов анкеты. В анкету включены такие вопросы, как раса, пол, возраст, вредные привычки, семейное положение, семейный доход. 4 из 18 вопросов выявляют индекс массы тела (body mass index) в различные периоды жизни респондента. Индекс рассчитывается как отношение веса к квадрату роста (индекс более 27 кг/м считается тучностью). Повышенное внимание к этому показателю говорит о его значимости для прогноза жизни.
Приводится описание нейросетевой системы, дающей прогноз исхода у больных с проникающими трав-мами [253].
Для организационного планирования работы лечебных отделений могут быть полезны системы, подоб-ные описанным в [312,313], где определяется прогноз длительности лечения кардиохирургического больного, и в [159], вычисляющей прогноз длительности пребывания психиатрического больного в стационаре.
Нейросети применены для прогноза исходов трансплантации печени [163], прогнозирования исхода у больных раком [142] и предсказания возникновения осложнений у больных с искусственными клапанами сердца [224,225].
Развитие нейросетевых методов дает возможность их использования как инструмента научных исследо-ваний, с помощью которого можно изучать объекты и явления.
Судя по литературным данным, именно биологические научные исследования являются наиболее разви-ваемой областью применения нейросетей [118,223]. В последнее время биологи, знакомые с исследованиями в области нейроинформатики, приходят к выводу, что многие системы в живых организмах работают по принци-пам, сходным с алгоритмами нейронных сетей (или наоборот, нейронные сети работают по принципу биосистем). Таким образом, можно наблюдать "взаимное стимулирование" научных разработок в биологии и нейроинформа-тике. В работе [140] эндокринная система человека рассматривается как нейронная сеть из 30 элементов, которые представлены различными гормонами, взаимодействующими друг с другом с помощью прямых и обратных свя-зей. Похожие исследования проводятся для иммунной системы [316,318]. Японские ученые [331] использовали нейросеть для экспериментов по моделированию нервной системы простых организмов.
Применение нейросетей для исследований в области нейрофизиологии строится на похожих принципах функционирования нейросетей и нервных структур живых организмов [239]. С помощью нейросети осуществле-на попытка моделирования простейшей нервной системы [315] и ассоциативной памяти [144], моделирование связей мозга [147], изучение моторных функций мозга [175] и памяти [205], изучение глазодвигательной функ-ции [156,162] и распознавания движущихся образов [206], моделирование функции мочевого пузыря [122].
С помощью нейросетей исследуются не только физиологические, но и патофизиологические процессы. Проводились, например, нейросетевые исследования шизофрении [160] и роли дефицита допамина в ее развитии [153], эпилепсии [255] и амнезии [148].
Сделана попытка применения нейросети для классификации живых организмов [293]: нередко биологам, открывающим новые виды организмов, требуется определить, к какому виду (классу, типу) относится тот или иной представитель флоры или фауны (как правило, это касается микроорганизмов и растений). Система способ-на работать при отсутствии некоторых входных данных. Это является существенным преимуществом, так как часто при изучении живых объектов не всегда возможно получить всю необходимую информацию. Похожим образом работает система идентификации микроорганизмов [228].
Нейросети использованы для идентификации человеческих хромосом [171,194,218]. В биологических исследованиях, а также в криминалистике, часто бывает нужно определить, к какой из 23 имеющихся у человека пар хромосом относится выделенная хромосома. Точность существующих методов достигала 75 -85%. Нейроклассификатор, на вход которого подается 30 признаков изображения хромосомы, определяет ответ с точ-ностью, приближающейся к 100% [306].
С помощью нейросетей проводилось изучение взаимодействия генов [134], ДНК [302], анализ ДНК по данным проточной цитометрии [283] и распознавание структуры HLA-антигенов [136].
Построена модель взаимодействия между раковыми клетками и отслеживание динамики их субпопуляции
[278].
Вызывает большой интерес применение нейронной сети для предсказания вторичной структуры разнооб-разных белков по аминокислотным последовательностям [164,185,279,287], например, белков вируса СПИДа [110], участков иммуноглобулинов с их классификацией [131]. В работах [174,324] описывается нейросетевой метод кластеризации белков -отнесения их к определенным классам и семействам. Следует заметить, что для решения нестандартных задач, подобных этой, как правило, приходится применять нейросети со специально раз-работанной архитектурой, адаптированной под задачу. Это связано прежде всего со спецификой входных сигна-лов и вида ответа сети.
Нейросетевые технологии используются в фармацевтической промышленности для отработки взаимодей-ствия лекарственных препаратов [215], моделирования прямого [191,214,232] и побочного действия лекарств [108], а также для изучения фармакодинамики препаратов, например, левадопы при болезни Паркинсона [217].
1990 1991 1992 1993 1994 1995
Рисунок 1.1. Динамика числа публикаций о нейронных сетях в медицине и биологии по результатам поиска во Всемирной Медицинской базе данных MedLine и прогноз числа публикаций на 1995 год
Медицинские задачи являются очень удобными в качестве тестов при различных экспериментах с нейронными сетями. В работе [157] авторы использовали задачу диагностики нижних инфарктов миокарда для проверки гипотез о влиянии случайно сгенерированной карты синапсов и случайно отобранных примеров на ка-чество и стабильность обучения нейронных сетей.
Анализ публикаций о нейронных сетях в биологии и медицине, проведенный по Всемирной Медицинской базе данных MedLine, показывает , что количество таких публикаций неуклонно растет с каждым месяцем. На рисунке 1.1 приведена диаграмма роста публикаций с 1990 по 1994 год, а также прогноз числа публикаций на 1995 год, осуществленный нами с помощью нейронной сети с учетом ежемесячного количества публикаций.
На основании проведенного анализа литературы можно сделать следующие выводы.
- Рост числа публикаций о нейронных сетях свидетельствует о все большем распространении нейросетевых технологий в области биологии и медицины и хороших перспективах развития медицинской нейроинформа-тики.
- По данным подавляющего числа работ, в которых проводилось сравнение нейросетевых методов принятия решений и интерпретации данных с традиционными алгоритмами, нейросети обладают большей скоростью, точностью, гибкостью и информативностью при решении медико-биологических задач [266].
- Нейросетевые экспертные системы в медицине и биологии создаются традиционными методами с участием математиков и специалистов по нейроинформатике.
- Во многих работах для проведения экспериментов применяются нейрокомпьютеры [112,237,238,280], специ-ально сконструированные для решения задач с помощью нейросетей.
- Практически отсутствуют какие-либо методологии разработки нейросетевых медицинских систем, о чем сви-детельствует как отсутствие работ такого профиля, так и огромное разнообразие подходов к нейросетевым ал-
- горитмам обучения и архитектурам нейронных сетей. Это подтверждает то, что медицинская нейроинформа-тика как наука находится еще, в основном, на стадии накопления фактического материала.
- Все медицинские приложения нейронных сетей для практического здравоохранения (диагностика, лечение, прогнозирование) созданы зарубежными авторами. Большинство отечественных работ направлено на иссле-дование самих нейронных сетей и моделирование с их помощью некоторых биологических процессов (в ос-новном, функций нервной системы).
Глава II. Теоретические и методологические основы создания медицинских нейросетевых экспертных систем
II.1. Задачи, решаемые нейронными сетями
Все задачи, решаемые человеком, с позиций нейроинформационных технологий можно условно класси-фицировать на 2 группы.
- Задачи, имеющие известный и определенный набор условий, на основании которого необходимо получить четкий, точный, недвусмысленный ответ по известному и определенному алгоритму.
- Задачи, в которых не представляется возможным учесть все реально имеющиеся условия, от которых зависит ответ, а можно лишь выделить приблизительный набор наиболее важных условий. Так как часть условий при этом не учитывается, ответ носит неточный, приблизительный характер, а алгоритм нахождения ответа не может быть выписан точно.
Для решения задач первой группы с большим успехом можно использовать традиционные компьютерные программы. Как бы ни был сложен алгоритм, ограниченность набора условий (входных параметров) дает воз-можность составления алгоритма решения и написания конкретной программы, решающей данную задачу. Нет никакого смысла в использовании нейроинформационных технологий для решения таких задач, так как в этом случае нейросетевые методы будут априорно хуже решать такие задачи. Единственным исключением является случай, когда алгоритм вычисления ответа слишком большой и громоздкий и время на решение конкретной зада-чи по этому алгоритму не удовлетворяет практическим требованиям; кроме того, при получении ответа не требу-ется абсолютная точность.
При решении задач второй группы применение нейротехнологии оправдывает себя по всем параметрам, при выполнении, однако, двух условий: во-первых, наличия универсального типа архитектуры и единого универ-сального алгоритма обучения (отсутствие необходимости в их разработке для каждого типа задач), во-вторых, наличия примеров (предыстории, фиксированного опыта), на основании которых производится обучение нейронных сетей. При выполнении этих условий скорость создания экспертных систем возрастает в десятки раз, и соответственно снижается их стоимость.
Практически вся медицинская и биологическая наука состоит именно из задач, относящихся ко второй группе, и в большинстве этих задач достаточно легко набрать необходимое количество примеров для выполнения второго условия. Это задачи диагностики, дифференциальной диагностика, прогнозирования, выбора стратегии и тактики лечения и др. Медицинские задачи практически всегда имеют несколько способов решения и “нечеткий” характер ответа, совпадающий со способом выдачи результата нейронными сетями.
Все неалгоритмируемые или трудноалгоритмируемые задачи, решаемые нейронными сетями, можно классифицировать на два принципиально различающихся типа в зависимости от характера ответа -задачи клас-сификации и задачи предикции.
Задачи классификации. Это основная и очень обширная группа медико-биологических задач. Ответом в них является класс -выбор одного варианта из заранее известного набора вариантов. Классификация может быть бинарной (элементарная классификация)-в этом случае набор возможных ответов состоит из двух вариантов (классов), и n-арной, где число классов более двух. Примерами бинарной классификации могут служить как объ-ективные категории (пол человека -мужской или женский; характер опухоли -доброкачественный или злокаче-ственный), так и субъективные категории (здоров человек или болен; наличие или отсутствие склонности к про-студным заболеваниям). В некоторых случаях не представляется возможным отнесение ответа задачи к объек-тивной или субъективной категории, и это не имеет принципиального значения для обучения и работы нейросе-тевой экспертной системы.
Важной чертой задачи классификации по определению является возможность выбора одного и только одного варианта решения (класса). Поэтому постановка диагноза не может считаться одной классификационной задачей, т.к. у одного человека может одновременно присутствовать несколько патологий. В случае невозможно-сти выбирать один вариант ответа (множественности выбора) задача подразделяется на подзадачи, каждая из которых представляет собой классификационную задачу.
Другой вид задач для нейросетей -задачи предикции, или предсказания. Они подразделяются на предска-зание числа (одномерная предикция) и вектора (векторная предикция, более общий случай). Отличие от класси-фикационных задач заключается в том, что ответ в задачах предикции может быть дробным и принимать любые значения на каком-либо интервале.
Векторная предикция предполагает, что ответ может быть представлен в виде нескольких независимых друг от друга чисел, образующих точку (или вектор) в многомерном пространстве, размерность которого равно количеству предсказываемых чисел. Число координат вектора называется при этом размерностью вектора ответа.
При решении реальных задач возможны различные комбинации предикции и классификации, и постанов-ка задачи должна быть сделана самим предметным специалистом.
II.2. Архитектура нейронной сети
Основой работы самообучающихся нейропрограмм является нейронная сеть, представляющая собой со-вокупность нейронов -простых элементов, связанных между собой определенным образом. Нейроны и меж-нейронные связи задаются программно на обычном компьютере или могут иметь "материальную" основу -осо-бую микросхему (нейрочип, [200]), которые применяются в специально созданных нейрокомпьютерах [11]. Структура взаимосвязей между нейронами в нейрокомпьютере или нейропрограмме аналогична таковой в биоло-гических объектах. Искусственный нейрон имеет коммуникации с другими нейронами через синапсы, передаю-щие сигналы от других нейронов к данному (дендриты) или от данного нейрона к другим (аксон). Кроме того, нейрон может быть связан сам с собой. Несколько нейронов, связанных между собой определенным образом, образуют нейронную сеть.
Нейросеть, также как и биологический аналог, должна иметь каналы для связи с внешним миром. Одни каналы обеспечивают поступление информации из внешнего мира на нейросеть, другие выводят информацию из нейросети во внешний мир. Поэтому одни нейроны сети рассматривается как входные, другие же -как выходные. Часть нейронов может не сообщаться с внешним миром, а взаимодействовать с входными, выходными и такими же нейронами ("скрытые" нейроны).
Очевидно, что существует огромное количество способов соединения нейронов, растущее с увеличением числа нейронов в сети [177]. Наиболее употребительной является слоистая архитектура, в которой нейроны рас-полагаются “слоями”. В наиболее общем случае аксоны каждого нейрона одного слоя направлены к нейронам следующего слоя. Таким образом, нейроны первого слоя являются входными (принимающими информацию из внешнего мира), нейроны последнего с лоя -выходными (выдающими информацию во внешний мир). Схема трехслойной сети изображена на рисунке 2.1.
Другой вид архитектуры -полносвязная, когда каждый нейрон соединен с каждым, в том числе сам с со-бой. Пример простейшей нейросети из 3 нейронов показан на рисунке 2.2. Для удобства изображения из каждого нейрона выходит не один, а несколько аксонов, направленных на другие нейроны или во внешний мир, что ана-логично присоединенным к одному аксону через синапсы нескольким дендритам.
Слоистые сети являются частными случаями полносвязных.
Для построения экспертных систем мы выбрали именно полносвязные нейросети, исходя из следующих соображений. Во-первых, при одинаковом числе нейронов полносвязные сети имеют большее количество меж-нейронных связей, что увеличивает информационную емкость сети. Во-вторых, полносвязная архитектура явля-ется намного более универсальной, что не требует экспериментов с вариациями схемы соединений для каждой задачи. В-третьих, в случае эмуляции сети на обычной ЭВМ полносвязные сети обладают серьезными преимуще-ствами, прежде всего в скорости функционирования и простоте программной реализации без ущерба качеству обучаемости.
II.3. Функционирование нейрона
Рассмотрим устройство и функционирование отдельного нейрона. Каждое соединение от нейрона к нейрону называется синапсом. На рисунке 2.3 представлен нейрон с группой синапсов, соединяющих нейрон либо с другими нейронами, либо с внешним миром. Для рассмотрения работы нейрона неважно, приходит ли сигнал к нейрону из внешнего мира или с другого нейрона, и неважно, куда отправляется сигнал с нейрона. В полносвязных сетях выходной сигнал направляется всем остальным нейронам.
Нейрон состоит из двух функциональных блоков: входного сумматора и собственно нейрона, или преоб-разователя.
Функционирование нейрона происходит следующим образом.
В текущий момент времени через входные синапсы (на рисунке их 3) на нейрон направляются сигналы от других нейронов и/или из внешнего мира. Каждый синапс имеет параметр, называемый весом синапса, и пред-ставляющий какое-либо число. Сигнал, проходящий через синапс, умножается на вес этого синапса. В зависимо-сти от веса, сигнал может быть усилен (модуль веса > 1) или ослаблен (модуль веса < 1) по амплитуде. Сигналы от всех синапсов, ведущих к данному нейрону, принимает сумматор.
Сумматор производит суммирование всех пришедших сигналов и подает на собственно нейрон (преобра-зователь) одно число -полученную сумму. Величина этого числа будет зависеть как от величин исходных сигна-лов, так и от весов синапсов. Нейрон, получивший это число, преобразует его согласно своей функции, в резуль-тате которой получается другое число, и отправляет его по "аксону" всем остальным нейронам через соответ-ствующие синапсы. Последующие нейроны производят с полученными сигналами такие же операции, лишь с тем различием, что во-первых, веса их синапсов могут быть уже другими, во-вторых, другие нейроны могут иметь другой вид функции преобразования. В конструируемых нами нейронных сетях все нейроны имеют одну и ту же функцию. Эта функция, называемая характеристической [234], имеет вид:
f (X) = X/(C+