Самообучающиеся системы

Самообучающиеся интеллектуальные системы основаны на методах автоматической классификации ситуаций из реальной практики, или на методах обучения на примерах. Примеры ре­альных ситуаций составляют так называемую обучающую выбор­ку, которая формируется в течение определенного исторического периода. Элементы обучающей выборки описываются множест­вом классификационных признаков.

Стратегия «обучения с учителем» предполагает задание спе­циалистом для каждого примера значений признаков, показыва­ющих его принадлежность к определенному классу ситуаций. При обучении «без учителя» система должна самостоятельно вы­делять классы ситуаций по степени близости значений класси­фикационных признаков.

В процессе обучения проводится автоматическое построение обобщающих правил или функций, описывающих принадлеж­ность ситуаций к классам, которыми система впоследствии будет пользоваться при интерпретации незнакомых ситуаций. Из обоб­щающих правил, в свою очередь, автоматически формируется ба­за знаний, которая периодически корректируется по мере накоп­ления информации об анализируемых ситуациях.

Построенные в соответствии с этими принципами самообу­чающиеся системы имеют следующие недостатки:

относительно низкую адекватность баз знаний возникаю­щим реальным проблемам из-за неполноты и/или зашумленнос­ти обучающей выборки;

низкую степень объяснимости полученных результатов;

поверхностное описание проблемной области и узкую на­правленность применения из-за ограничений в размерности признакового пространства.

Индуктивные системы позволяют обобщать примеры на ос­нове принципа индукции «от частного к общему». Процедура обобщения сводится к классификации примеров по значимым признакам. Алгоритм классификации примеров включает следу­ющие основные шаги.

1. Выбор классификационного признака из множества за­данных.

2. Разбиение множества примеров на подмножества по значе­нию выбранного признака.

3. Проверка принадлежности каждого подмножества приме­ров одному из классов.

4. Проверка окончания процесса классификации. Если ка­кое-то подмножество примеров принадлежит одному подклассу, т.е. у всех примеров этого подмножества совпадает значение классификационного признака, то процесс классификации за­канчивается.

5. Для подмножеств примеров с несовпадающими значения­ми классификационных признаков процесс распознавания про­должается, начиная с первого шага. При этом каждое подмноже­ство примеров становится классифицируемым множеством.

Нейронные сети представляют собой классический пример технологии, основанной на примерах. Нейронные сети - обоб­щенное название группы математических алгоритмов, обладаю­щих способностью обучаться на примерах, «узнавая» впоследст­вии черты встреченных образцов и ситуаций. Благодаря этой способности нейронные сети используются при решении задач обработки сигналов и изображений, распознавания образов, а также для прогнозирования.

Нейронная сеть - это кибернетическая модель нервной сис­темы, которая представляет собой совокупность большого числа сравнительно простых элементов — нейронов, топология соеди­нения которых зависит от типа сети. Чтобы создать нейронную сеть для решения какой-либо конкретной задачи, следует вы­брать способ соединения нейронов друг с другом и подобрать значения параметров межнейронных соединений.

В системах, основанных на прецедентах, БЗ содержит описа­ния конкретных ситуаций (прецеденты). Поиск решения осуще­ствляется на основе аналогий и включает следующие этапы:

• получение информации о текущей проблеме;

• сопоставление полученной информации со значениями признаков прецедентов из базы знаний;

• выбор прецедента из базы знаний, наиболее близкого к рас­сматриваемой проблеме;

• адаптация выбранного прецедента к текущей проблеме;

• проверка корректности каждого полученного решения;

• занесение детальной информации о полученном решении в БЗ.

Прецеденты описываются множеством признаков, по кото­рым строятся индексы быстрого поиска. Однако в системах, основанных на прецедентах, в отличие от индуктивных систем до­пускается нечеткий поиск с получением множества допустимых альтернатив, каждая из которых оценивается некоторым коэф­фициентом уверенности. Наиболее эффективные решения адап­тируются к реальным ситуациям с помощью специальных алго­ритмов.

Системы, основанные на прецедентах, применяются для рас­пространения знаний и в системах контекстной помощи.

Информационные хранилища отличаются от интеллектуальных баз данных, тем, что представляют собой хранилища значимой информации, регулярно извлекаемой из оперативных баз дан­ных. Хранилище данных - это предметно-ориентированное, ин­тегрированное, привязанное ко времени, неизменяемое собра­ние данных, применяемых для поддержки процессов принятия управленческих решений. Предметная ориентация означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они описывают, а не с приложениями, которые их используют. В хранилище данные интегрируются в целях удовлетворения требований предприятия в целом, а не от­дельной функции бизнеса. Привязанность данных ко времени выражает их «историчность», т.е. атрибут времени всегда явно присутствует в структурах хранилища данных. Неизменяемость означает, что, попав однажды в хранилище, данные уже не изме­няются в отличие от оперативных систем, где данные присутст­вуют только в последней версии, поэтому постоянно меняются. Технологии извлечения знаний из хранилищ данных основа­ны на методах статистического анализа и моделирования, ориен­тированных на поиск моделей и отношений, скрытых в совокуп­ности данных. Эти модели могут в дальнейшем использоваться для оптимизации деятельности предприятия или фирмы.

Для извлечения значимой информации из хранилищ данных имеются специальные методы (OLAP-анализа, Data Mining или Knowledge Discovery), основанные на применении методов мате­матической статистики, нейронных сетей, индуктивных методов построения деревьев решений и др.

Технология OLАР (On-Line Analytical Processing — оператив­ный анализ данных) предоставляет пользователю средства для формирования и проверки гипотез о свойствах данных или отно­шениях между ними на основе разнообразных запросов к базе данных. Они применяются на ранних стадиях процесса извлечения знаний, помогая аналитику сфокусировать внимание на важ­ных переменных. Средства Data Mining отличаются от ОLАР тем, что кроме проверки предполагаемых зависимостей они спо­собны самостоятельно (без участия пользователя) генерировать гипотезы о закономерностях, существующих в данных, и строить модели, позволяющие количественно оценить степень взаимного влияния исследуемых факторов на основе имеющейся информации.