Медицина

Відомо багато експертних систем для постановки медичних діагнозів. Вони побудовані головним чином на основі правил, що описують поєднання різних симптомів різних захворювань. За допомогою таких правил дізнаються не тільки, на що хворий пацієнт, але і як потрібно його лікувати. Правила допомагають вибирати засоби медикаментозної дії, визначати свідчення - протипоказання, орієнтуватися в лікувальних процедурах, створювати умови найбільш ефективного лікування, передбачати результати призначеного курсу лікування і т.п. Технології Data Mining дозволяють виявляти в медичних даних шаблони, складаючи основу вказаних правил.

Молекулярна генетика і генна інженерія

Мабуть, найгостріше і разом з тим чітко завдання виявлення закономірностей в експериментальних даних, стоїть в молекулярній генетиці і генній інженерії. Тут вона формулюється як визначення так званих маркерів, під якими розуміють генетичні коди, контролюючі ті або інші фенотипічні ознаки живого організму. Такі коди можуть містити сотні, тисячі і більш зв'язаних елементів.

На розвиток генетичних досліджень виділяються великі кошти. Останнім часом в даній області виник особливий інтерес до застосування методів Data Mining. Прикладна хімія

Методи Data Mining знаходять широке застосування в прикладній хімії (органічній і неорганічній). Тут нерідко виникає питання про з'ясування особливостей хімічної будови тих або інших з'єднань, що визначають їх властивості. Особливо актуальне таке завдання при аналізі складних хімічних сполук, опис яких включає сотні і тисячі структурних елементів і їх зв'язків.

Можна привести ще багато прикладів різних областей знання, де методи Data Mining відіграють провідну роль. Особливість цих областей полягає в їх складній системній організації. Вони відносяться головним чином до організації систем понадкібернетичного рівня , закономірності якого не можуть бути достатньо точно описані на мові статистичних або інших аналітичних математичних моделей. Дані у вказаних областях неоднорідні, гетерогенні, нестаціонарні і часто відрізняються високою розмірністю.

Статистичні пакети

Останні версії майже всіх відомих статистичних пакетів включають разом з традиційними статистичними методами також елементи Data Mining. Але основна увага в них приділяється все ж таки класичним методикам - кореляційному, регресійному, факторному аналізу і іншим. Найсвіжіший детальний огляд пакетів для статистичного аналізу приведений на сторінках Інтернету http://is1.cemi.rssi.ru/ruswin/index.htm. Недоліком систем цього класу вважають вимогу до спеціальної підготовки користувача. Також відзначають, що могутні сучасні статистичні пакети є дуже "ваговитими" для масового застосування у фінансах і бізнесі. До того ж часто ці системи вельми дорогі - від $1000 до $15000.

Є ще серйозніший принциповий недолік статистичних пакетів, що обмежує їх застосування в Data Mining. Більшість методів, що входять до складу пакетів, спираються на статистичну парадигму, в якій головними фігурантами служать усереднені характеристики вибірки. А ці характеристики, як вказувалося вище, при дослідженні реальних складних життєвих феноменів часто є фіктивними величинами.

Розглянемо основні завдання, які успішно вирішуються з використанням інструментів Data Mining.

Аналіз кредитного ризику <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Залучення і утримання клієнтів <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Прогнозування змін клієнтури <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Виявлення совокупностей банківських продуктів, що набувають клієнтами, і послуг <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Прогнозування залишку на рахунках клієнтів <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Управління портфелем цінних паперів <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Виявлення випадків шахрайства з кредитними картками <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Оцінка прибутковості інвестиційних проектів <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Оцінка інтенсивності конкуренції і найближчих конкурентів <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Профілізація якнайкращих досягнень <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Підвищення якості архівної фінансової інформації <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

Верифікація даних по курсах валют <http://www.inftech.webservis.ru/it/database/datamining/ar5.html>

8.2. ІАД та український ринок

На українському ринку технології інтелектуальних обчислень роблять лише перші кроки. Це можна пояснити їх високою вартістю, але, як показує історія розвитку інших галузей комп'ютерного ринку України, сам по собі цей фактор навряд чи є визначальним. Скоріше тут виявляється дія деяких специфічних для України негативних факторів, що різко зменшують ефективність застосування аналітичних технологій. Постараємося визначити ці фактори, проаналізувати ступінь притаманних їм різних класів систем інтелектуального аналізу даних та обчислень, а також виділити властивості таких систем, що полегшують українським покупцям їх застосування.

Почнемо з характеристики української специфіки. Комп'ютерні системи підтримки прийняття рішень, у принципі, можуть ґрунтуватися на двох підходах. Перший, більш традиційний, полягає в тому, що в системі фіксується досвід експерта, який використовується для вироблення, оптимального в даній ситуації, рішення. Системи інтелектуальних обчислень в основному реалізують другий підхід. Вони намагаються знайти рішення на основі аналізу історичних даних, що описують поведінку досліджуваного об'єкта, прийняті в минулому рішення, їхні результати і т.д. Усі ці дані можуть включати, наприклад, часові ряди цін на різні фінансові послуги, результати фінансово-господарської діяльності підприємства, статистику продажів тієї чи іншої продукції. Зрозуміло, щоб застосування цих систем у практиці виявилось виправданим, необхідно мати досить вагому множину цих даних - інакше прийняті на їхній основі рішення будуть безпідставними.

З цією очевидною обставиною зв'язані головні труднощі просування технологій інтелектуальних обчислень в України: відмінною рисою більшості вітчизняних підприємств є порівняно невеликий термін існування. Характерний "вік" накопичених ними баз даних складає 2-3 роки, і, як показує досвід, інформації, що міститься в цих базах даних, виявляється недостатньо для вироблення на її основі ефективної стратегії прийняття рішень за допомогою новітніх аналітичних систем. Небезпека тут складається не стільки в неможливості виявлення цікавих взаємозв'язків у нечисленних даних і побудови моделей на їхній основі, скільки в одержанні статистично незначущих моделей і прийнятті на їхній основі невірних рішень. Якщо даних мало, а їх описова модель складна, то завжди можна підігнати цю модель під дані, навіть якщо це цілком випадкові числа. Той факт, що метод відмінно працює, коли потрібно пояснити те, що було в минулому, але зовсім непридатний для прийняття рішень "на майбутнє", народжує сумнів у здатності систем інтелектуальних обчислень вирішувати реальні задачі зі сфери бізнесу і фінансів. Таким чином, головна проблема застосування систем добування знань для України - це нечисленність аналізованих даних, а одне з головних вимог до цих систем -наявність жорсткого контролю статистичної значимості одержуваних результатів.

Іншою відмітною рисою української економіки, як на макрорівні, так і на рівні окремих підприємств, є її нестабільність; крім того, вона знаходиться під впливом дії численних, зненацька виникаючих факторів.

Нарешті, ще одна обставина впливає на застосування систем інтелектуальних обчислень в українських умовах. Воно зв'язано з тим, що особи, відповідальні за прийняття рішень у бізнесі і фінансах, звичайно не є фахівцями з статистики і штучного інтелекту, тому не можуть безпосередньо використовувати системи інтелектуального аналізу даних, що вимагають складного налаштування чи спеціальної підготовки даних. Якщо така система поставляється як складова частина загальної технології електронних сховищ даних, реалізованої на підприємстві (що стає самою розповсюдженою практикою в розвинутих країнах), то це не створює проблеми - всі налаштування і передпроцесорна обробка здійснюються автоматично. Однак українські підприємства, що використовують сховища даних з елементами інтелектуального аналізу, сьогодні вкрай нечисленні. Тому важливими факторами, що визначають комерційний успіх систем інтелектуального аналізу даних в України, є простота у використанні і високому ступені комп'ютеризації.

Передові підприємці усвідомили, що засоби інтелектуальних обчислень - це реальний спосіб підвищення ефективності роботи. Питання не в тому, чи потрібні нові технології, а в тому, як їх застосувати в кожному конкретному випадку. Витрати на постановку задачі і супровід інтелектуальних систем можуть на порядок перевищувати вартість окремого пакета програм. Очевидно, що варто витратити частину грошей на навчання фахівців - у підсумку вийде дешевше й ефективніше. Зростає роль спеціалізованих консалтингових фірм, що здійснюють комплексний супровід проектів, включаючи діагностику задачі, аналіз методів рішення, вироблення рекомендацій, реалізацію обраного підходу, супровід, оптимізацію тощо.

ЛІТЕРАТУРА:

Ситник В.Ф. Системи підтримки прийняття рішень: Навч. посібник. - К.: КНЕУ, 2004. - 614 с.
Федоров А., Елманова Н. Введение в OLAP - технологии Microsoft - М.: Диалог - МИФИ, 2002 - 268 с.
Дюк В.А. Data Mining – состояние проблемы, новые решения. Wysiwyg: //38/ http://www.inftech.webservis.ru/database/datamining/ar1.html.
Дюк В.А. Data Mining – интеллектуальный анализ данных.

Wysiwyg: //18/ http://www.olap.ru/basic/dm2.asp.

5. Кречетов, П. Иванов. Продукти для интеллектуального анализа даних // ComputerWeek-Москва. - 1997. - N 14-15. - С. 32-39.

6 E. F. Codd, S. B. Codd, C. T. Salley. Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate. - E. F. Codd & Associates, 1993.

J. Gray, S. Chaudhuri, A. Bosworth, A. Layman, D. Reichart, M. Venkatrao, F. Pellow, H. Pirahesh. Data Cube: A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals // Data Mining and Knowledge Discovery. - 1997. - N 1. - P. 29-53.
D. Hackathorn. Reinventing Enterprise Systems Via Data Warehousing. - Washington, DC: The Data Warehousing Institute Annual Conference, 1995.
Корнеев В.В. и др. Базы данных. Интеллектуальная обработка информации. - М.: Нолидж, 2000. - 352 с.
Rob P. and C. Coronell. Database Systems: Design, Implementation, and Management, Course Technology, 1997.
Лесник А.А., Мальцев В.Н. Системы поддержки управленческих и проектных решений. - Л.: Машиностроение. Ленингр. отд-е, 1990. - 167 с.
Архипенков С.Я. Аналитические системы на базе Oracle Express OLAP. - М.: Диалог - МИФИ, 2000. - 320 с.

5rik.ru

Материалы для учебы и работы

Медицина