Symbolic Rule Language (SRL) - мова символьних правил

SRL - це універсальна алгоритмічна мова PolyAnalyst, яка використовується для символьного уявлення автоматично знайдених системою в процесі Data Mining правил, а також для створення користувачем своїх власних правил. На мові SRL можна виразити широкий спектр математичних конструкцій, використовуючи операції алгебри, великий набір вбудованих функцій, операції з датами і часом, логічні і умовні конструкції. Для зручності написання виразів на SRL в програмі передбачений майстер створення правил.

 
 

 

Еволюційне програмування

Зараз Еволюційне програмування найбільш молода і багатообіцяюча технологія Data Mining. Основна ідея методу полягає у формуванні гіпотез про залежність цільової змінної від інших змінних у вигляді, що автоматично синтезуються спеціальним модулем програм на внутрішній мові програмування. Використання універсальної мови програмування теоретично дозволяє виразити будь-яку залежність, причому вид цієї залежності наперед не відомий. Процес виробництва внутрішніх програм організовується як еволюція в просторі програм, в деякому роді що нагадує генетичні алгоритми. Коли система знаходить перспективну гіпотезу, що описує досліджувану залежність досить добре по цілому ряду критерій, в роботу включається механізм так званих "узагальнених перетворень" (GT-search). За допомогою цього механізму в "хорошу" програму вводяться незначні модифікації, не погіршуючі її якість, і проводиться відбір кращої дочірньої програми. До нової популяції потім знову застосовуються механізми синтезу нових програм, і цей процес рекурсивно повторюється. Таким чином, система створює деяке число генетичних ліній програм, що конкурують один з одним по точності, статистичній значущості і простоті виразу залежності.

Спеціальний модуль безперервно перетворить "кращу" на даний момент програму з внутрішнього уявлення в зовнішню мову PolyAnalyst - мову символьних правил (Symbolic Rule Language), зрозумілу людині: математичні формули, умовні конструкції і так далі. Це дозволяє користувачеві зрозуміти суть отриманої залежності, контролювати процес пошуку, а також отримувати графічну візуалізацію результатів. Контроль статистичної значущості отриманих результатів здійснюється цілим комплексом ефективних і сучасних статистичних методів, включаючи методи рандомізованого тестування.

Загальносистемні характеристики PolyAnalyst