Нейронні мережі основні моделі


Теорія нейронних мереж включає широке коло питань з різних областей науки: біофізики, математики, інформатики, схемотехніки і технології. Тому поняття "нейронні мережі" детально визначити складно.

Штучні нейронні мережі (НС) — сукупність моделей біологічних нейронних мереж.

Являє собою мережа елементів — штучних нейронів — зв'язаних між собою синаптичними з'єднаннями. Мережа обробляє вхідну інформацію й у процесі зміни свого стану в часі формує сукупність вихідних сигналів.

Робота мережі складається в перетворенні вхідних сигналів у часі, у результаті чого міняється внутрішній стан мережі і формуються вихідні впливи. Звичайно НС оперує цифровими, а не символьними величинами.

Більшість моделей НС вимагають навчання. У загальному випадку, навчання — такий вибір параметрів мережі, при якому мережа найкраще справляється з поставленою проблемою. Навчання — це задача багатомірної оптимізації, і для її рішення існує безліч алгоритмів.

Штучні нейронні мережі — набір математичних і алгоритмічних методів для рішення широкого кола задач. Виділимо характерні риси штучних нейромереж як універсального інструмента для рішення задач:

1. НС дають можливість краще зрозуміти організацію нервової системи людини і тварин на середніх рівнях: пам'ять, обробка сенсорної інформації, моторика.

2. НС — засіб обробки інформації:

а) гнучка модель для нелінійної апроксимації багатомірних функцій;

б) засіб прогнозування в часі для процесів, що залежать

від багатьох перемінних;

в) класифікатор за багатьма ознаками, що дає розбивка вхідного простору на області;

г) засіб розпізнавання образів;

д) інструмент для пошуку по асоціаціях;

г) модель для пошуку закономірностей у масивах даних.

3. НС вільні від обмежень звичайних комп'ютерів завдяки рівнобіжній обробці і сильної зв'язаності нейронів.

4. У перспективі НС повинні допомогти зрозумітипринципи, на яких побудовані вищі функції нервової системи: свідомість, емоції, мислення.

Істотну частину в теорії нейронних мереж займають біофізичні проблеми. Для побудови адекватної математичної моделі необхідно детально вивчити роботу біологічних нервових кліток і мереж з погляду хімії, фізики, теорії інформації і синергетики. Повинні бути відомі відповіді на основні питання, що стосуються

1. Як працює нервова клітка — біологічний нейрон? Необхідно мати математичну модель, що адекватно описує інформаційні процеси в нейроні. Які властивості нейрона важливі при моделюванні, а яких — немає?

2. Як передається інформація через з'єднання між нейронами синапси? Як міняється провідність синапса в залежності від минаючих по ньому сигналів?

3. За якими законами нейрони зв'язані один з одним у мережу? Відкіля нервова клітка знає, з якими сусідами повинне бути встановлене з'єднання?

4. Як біологічні нейронні мережі навчаються вирішувати задачі? Як вибираються параметри мережі, щоб давати правильні вихідні сигнали? Який вихідний сигнал вважається "правильним", а який —помилковим?

Найважливіші властивості біологічних нейромереж:

1. Паралельність обробки інформації. Кожен нейрон формує свій вихід тільки на основі своїх входів і власного внутрішнього стану під впливом загальних механізмів регуляції нервової системи.

2. Здатність до повної обробки інформації. Усі відомі людині задачі зважуються нейронними мережами. До цієї групи властивостей відносяться ассоціативність (мережа може відновлювати повний образ по його частині), здатність до класифікації, узагальненню, абстрагуванню і безліч інших. Вони до кінця не систематизовані.

3. Самоорганізація. У процесі роботи біологічні НС самостійно, під впливом зовнішнього середовища, навчаються рішенню різноманітних задач. Невідомо ніяких принципових обмежень на складність задач, розв'язуваних біологічними нейронними мережами. Нервова система сама формує алгоритми своєї діяльності, уточнюючи й ускладнюючи їх протягом життя. Людина поки не зуміла створити систем, що володіють самоорганізацією і самоускладненням. Це властивість НС породжує безліч питань. Адже кожна замкнута система в процесі розвитку спрощується, деградує. Отже, підведення енергії до нейронної мережі має принципове значення. Чому ж серед усіх дисипативних (розсіюючих энергію) нелінійних динамічних систем тільки в живих істот, і, зокрема, біологічних нейромереж виявляється здатність до ускладнення? Яка принципова умова упущена людиною в спробах створити системи, що самоускладнюються?

4. Біологічні НС є аналоговими системами. Інформація надходить у мережу по більшій кількості каналів і кодується по просторовому принципі: вид інформації визначається номером нервового волокна, по якому вона передається. Амплітуда вхідного впливу кодується щільністю нервових імпульсів, переданих по волокну.

5. Надійність. Біологічні НС мають фантастичну надійність: вихід з ладу навіть 10% нейронів у нервовій системі не перериває її роботи. У порівнянні з послідовними ЕОМ, заснованими на принципах теорії Неймана, де збій однієї комірки пам'яті чи одного вузла в апаратурі приводить до краху системи.

Сучасні штучні НС по складності і "інтелекту" наближаються до нервової системи таргана, але вже зараз демонструють коштовні властивості:

1. Навченість. Вибравши одну з моделей НС, створивши мережу і виконавши алгоритм навчання, ми можемо навчити мережу рішенню задачі, що їй під силу. Немає ніяких гарантій, що це удасться зробити при обрані мережі, алгоритмі і задачі, але якщо усе зроблено правильно, то навчання буде успішним.

2. Здатність до узагальнення. Після навчання мережа стає нечуттєвої до малих змін вхідних сигналів ( чи шуму варіаціям вхідних образів) і дає правильний результат на виході.

3. Здатність до абстрагування. Якщо пред'явити мережі кілька перекручених варіантів вхідного образа, то мережа сама може створити на виході ідеальний образ, з яким вона ніколи не зустрічалася.