Распознавание букв алфавита.
Задача классификации.
Примеры формализации задач
Некоторый объект характеризуется несколькими параметрами p1, ..., pN, причем имеется M классов объектов, C1, ..., CM. При наблюдении объекта можно рассчитать или измерить его параметры, характеризуемые вектором p
|
где
0 ≤ cm ≤ 1 и . (1)
Здесь cm - вероятность, с которой объект относится к классу Cm. Например, c1 = 0,9, с2 = 0,1 означает, что объект
|
|
В процессе обучения сеть строит отображение P → C. Целиком получить это отображение не возможно, но можно получить произвольное количество пар (p → c), связанных отображением. Для произвольного вектора pна входе мы можем получить приближенные вероятности принадлежности к классам на выходе.
Часто оказывается, что компоненты выходного вектора могут быть меньше 0 или больше 1, а второе условие (1) выполняется лишь приблизительно. Неточность — следствие аналоговости нейронных сетей. Большинство результатов, получаемых с помощью нейросетей, неточно. Кроме того, при обучении сети указанные условия, накладываемые на вероятности, не вводятся в сеть непосредственно, а неявно содержатся во множестве данных, на которых обучается сеть. Это — вторая причина некорректности результата.
Существуют и другие способы формализации.
Будем представлять буквы в виде точечных изображений (рис. ).
Рис. . Точечное изображение.
Темной клетке-пикселу на изображении соответствует Iij = 1 , светлому — Iij = 0 . Задача состоит в том, чтобы определить по изображению букву, которая была предъявлена.
Построим МСП с Ni х Nj входами, где каждому входу соответствует один пиксел: xk = Iij . Яркости пикселов будут компонентами входного вектора.
В качестве выходных сигналов выберем вероятности того, что предъявленное изображение соответствует данной букве:
Сеть рассчитывает выход:
где выход c1 = 0,9 означает, к примеру, что предъявлено изображение буквы "А", и сеть уверена в этом на 90 %, выход c2 = 0,1 — что изображение соответствовало букве "Б" с вероятностью 10 % и т.д.
Существует другой способ: входы сети выбираются так же, а выход – только один, номер m предъявленной буквы. Сеть учится давать значение m по предъявленному изображению I:
(Iij) → m
В этом случае недостатком является то, что буквы, имеющие близкие номера m, но непохожие изображения, могут быть перепутаны сетью при распознавании.