Распознавание букв алфавита.

Задача классификации.

Примеры формализации задач

Некоторый объект характеризуется несколькими параметрами p1, ..., pN, причем имеется M классов объектов, C1, ..., CM. При наблюдении объекта можно рассчитать или измерить его параметры, характеризуемые вектором p

i
Необходимо выбрать класс Ci, к которому принадлежит объект, характеризуемый набором параметров p. Решение задачи можно представить в виде вектора:

где

0 ≤ cm ≤ 1 и . (1)

Здесь cm - вероятность, с которой объект относится к классу Cm. Например, c1 = 0,9, с2 = 0,1 означает, что объект

с данным набором параметров pс вероятностью 0,9 относится к классу C1
и с вероятностью 0,1 – к классу C2. Поставленная задача может быть решена с помощью МСП с N входами и M выходами, обученного давать на выходе вектор c, когда на вход подается p.

В процессе обучения сеть строит отображение P → C. Целиком получить это отображение не возможно, но можно получить произвольное количество пар (p → c), связанных отображением. Для произвольного вектора pна входе мы можем получить приближенные вероятности принадлежности к классам на выходе.

Часто оказывается, что компоненты выходного вектора могут быть меньше 0 или больше 1, а второе условие (1) выполняется лишь приблизительно. Неточность — следствие аналоговости нейронных сетей. Большинство результатов, получаемых с помощью нейросетей, неточно. Кроме того, при обучении сети указанные условия, накладываемые на вероятности, не вводятся в сеть непосредственно, а неявно содержатся во множестве данных, на которых обучается сеть. Это — вторая причина некорректности результата.

Существуют и другие способы формализации.

 

Будем представлять буквы в виде точечных изображений (рис. ).

 

Рис. . Точечное изображение.

Темной клетке-пикселу на изображении соответствует Iij = 1 , светлому — Iij = 0 . Задача состоит в том, чтобы определить по изображению букву, которая была предъявлена.

Построим МСП с Ni х Nj входами, где каждому входу соответствует один пиксел: xk = Iij . Яркости пикселов будут компонентами входного вектора.

В качестве выходных сигналов выберем вероятности того, что предъявленное изображение соответствует данной букве:

Сеть рассчитывает выход:

где выход c1 = 0,9 означает, к примеру, что предъявлено изображение буквы "А", и сеть уверена в этом на 90 %, выход c2 = 0,1 — что изображение соответствовало букве "Б" с вероятностью 10 % и т.д.

Существует другой способ: входы сети выбираются так же, а выход – только один, номер m предъявленной буквы. Сеть учится давать значение m по предъявленному изображению I:

(Iij) → m

В этом случае недостатком является то, что буквы, имеющие близкие номера m, но непохожие изображения, могут быть перепутаны сетью при распознавании.