Распознавание букв алфавита.

Задача классификации.

Примеры формализации задач

Некоторый объект характеризуется несколькими параметрами p₁, ..., p_N, причем имеется M классов объектов, C₁, ..., C_M. При наблюдении объекта можно рассчитать или измерить его параметры, характеризуемые вектором p

Необходимо выбрать класс C_i, к которому принадлежит объект, характеризуемый набором параметров p. Решение задачи можно представить в виде вектора:

где

0 ≤ c_m ≤ 1 и . (1)

Здесь c_m - вероятность, с которой объект относится к классу C_m. Например, c₁ = 0,9, с₂ = 0,1 означает, что объект

с данным набором параметров pс вероятностью 0,9 относится к классу C₁

и с вероятностью 0,1 – к классу C₂. Поставленная задача может быть решена с помощью МСП с N входами и M выходами, обученного давать на выходе вектор c, когда на вход подается p.

В процессе обучения сеть строит отображение P → C. Целиком получить это отображение не возможно, но можно получить произвольное количество пар (p → c), связанных отображением. Для произвольного вектора pна входе мы можем получить приближенные вероятности принадлежности к классам на выходе.

Часто оказывается, что компоненты выходного вектора могут быть меньше 0 или больше 1, а второе условие (1) выполняется лишь приблизительно. Неточность — следствие аналоговости нейронных сетей. Большинство результатов, получаемых с помощью нейросетей, неточно. Кроме того, при обучении сети указанные условия, накладываемые на вероятности, не вводятся в сеть непосредственно, а неявно содержатся во множестве данных, на которых обучается сеть. Это — вторая причина некорректности результата.

Существуют и другие способы формализации.

Будем представлять буквы в виде точечных изображений (рис. ).

Рис. . Точечное изображение.

Темной клетке-пикселу на изображении соответствует I_ij = 1 , светлому — I_ij = 0 . Задача состоит в том, чтобы определить по изображению букву, которая была предъявлена.

Построим МСП с N_i х N_j входами, где каждому входу соответствует один пиксел: x_k = I_ij . Яркости пикселов будут компонентами входного вектора.

В качестве выходных сигналов выберем вероятности того, что предъявленное изображение соответствует данной букве:

Сеть рассчитывает выход:

где выход c₁ = 0,9 означает, к примеру, что предъявлено изображение буквы "А", и сеть уверена в этом на 90 %, выход c₂ = 0,1 — что изображение соответствовало букве "Б" с вероятностью 10 % и т.д.

Существует другой способ: входы сети выбираются так же, а выход – только один, номер m предъявленной буквы. Сеть учится давать значение m по предъявленному изображению I:

(I_ij) → m

В этом случае недостатком является то, что буквы, имеющие близкие номера m, но непохожие изображения, могут быть перепутаны сетью при распознавании.

5rik.ru

Материалы для учебы и работы

Распознавание букв алфавита.