Теория геонов.

За прошедшие годы было создано множество различных теорий о том, каким образом мы видим и распонаём объекты. Недавние исследования наводят на мысль. Что мы находим знакомые основные формы во всём, что видим, и используем эти основные формы, называемые геометрическими иконками (геонами), для распознавания объектов. Ирвин Бидерман выдвинул теорию геонов в 1985 году. Предполагается, что зрительная система располагает целым алфавитом из 24 распознаваемых базовых формы; из них формируются блоки для построения всех объектов, которые мы видим и идентифицируем. Наряду с цилиндрами, этот алфавит включает еще несколько других простых форм, таких как конусы и параллелепипеды. Различные предметы могут составляться из разных элементов.

Зрительная кора работает активнее когда вы что-либо представляете, а не когда вы в действительности воспринимаете объект.

Рис. 1

Геоны– это простые 2D или 3D формы, такие как цилиндры, параллелепипеды, клины, конусы, окружности и прямоугольники, относящиеся к простым частям объекта в теории распознавания объектов Бидермана.

Согласно данной теории визуальное восприятие объектов соотносится со структурными образами этих объектов, хранящимися в мозгу человека. Эти структурные образы состоят из геонов и связанных с ними форм (например, конус рожка с мороженым можно разложить на сферу, расположенную над конусом).

1 2

Рис. 2

Предполагается существование довольно скромного числа геонов (< 40).

Если их соединять друг с другом в различных комбинациях (например, один над другим, больший с меньшим, конец одного с концом другого, конец одного с серединой другого) и варьировать простые метрические характеристики, такие как увеличение масштаба и ориентация на плоскости, можно создавать миллионы плоских и объемных геонов.

Два типа визуального распознавания, основанного на формах объекта, которое осуществляется не через изображение геона, лежат в основе: a) индивидуализации похожих лиц и б) классификации, которая не имеет геометрически определенных привязок, как определение формы кустов или измятой одежды. Как правило, такая идентификация не является инвариантной относительно точки зрения.

Четыре основных свойства геонов:

1. Инвариантность точки зрения: каждый геон можно отличить от других геонов практически с любой точки зрения.

Кроме случаев, когда имеют место чрезвычайно ограниченные углы зрения, когда один геон проецирует образ, который может принадлежать другому геону (т.е. при взгляде под определенным углом зрения одна фигура похожа на другую). Как, например, когда вид цилиндра с торца воспринимается как сфера или круг. Объекты, представленные как группа геонов, могут точно так же быть инвариантны относительно точки зрения.

2. Стабильность или устойчивость к визуальному шуму: так как геоны достаточно просты, им свойственно такое качество, как целостность структуры, способствующее плавной реконструкции изображения, когда имеют место затруднения в его восприятии, от частичного до полного заграждения воспринимаемого объекта и уменьшения масштаба, например, когда наблюдаемый цилиндр расположен за кустами.

3. Инвариантность к направлению освещения и к окраске и структуре поверхности.

4. Высокая степень индивидуальности: качественно геоны различаются только по двум-трем уровням признаков: прямые или искривленные; параллельные или непараллельные; выпуклые или вогнутые. Эти качественные отличия легко определить, таким образом, изображения геонов легко различимы, также как и группы геонов.

Производные инвариантных свойств геонов.

Инвариантность точки зрения: вытекает из того, что геоны различимы по трем неслучайным качествам контуров, которые не изменяются с глубиной:

1. Прямой ли контур или искривленный.

2. Вершина, которая образуется, когда соотносятся два или три контура (т.е. концы сходятся в одной точке) в образе, т.е. в букве L (2 контура), вилке (3 контура, где все углы < 180°) или стреле (3 контура, где один угол > 180°).

3. Параллельна ли пара контуров или нет (с допущением на перспективу). Если контуры не параллельны, они могут быть прямыми (сходящимися или расходящимися) или искривленными, выпуклыми, вогнутыми или огибающими, соответственно.

Группы геонов на рисунке созданы путем варьирования формообразующей функции для обобщенного цилиндра, что приводит к инвариантным с точки зрения (=неслучайным) различиям в форме.

Рис. 3

Неслучайные качества нужно отличать от метрических качеств, таких как степень ненулевого искривления контура или его длины, которые варьируются в зависимости от глубины.