Научение в результате оперантного обусловливания
Все реактивные формы поведения характеризуются прежде всего тем, что организм, как бы пассивно реагирует на воздействие внешней среды: или за счет особого состояния рецепторов ретикулярной формации, или за счет существования врожденных безусловных рефлексов, или за счет врожденной способности к реактивному научению. Однако организм не может быть адаптивным, если он всегда выполняет только пассивные функции, он должен создать формы научения, которые включали бы его активность. Психологи-бихевиористы назвали такие формы поведения, когда организм научается путем активного взаимодействия со средой, оперантными.
Первый из вариантов этого оперантного научения — научение методом проб и ошибок. Суть этого метода, впервые описанного американским бихевиористом Торндайком и позднее использовавшегося при конструировании некоторых видов ЭВМ, заключается в том, что индивидуум, наткнувшись на какое-то препятствие — человека или животное, совершает попытки преодолеть его. Он постепенно отказывается от неэффективных способов и в конце концов находит решение задачи. Классическим примером научения методом проб и ошибок является хождение по лабиринту. Человек двигается по лабиринту, попадает в тупик, возвращается назад и идет уже другим путем, и так, преодолевая ошибки, он, наконец, находит выход из лабиринта. При исследованиях этого вида научения часто использовался лабиринт. Иногда ставилась задача, в которой животное должно было получить пищу, выбравшись из лабиринта или из клетки, а чтобы выбраться из клетки, необходимо было еще научиться дергать за крючок или за веревочку. Перепробовав все действия, животное постепенно находило такое, которое приводило к желаемым результатам. При обучении методом проб и ошибок постепенно возникает такая ситуация, когда количество ошибок резко сокращается, приближаясь к минимуму. Можно вспомнить, как капитан Жеглов в фильме «Место встречи изменить нельзя» обучал своего юного помощника Шарапова, как нужно внимательно работать со служебной документацией: он спрягал уголовное дело, которое вел Шарапов, оставшееся по легкомыслию юного сыщика не в сейфе, как полагается, а на столе. И учитывая суровое время, Шарапов получил очень серьезный опыт научения. Некоторые родители используют этот метод в воспитании детей, когда им разрешается манипулировать с острыми, колющими и режущими предметами или с огнем. Ребенок методом проб и ошибок выясняет, какая из сторон ножа острая и, получив ранение, в дальнейшем избегает использования этой стороны ножа без специальных манипуляций; аналогично — раз дотронувшись до пламени огня, он уже больше не совершает этого действия. |
Подобные вещи практикуются при диагностике умственного развития, когда ребенку даются какие-то задачи и при этом учитывается, насколько он может использовать свой опыт для решения аналогичных задач. Он прошел один лабиринт методом проб и ошибок, ему предлагается похожий лабиринт, и если образуется навык, то он совершает меньшее количество ошибок, если не образуется, то обучение затруднено. Здесь возникает идея, что научение тесно связано с интеллектом.
Е. Торндайком был выведен закон эффекта: в случае, если какое-то действие приводит к желаемому результату, то вероятность его повторения возрастает. Если студент сумел избежать «двойки», сославшись на состояние своего здоровья, то резко возрастает вероятность того, что в дальнейшем, будучи не готовым, он опять использует этот прием. Нежелательное последствие (наказание за не выученный материал) уже имеет меньшую вероятность. Бели плачущий ребенок получил конфету, то в будущем вероятность получения сладкого с помощью слез и плача резко возрастает.
Дальнейшее развитие бихевиориальных теорий получило развитие в работах Б. Скиннера, который вывел законы оперантного обусловливания и формирования реакций путем последовательного приближения. Это хорошо видно при описании следующего эксперимента на животных. В клетку помещалась птица. В правой стороне клетки находился светящийся яркий кружок, при нажатии на который клювом, выскакивало зернышко. Научение по методу Б. Скиннера происходило следующим образом, если птица передвигалась в правую половину клетки, то получала вознаграждение — зернышко, если она заходила в левую часть — то не получала. Дополнительное вознаграждение в правой половине клетки она получала, если поворачивала голову в сторону светящегося кружка. Дальнейший этап — вознаграждение давалось в правой половине клетки при повороте головы к кружку и с направлением клюва в сторону кружка. Следующий этап — получение вознаграждения при дотрагивании клювом до кружка. И, наконец, вознаграждение — за удар по кружку. Вся программа была разбита на этапы. На основе результатов этих работ Б. Скиннера возникла предложенная им целая система обучения, в которой наказание, как таковое, отсутствовало и имелась только форма поощрения.
По мнению Б. Скиннера процесс научения языку проходит так:
ребенок произносит какие-то слоги, отдаленно напоминающие слово «мама», и получает выраженную реакцию восторга родителей, если он продолжает повторять это сочетание слогов — восторги становятся меньшими. Впоследствии ребенок может произнести другое слово, — и тогда он вновь получит социальное вознаграждение.
Подкрепление научения всегда обращено к потребностям человека, и чем точнее известны потребности человека, тем легче найти форму подкрепления. У животных — это, как правило, апелляция к потребностям физиологического уровня: еде, питью, избеганию боли. У человека — намного сложнее. Причем, чем дальше идет процесс социализации ребенка, тем к более иерархически высоким зонам потребности обращаются люди. На первых этапах воспитания прибегают к использованию физиологических потребностей (сладости, еда), затем вдет апелляция ко второму уровню — стремлению к потребности в безопасности, здесь часто используется так называемое отрицательное подкрепление, то есть, когда в результате какой-то формы поведения не следует наказания. У родителей существует целая процедура выработки такого отрицательного подкрепления, когда ребенку говорят «Бели ты скажешь правду, то не последует никакого наказания. Пусть даже это ты разбил мою любимую вазу — с каждым из нас это может случиться, но мне важнее, чтобы ты говорил правду». Это отрицательное подкрепление направлено на формирование более высоких потребностей этического характера. Не следует смешивать отрицательное подкрепление с наказанием, ибо отрицательное подкрепление — это предотвращение наказания.
Бихевиористы делили подкрепления на первичные и вторичные. Первичные — это те, которые основываются на первом уровне потребностей (физиологических), а вторичные — те, которые обращены к более высоким уровням человеческих потребностей, например, в признании, в любви, в причастности к какой-то группе.
Следующая форма оперантного обучения поведению — это подражание, при этом существует несколько вариантов подражания.
Когда организм живого существа (человека или животного) воспроизводит поведение кого или чего-либо, не оценивая последствий — это обычное подражание. Карл Струа описывает наблюдения японских исследователей за поведением обезьян. Исследователи разбили свою стоянку около того места, где жило стадо обезьян. Перед едой исследователи мыли в реке бататы (сладкий картофель). Вскоре нечто подобное стали делать молодые самцы обезьян. Подобные действия для них не являлись необходимыми, это не было направлено на защиту организма или стада, потому что обезьяна вполне может питаться продуктами без их предварительной очистки и мытья. Затем все большее и большее количество обезьян стало совершать подобные действия, только несколько старых животных не обрели этой формы поведения. С одной стороны, эти факты говорят о том, что существуют такие формы поведения, которые формируются путем подражания, причем слепого подражания, с другой стороны, далеко не все особи в одинаковой мере способны к этому способу научения. Как правило, такой способ научения характерен для молодых. Так маленький ребенок часто берет в рот карандаш, воспроизводя процесс курения, подражая старшему. При этом никаких последствий этого поступка он не оценивает. Здесь работает механизм интроекции — он тем самым присоединяет себя к миру взрослых. Очень часто дети подвержены этой форме подражания. Возвращаясь к эксперименту японцев, можно задать вопрос: почему старые обезьяны не поддавались этому процессу? Во-первых, потому что с возрастом способность к научению снижается. В русском языке расхожим является выражение: «мне уже поздно этому учиться», подтверждающее это правило. Во-вторых, старые животные нередко у обезьян являются доминирующими в стаде, как бы вождями этого стада. И, вероятно, вождю обезьяньего стада не пристало учиться у своих подчиненных. Некое подобие наблюдается и в человеческой цивилизации.
Викарное подражание или викарное научение, подражание модели, при частичном понимании последствий своих действий для себя. Это характерно для молодежи, которая во многом строит свое поведение, подражая своим кумирам, в том числе и в формах асоциального поведения. Частичное понимание последствий поведения может иметь место и при оперантном научении.
Наиболее серьезным исследователем викарного поведения был американский ученый, последователь И.П. Павлова, Альберт Бандура, который многочисленными экспериментами по изучению животных в лабиринте показал, что характер этого научения зависит от уровня эмоциональной активации субъекта, который влияет на оценку ситуации. Когда человек считает, что лучше прожить 3—5 лет «яркой, необыкновенной жизнью», принимая наркотики, чем долгую жизнь «бесцветной, стабильной, трезвой», он исходит не из мыслительной оценки ситуации, а из эмоционального решения, которое включало не столько когнитивную оценку, сколько чувственную: «сейчас мне приятно получать эти ощущения, они мне нравятся и я ставлю их ценность выше всего остального». Здесь очень невысок уровень когнитивной оценки, не учитывается тот факт, что через три года в результате приема наркотиков человек будет испытывать другие ощущения, они уже не будут давать того радостного мира, а просто будут избавлять от ужасов и тягот абстиненции. Недаром некоторые наркоманы говорят, что если бы они знали, когда начинали прием наркотиков, к чему это приведет, то никогда бы этого не позволили себе. Эмоциональная оценка ситуации заслоняет когнитивный путь обработки информации.
Следует думать, что наиболее легко научение путем подражания происходит, когда усваиваются регрессионные или асоциальные нормы, поэтому не случайно в приведенном примере фигурировали наркотики. Это объясняется тем, что викарное научение обращено к чувствам, и именно регрессионные формы поведения больше соответствуют инфантильному периоду человека и человечества, в котором эмоции преобладают над разумом. Родителям не стоит удивляться, что их дети трудно усваивают сложные навыки или сложные социальные формы поведения, но легко усваивают «уличные», регрессионные формы поведения. Научение этим формам поведения в таком возрасте сильно упрощено. Кроме того, если идет апелляция к эмоционально-ситуативным формам научения, то мораль, которая придает социальность поступку, уже не входит в разряд ситуативно-регуляторных механизмов (мораль — это построение гораздо более высокого уровня), поэтому обучение асоциальным и ненормативным формам поведения легче, чем обучение более высоким формам поведения.