Подкрепление и затухание

⇐ ПредыдущаяСтр 48 из 138Следующая ⇒

Приверженцы теории Скиннера поставили множество экспериментов, показывающих, что поведение людей, начиная с младенческого возраста, можно регулировать с помощью подкрепляющих стимулов. Например, маленькие дети сосут активнее и чаще, если в результате сосания они получают сладкую, а не пресную жидкость (Lipsitt, 1975). Точно так же дети чаще улыбаются и издают звуки, если такое поведение несет с собой вознаграждения, например улыбки, ласки и внимание взрослых (Brackbill, 1958; Rheingold, Gewirtz, & Ross, 1959).

В таких экспериментах действуют два разных вида подкреплений. Некоторые подкрепления, такие как еда или устранение боли, называются первичными подкреплениями; они обладают «естественной» подкрепляющей силой. Другие подкрепляющие стимулы, такие как улыбки, одобрение или внимание взрослых, вероятно, являются обусловленными подкреплениями; их эффективность проистекает из чг- стого сочетания этих стимулов с первичными подкреплениями (Skinner, 1953, р. 78).

Оперантные реакции, так же как и респондентные, могут подвергаться угашению (р. 69). Например, поскольку дети часто делают многие вещи «только для того, чтобы привлечь внимание» (р. 78), нежелательные виды поведения, такие как постоянный плач, капризы или скандалы, можно «погасить», если последовательно отказываться обращать на ребенка внимание каждый раз, когда он или она начинает так себя вести (Etzel & Gewitz, 1967; Williams, 1959).

Точно так же, по всей видимости, угасшее оперантное поведение может иногда спонтанно восстанавливаться. Например, маленький мальчик, чьи вспышки раздражения удалось побороть с помощью последовательного отказа уделять внимание, может опять начать демонстрировать такие вспышки, оказавшись в новой ситуации (Williams, 1959). Тогда такое поведение следует «гасить» дальше.

Незамедлительность подкрепления. Скиннер (Skinner, 1953, р. 101; 1959, р. 133) обнаружил, что в начальной стадии эксперимента можно довести реакцию до наивысшего уровня, только если подкреплять ее немедленно. Крыса будет часто нажимать на рычаг, только если она немедленно получает пищу каждый раз, когда делает это. Как отмечают Бийо и Баэр (Bijou & Baer, 1961, p. 44), этот принцип имеет большое значение при воспитании детей. Если отец показывает свое удовольствие сразу после того, как сын принес ему газету, то очень вероятно, что мальчик сделает так же и следующим вечером. Но если отец настолько увлечен чем-то другим, что отложит одобрение поведения сына на несколько минут, подкрепление не произведет должного эффекта. Фактически, подкреплено будет то, чем занимался мальчик в момент получения вознаграждения. Если он в этот момент строил дома из кубиков, то именно строительство домов из кубиков, а не поход за газетой, получит подкрепление.

Дифференцирующие (discriminative) стимулы. Мы уже говорили о том, что оперантное обусловливание можно описать без каких-либо ссылок на первоначальные стимулы. Это, действительно, так, однако это не значит, что такие стимулы не играют совсем никакой роли. Стимулы, предшествующие реакции, также могут в значительной степени управлять ею.

Например, Скиннер (Skinner, 1953, pp. 107-108) проводил опыты с голубем, вознаграждая птицу всякий раз, когда она вытягивала Шею. В начале эксперимента Скиннер не знал никаких первоначальных стимулов, которые можно было бы использовать, он просто дал, пока голубь сам сделает это движение, а потом вознаграждал о. Затем он стал подкреплять реакцию только тогда, когда был зажжен сигнальный свет. После нескольких таких опытов голубь стал вытягивать шею намного чаще в те моменты, когда включался свет. Свет превратился в дифференцирующий стимул. Включение света могло управлять поведением, потому что оно обозначало ситуацию, в которой существовала вероятность вознаграждения.

Скиннер (р. 108-109) приводил множество примеров того, как наше повседневное поведение регулируется дифференцирующими стимулами. В саду, где красные яблоки — сладкие, а все остальные — кислые, красный цвет становится стимулом, указывающим на обстоятельства, при которых срывание и съедание яблока приведет к благоприятным последствиям. Точно так же мы выучиваемся рассматривать улыбку на лице человека как показатель того, что обращение к этому человеку может вызвать положительную реакцию. Когда человек хмурится, та же просьба может привести к неприятным последствиям, например к резкому отказу. И постольку поскольку это является правдой, выражение лица у других людей можно считать дифференцирующим стимулом, определяющим вероятность того, что мы обратимся к ним с просьбой или вопросом.

Но притом что дифференцирующие стимулы в действительности способны управлять поведением, следует подчеркнуть, что такое управление не осуществляется автоматически, как в случае рес-пондентного обусловливания. В экспериментах Павлова первичные стимулы автоматически вызывали реакцию, при оперантном обусловливании эти стимулы только лишь делают реакцию более вероятной.

Генерализация. При оперантном обусловливании, так же как и при респондентном, наблюдается генерализация стимулов (Skinner, 1953, р. 32). Предположим, маленькая девочка получает вознаграждение, когда произносит «па-па» при появлении своего отца, но не тогда, когда она говорит это, глядя на свою мать, брата или сестру. Отец становится дифференцирующим стимулом. Не стоит удивляться, однако, если девочка начнет говорить «па-па» при виде любого взрослого мужчины, даже незнакомого человека на улице. Произошла генерализация стимула. Родители должны научить ее производить более тонкую дифференциацию. Например, они могут, улыбаясь, говорить ей: «Правильно, это папа», — когда она произносит «па-па» при виде отца, но не тогда, когда она смотрит при этом на другого мужчину.

Точно так же мы можем наблюдать генерализацию реакций (response generalization). Например, установлено, что если дети получают вознаграждение за использование каких-либо частей речи, допустим, глаголов, они сами начинают использовать новые глаголы, хотя и не получали подкрепления за произнесение именно этих конкретных слов. Подкрепление усиливает не только одну определенную реакцию, но целый класс подобных реакций (Lovaas, 1977, р. 112-113).

Постепенное формирование (shaping). Оперантное поведение, как правило, не усваивается в один прием. Обычно оно выучивается постепенно, мало помалу. Даже для того, чтобы научить голубя клевать пятно на стенке, как показал Скиннер (Skinner, 1953, р. 92), требуется формировать эту реакцию постепенно. Если мы просто посадим голубя в ящик и будем ждать, пока он клюнет это пятно, нам, может быть, придется ждать несколько дней или даже недель. Большую часть времени голубь даже не приближается к «целевому» пятну. Поэтому мы должны постепенно формировать поведение, которого мы от него ждем. Сначала мы даем птице немного корма, когда она поворачивает голову в сторону пятна. В результате, такое поведение становится более вероятным и проявляется чаще. Потом мы удерживаем вознаграждение до тех пор, пока голубь не сделает легкого движения в правильном направлении. Затем мы переносим «точку подкрепления» все ближе и ближе к пятну, пока голубь, наконец, не оказывается перед самым этим пятном. В этот момент мы можем перейти к подкреплению движений^головы, вначале вознаграждая едой любое движение головы вперед. Потом мы начинаем давать еду только тогда, когда птица по-настоящему клюнет пятно. С помощью такой процедуры мы можем постепенно выстроить желательную для нас реакцию. Постепенное формирование называется также «методом приближений» (method of approximations), поскольку подкрепления связываются со все более и более точным приближением к желательной реакции.

Вероятно, многим человеческим умениям люди научаются через такой многоступенчатый процесс формирования. Когда взрослый учит мальчика играть в бейсбол, он сначала говорит «Молодец!», когда у мальчика получается правильно держать бейсбольную биту. Затем он говорит «Хорошо!», когда мальчик устанавливает свою руку с битой в правильное положение. Затем можно начать отрабатывать стойку, удар и так далее, постепенно формируя целостное поведение.

Поведенческие цепочки. Притом что поведение может быть сформировано кусочек за кусочком, оно также развивается в длинные, комплексные цепочки реакций. Например, игра в бейсбол подразумевает следующие действия: взять биту, обеспечить правильный захват и правильную стойку, размахнуться, ударить и т. д. Последователи Скинне-Ра стараются рассматривать каждый шаг в таких цепочках с точки зрения стимулов и подкреплений. Когда человек подходит к бите, он по- подкрепление тем, что берег ее, и это служит стимулом для следующего действия — попробовать правильно держать биту. Когда рука надлежащим образом лежит на бите, у человека возникает определенное «чувство», которое он понимает, как чувство правильного захвата. Это «чувство» есть подкрепление и вместе с тем оно служит сигналом к тому, чтобы выполнить следующее действие — поднять руку. Немного позже ощущение удара мяча о биту будет подкреплением взмаху битой, а также сигналом к следующему действию — попытаться направить мяч в лунку. Когда мальчик или девочка становится хорошим игроком, вся последовательность преобразуется в комплексную цепочку действий, которые выполняются гладко, как единое целое (Munn et al., 1974; p. 220-224; Reynolds, 1968, p. 53-56; Schwartz, 1989).

Резким подкреплений. Скиннер (Skinner, 1953, p. 99) заметил, что в повседневной жизни наши действия редко подкрепляются постоянно, каждый раз, когда мы их предпринимаем; вместо этого они подкрепляются периодически. Мы не всегда находим лыжню хорошей, когда идем кататься на лыжах, и не всегда получаем удовольствие, когда идем на вечеринку. Соответственно, Скиннер начал изучать воздействие различных вариантов периодических подкреплений.

Режим периодических подкреплений может быть построен на основе фиксированного интервала, когда человек или животное получает вознаграждение за правильную реакцию только через определенные периоды времени. Например, голубь получает корм после того, как клюет круг, но потом должен ждать 3 минуты, прежде чем его следующий клевок будет вознагражден, затем еще 3 минуты и так далее. Уровень реагирования при таком расписании подкреплений, как правило, бывает довольно низким. Более высокий уровень получается при режиме, основанном на фиксированном соотношении, например, когда голубь получает еду после каждого пятого клевка. Однако при обоих типах режимов наблюдается временный спад в проявлении реакции непосредственно после получения подкрепления. Как будто организм знает, что следующего подкрепления придется ждать еще долго (р. 103). Студенты часто испытывают такой эффект сразу после завершения долгой и сложной работы, — очень трудно бывает тут же взяться за новое задание.

Временного спада, вызываемого фиксированным режимом, можно избежать, если варьировать промежутки получения вознаграждений непредсказуемым способом. При режиме случайных интервалов подкрепление получается в течение некоторого среднего промежутка времени, но точный интервал выбирается случайно и заранее не известен. При режиме случайных соотношений варьируется число действий, которые нужно произвести для того, чтобы получить подкрепление. Эти два режима дают стабильно высокую частоту реагирования, в особенности режим случайных соотношений. Люди и животные реагируют постоянно, так как вознаграждение может последовать в любой момент.

Одно из важнейших открытий Скиннера состоит в том, что периодически подкрепляемое поведение, в отличие от постоянно подкрепляемого, «угасает» намного медленнее. Вот почему нам часто бывает так сложно бороться с неправильным поведением наших детей. Мы можем игнорировать хныканье или капризные требования ребенка в большинстве случаев, но если мы хотя бы иногда уступаем, ребенок будет продолжать вести себя так (Bijou & Baer, 1961, p. 62).

Если же мы хотим воспитать желательное поведение, лучше всего начать с постоянных подкреплений, это наиболее эффективный способ добиться того, чтобы поведение начало реализовываться. Однако если мы хотим, чтобы этот вариант поведения закрепился надолго, нам следует в некоторый момент перейти к периодическому режиму подкреплений (Bijou & Baer, 1961, p. 62).

Негативные подкрепления и наказания. До сих пор мы фокусировали внимание на позитивных подкреплениях. Подкрепление означает усиление реакции (повышение уровня реагирования), и позитивные подкрепления усиливают реакцию, сопровождая ее позитивными последствиями, такими как пища, одобрение или внимание. Но реакции также могут быть усилены и через негативные подкрепления, т. е. устранение неприятных, болезненных или вызывающих отвращение стимулов. В основе своей, то, что здесь подкрепляется — этореакция избегания, например, когда девочка, стоящая на трамплине для прыжков в воду, учится избегать насмешек своих приятелей, прыгая вниз и ныряя (Skinner, 1953, р. 73,173).

Когда мы наказываем, то, наоборот, стараемся не подкрепить поведение, а изжить его. Наказание, как писал Скиннер, «это-самая распространенная техника контроля над поведением, применяемая в современном мире. Схема всем известна: если мужчина ведет себя не так, как вам нравится, ударьте его кулаком, если ребенок плохо себя ведет, отшлепайте его, если люди в другой стране плохо себя ведут, сбросьте на них бомбу» (р. 182).

Однако наказание далеко не всегда работает. В ходе одного из ранних экспериментов Скиннер (Skinner, 1938) обнаружил, что, наказывая крысу за нажатие на планку-рычаг (планка отскакивает и ударяет животное по лапам), можно лишь временно подавить реакцию. Если рассматривать более длительный период, то выясняется, что применение наказания не устраняет реакцию быстрее, чем она угасает сама, не получая подкрепления. Другие исследования (напр., Estes, 1944) также привели к схожим результатам, и наш повседневный опыт говорит то же самое. Родители, которые бьют своих детей, могут на время добиться от них хорошего поведения, но затем обнаруживают, что их дети по-прежнему продолжают вести себя не так, как нравится родителям.

Скиннер возражал против применения наказаний еще по одной причине: из-за того, что наказания могут производить нежелательные побочные эффекты. Ребенок, которого ругают в школе, может очень скоро стать подавленным и склонным к конфликтам. Ребенок как будто разрывается между желанием работать и избеганием работы, оттого что боится последствий. Такие дети могут начинать работу и тут же бросать ее, становятся рассеянными или предпринимают какие-нибудь другие, столь же неуклюжие и неконструктивные попытки избежать наказания (Skinner, 1953, р. 190-191).

Некоторые исследователи полагают, что Скиннер преувеличивал значение аргументов против наказания. В каких-то случаях наказание практически полностью уничтожает нежелательную реакцию. Это в особенности верно, когда наказание исключительно болезненно. Также наказание может быть эффективным, если оно применяется немедленно, и у его объекта есть в запасе альтернативная реакция, которая приносит вознаграждение (Liebert et al., 1977, p. 138-141). Тем не менее воздействие Наказания часто бывает неожиданным и нежелательным.

Скиннер рекомендовал вместо наказания детей пробовать обеспечить естественное угасание реакции. «Если ребенок настойчиво ведет себя плохо только потому, что получает подкрепление, выводя из себя родителей, то эта манера поведения исчезнет, когда она больше не будет приносить ему таких результатов» (1953, р. 192). Последователи Скиннера часто советуют также комбинировать действия, направленные на угасание нежелательного поведения, с позитивными подкреплениями желательного поведения. В одном из экспериментов воспитатели детского сада просто игнорировали своих подопечных, когда те вели себя агрессивно, в то же время вознаграждая их одобрением и вниманием всякий раз, когда они проявляли миролюбие и желание сотрудничать. В результате в группе установилась спокойная и дружественная атмосфера (P. Brown & Elliot, 1965).

⇐ Предыдущая 43 44 45 46 474849 50 51 52 Следующая ⇒

Date: 2015-09-02; view: 459; Нарушение авторских прав

mydocx.ru - 2015-2025 year. (0.011 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию