Содержание: личность в зеркалах теорий

Вид материала

Подобный материал:

1 ... 46 47 48 49 50 51 52 53 ... 65

зом, что ключевой раздражитель побуждает реакцию... Научение происхо-

дит в соответствии с определенными психологическими принципами. Не

всегда все дело в практике. Связь между ключевыми раздражителем и реак-

цией может быть усилена только в определенных условиях. Научающийся

Теория подкрепления Долларда и Миллера 549

должен быть побужден к совершению реакции и получить награду за от-

вет в присутствии ключевого стимула. Проще можно сказать, что для того,

чтобы чему-то научиться, человек должен чего-то желать, что-то замечать,

что-то делать и что-то получать. В более точной формулировке, эти факто-

ры - драйв, ключевой раздражитель, реакция и награда. Эти элементы

процесса научения были тщательно изучены, и выявились дальнейшие

сложности. Теория научения стала твердым сплавом принципов, полез-

ных для описания человеческого поведения> (1941, ее. 1-2).

Принципы научения, примененные Доллардом и Миллером к повсед-

невной жизни, были открыты в контролируемом лабораторном исследо-

вании и, как правило, на материале животных. Знание этих лаборатор-

ных принципов, как и определенные относящиеся к ним теоретические

представления, принципиальны для понимания их теории личности.

Описание гипотетического эксперимента, построенного по образцу нова-

торских экспериментов Миллера и его коллег (Miller, 1948; Brown &

Jacobs, 1949) и теоретический анализ его результатов послужит введе-

нием в этот необходимый фон.

Иллюстративный эксперимент

В этом эксперименте каждый объект (вездесущая лабораторная крыса) по-

мещается в прямоугольный ящик с сетчатым полом. Ящик разделен на два

квадратных отделения низким барьером, через который крыса легко мо-

жет перепрыгнуть. Раздается гудок зуммера, и одновременно через сетча-

тый пол пропускается пульсирующий электрический разряд. Контрольные

объекты получали электрический удар. От животного можно ожидать, что

у него возникнут различные сильные реакции в ответ на удар и что оно в

конце Концов переберется через перегородку в соседнее отделение. Аппа-

рат устроен так, что, как только животное перебирается через перегородку,

отделяющую один отсек от другого, звук зуммера и удары током прекра-

щаются. В последующие шестьдесят минут эта процедура повторяется с

неравными интервалами, и можно наблюдать, что время между началом

звука и удара тока и реакцией перепрыгивания через загородку становится

все меньше. На следующий день каждый объект вновь помещался в ящик

на час. Во время этой сессии периодически раздавался звук зуммера и

звучал до тех пор, пока животное не переходило на другую сторону, но он

ни в одном случае не сопровождался электрическим ударом. Несмотря на

отсутствие удара, объекты продолжали перепрыгивает через загородку при

появлении звука и даже могли улучшать показатели.

550 Стимул-реактивная теория

После нескольких таких сессий в прибор вводились новые измене-

ния. Перепрыгивание больше не приводило к прекращению звука. Од-

нако, если крыса опускала рычаг, прикрепленный к основанию пере-

городки, звук отключался. Животные вновь проявляли сильную ак-

тивность по большей части ограниченную прыжками <туда-сюда> через

перегородку. В ходе движений крыса могла опустить рычаг. Постепен-

но прыжки через загородку исчезают, время между подачей звука и

нажатием на рычаг уменьшается и в конце конов нажатие осуществля-

ется сразу вслед за подачей звука. Поведение таких объектов ярко кон-

трастирует с поведением контрольных животных, не получавших уда-

ра током, у которых не возникает никаких систематических измене-

ний поведения ни в одной из экспериментальных сессий. Очевидно, в

результате объединения в пару звука и удара током эксперименталь-

ные объекты научаются или усваивают новые реакции, тогда как кон-

трольные - нет.

В реальности имело место несколько типов научения. Первое -

классическое обусловливание, форма научения, открытая Павловым.

Классическое обусловливание представляет процедуру, в которой из-

начально нейтральный стимул (условный стимул или УС) сочетается

с безусловным стимулом (БС), который побуждает типичный пове-

денческий паттерн, или безусловную реакцию (БР). После повторения

сочетаний УС - БС, УС, представленный как таковой или в антиципа-

ции БС, вызывает характерную реакцию, известную как условная

реакция (УР). В типичном случае УР сходна с БР, хотя редко иден-

тична.

Теория подкрепления Долларда и Миллера 551

Линия классического обусловливания, появившегося в нашем иллюс-

тративном эксперименте в соответствии с теорией Миллера, показана на

рис. 13-1. Однако, рассмотрим сначала последствия удара током как та-

ковые. Между наблюдаемым БС (удар) и открытым поведением (R\emot)

имеет место цепь внутренних событий. Удар побуждает ряд внутренних

реакций, связанных с болью (обозначенных здесь как r\emot). Эти r\emot в

свою очередь дают подъем внутреннему стимульному паттерну. Поми-

мо того, что эти внутренние стимулы обладают той же способностью, что

и внешние источники, в <запускании> последующих реакций, о них

еще говорят, что они имеют свойство побудителей, драйвов (D) и, соот-

ветственно, определяются как стимул-драйвы или s\D

Драйв - мотивационный концепт в системе Халла, он побуждает или

активирует поведение, но не определяет его направления. В данном слу-

чае драйв врожден и первичен, основан на боли. Конечно, есть ряд пер-

вичных драйвов, помимо воли, такие, как голод, жажда, секс. Послед-

ние, в отличие от боли, представляют состояния депривации, возникаю-

щие из-за недостаточности определенной стимуляции, например, пищи,

и редуцируемые обеспечение соответствующей стимуляции организма, а

не снятием вредной стимуляции. Миллер постулирует, что любая внеш-

няя или внутренняя стимуляция, будучи достаточно интенсивной, про-

буждает драйв и побуждает действие. Как предполагается в этом поло-

жении, драйвы различаются по силе, и чем сильнее драйв, тем более

энергично и устойчиво энергизируемое им поведение. Например, в на-

шем эксперименте, сила наблюдаемого эмоционального поведения в от-

вет на БС и, позже, усвоенной реакции перепрыгивания через перего-

родку, определяется силой удара током.

Первоначально звук зуммера не вызывает никакого эмоционального

поведения, ассоциируемого с ударом тока. Но после повторных пред-

ъявлений звука и удара, звук обретает способность вызывать внутренние

r\emot, схожие с тем, что изначально вызывались болевым БС; условная

реакция (УР) усваивается. В системе Халла, используемой Доллардом

и Миллером, имеющее место научение описывается как ассоциативная

связь между условным стимулом (звук) и реакцией (r\emot), что представ-

лено теоретическим концептом <навык>. Как мы обсудим подробнее

позже, Халл постулировал, что для того, чтобы навык сформировался,

нужно не только, чтобы стимул и реакция были близки во времени и

пространстве, но и то, чтобы реакция сопровождалась подкреплением

или наградой. Если мы допускаем последнее условие, сила S-R навыка

552 Стимул-реактивная теория

возрастает с числом случаев, в которых стимул и реакция возникали

вместе.

Повторяющееся предъявление звука и удара в первой сессии нашего

эксперимента с избавлением объектов от удара в качестве подкрепления

достаточно для возникновения довольно сильного навыка. Когда сфор-

мировались классически обусловленные r\emot, предъявление одного зву-

ка не только побуждает r\emot, но также приводит в действие остальную

цепочку событий, изначально связанную с применением удара. Таким

образом, отличительный паттерн внутренней стимуляции s\D и в комби-

нации со звуком будет действовать как ключ к включению внешнего

поведения, сходного с тем, что до того пробуждался ударом тока. Далее,

эти наблюдаемые реакции энергизируются или активируются побуди-

тельными (драйвовыми) свойствами s\D. Поскольку драйв вызывается

усвоенной реакцией на прежде нейтральные стимулы, он идентифици-

руется как приобретенный или вторичный драйв, в отличие от первич-

ного драйва, пробуждаемого реакцией на болевую стимуляцию.

Чтобы отличить последовательность r\emots\D вызванную ударом тока

и классически обусловленную последовательность, вызванную звуком,

последняя получила название тревоги или страха. Таким образом,

страх - это и усвоенная реакция - обусловленная форма болевой реак-

ции, если использовать слова Маурера,- и усвоенный или вторичный

драйв.

Но, как мы уже сказали, экспериментальные объекты усваивали боль-

ше, чем эти реакции страха. Во время первой сессии они быстро научи-

лись перепрыгивать через перегородку сразу по появлении звука и удара,

даже несмотря на то, что первоначально стимуляция вызывала множест-

во разнообразных энергичных реакций, из-за которых перепрыгивание

через перегородку была не самой заметной. Ключ к пониманию того, по-

чему именно эта реакция стала доминирующей,- в ее следствиях: лишь

перепрыгивание через перегородку прекращало ситуацию шока и цепь

побужденных внутренних событий. Хотя тому и есть исключения, собы-

тия, "редуцирующие или устраняющие стимульные драйвы в типичном

случае усиливают или увеличивают вероятность появления любых реак-

ций, которые они регулярно сопровождают и называются подкрепления-

ми. Напротив, реакции, которые не сопровождаются событиями, редуци-

рующими стимульный драйв, имеют тенденцию не повторяться. Поскольку

подкреплением - прекращением удара - сопровождалось лишь перепры-

гивание, эта реакция, в отличие от других, усиливалась.

Теория подкрепления Долларда и Миллера 553

Развитие способности сочетания звук-удар устанавливать реакцию

перепрыгивания - пример научения, в котором, в отличие от класси-

ческого обусловливания, появление подкрепления зависит от реакции;

реакция продуцирует подкрепляющее событие. Тип научения, имеюще-

го место в таких условиях, называется инструментальным или, как

назвал бы его Скиннер, оперантным обусловливанием. Во время первой

сессии в нашем эксперименте сформировались два типа реакций: клас-

сически обусловленная реакция страха и инструментальная реакция

перепрыгивания через перегородку, формируемая благодаря прекраще-

нию действия БС (таким образом, через редукцию драйва происходило

подкрепление обеих реакций).

После первой сессии удар током прекращался и использовался только

звук. Поскольку ток не подавался, больше не возникало его прекраще-

ние. Процедура, в которой для установления реакции используется изъ-

ятие подкрепляющего воздействия, называется экспериментальное уга-

шение и в типичном варианте производит редукцию в силе сформиро-

ванной реакции. Например, голодные крысы, которые научились

осуществлять определенный инструментальный акт для того, чтобы по-

лучить пищу, прекращают совершение реакции после того, как прекра-

щают получать еду. Но прекращение подачи тока в нашем случае не

привело к прекращению реакции перепрыгивания через перегородку (или

теоретически, r\emot); У многих реакция даже продолжала возрастать по

силе, что определяется уменьшением времени реакции на последова-

тельные предъявления звука. Миллер полагает, что это <угасание> не

приводит - или приводит в очень малой степени - к ослаблению усво-

енных реакций, поскольку в действительности подкрепление продолжа-

ется. УС вызывает не боль, а усвоенную реакцию страха, что активиру-

ет инструментальный навык, стоящий за перепрыгиванием через пере-

городку. Появление инструментальной реакции отключает звук, и

драйв-стимулы, ассоциируемые со страхом, таким образом редуцируют-

ся по интенсивности. Таким образом, как классически обусловленная

реакция страха, так и инструментальная реакция перепрыгивания че-

рез перегородку продолжают подкрепляться.

Однако экспериментальное угасание реакции перепрыгивания через

перегородку происходило, когда она становилась неэффективной в пла-

не прекращения звука и вызванного им страха. Побуждаемые страхом

животные вместо этого усваивали эффективную реакцию нажатия на

рычаг. Таким образом, животные продолжали осуществлять реакцию,

554 Стимул-реактивная теория

которая в прошлом позволяла им избежать боли, лишь столько, сколько

это позволяло редуцировать страх. При изменении условий они науча-

лись новой инструментальной реакции, мотивированной усвоенным драй-

вом страха и подкрепленной редукцией страха.

Проведенные в реальности эксперименты того же плана показали,

что инструментальные реакции, позволяющие избежать побуждающих

тревогу УС, могут медленно ослабляться при последовательном предъ-

явлении последних. Но если в начальный период обучения предъявля-

лось значительное число УС-БС или вредный БС был силен, инструмен-

тальная реакция может сохраняться без видимых изменений по силе на

протяжении сотен предъявлений УС (Miller, 1948). Доллард и Миллер

указали на аналогию между экспериментальными животными, у кото-

рых сохраняется страх в отношении безвредных событий, таких, как

звук зуммера, и человека с иррациональными невротическими страха-

ми и тревогой. Если наблюдатель видел начальный процесс научения, в

страхе животных перед звуком зуммера и стремлением бежать нет ниче-

го мистического; если наблюдатель видел процесс научения, предшес-

твовавший невротическому симптому, в поведении человека не оказыва-

ется ничего удивительного или бессмысленного. Поведение выглядит

странным лишь тогда, когда наблюдатель вступает в действие после того,

как страх сформирован.

Другой принцип научения, важный для теории Долларда и Миллера,

можно проиллюстрировать варьированием процедуры нашего гипотети-

ческого эксперимента. После первой сессии, когда в паре появлялись

звук и удар током, осуществляется вторая сессия, когда предъявляется

только звук. Но теперь звуковые сигналы различаются по интенсивнос-

ти, иногда она такая же, как во время первой сессии, иногда - громче

или тише, чем во время обучения. При включении звука животные пе-

репрыгивают через перегородку, если он по интенсивности совпадает с

тем, что вначале сопровождал удар током. Но они реагируют и на дру-

гие звуки, и сила реакции прямо пропорциональна степени соответст-

вия интенсивности этих звуков интенсивности звука, используемого в

первой сессии. Такое поведение иллюстрирует градиент стимульной

генерализации: когда стимул обретает способность вызывать реакцию

благодаря сочетанию с безусловным стимулом, другие стимулы автома-

тически обретут некоторый уровень этой способности, в зависимости от

их сходства с исходным стимулом. Связанный с этим феномен, кото-

рый труднее продемонстрировать конкретно,- генерализация реакции:

Теория подкрепления Долларда и Миллера 555

стимул обретает способность вызывать не только реакцию, которая ти-

пично следует за ним, но также и ряд сходных реакций.

Было выдвинуто положение, что без способности к стимульной гене-

рализации и генерализации реакций научение не будет происходить

или будет происходить в незначительной степени. Хотя для удобства

часто говорят о повторении <того же> стимула, вызывающего <ту же>

реакцию, мы редко встречаемся вообще - в двух или более случаях с

точно той же стимульной ситуацией, и реакции никогда полностью не

идентичны. Даже в тщательно контролируемых экспериментах кор-

ректнее говорить о предъявлении ряда стимулов, которые вызывают

ряд реакций.

Однако было показано, что градиенты генерализации простираются

далеко за пределы ограничений вариации стимулов и реакций, возника-

ющих в ситуации обучения, и сила тенденции генерализации соотносит-

ся не только со степенью сходства с оригинальной ситуацией научения,

но и с такими факторами, как количественные характеристики исход-

ного научения и интенсивности драйва, лежащего за реакцией. Однако

градиент генерализации может сужаться посредством дифференцирован-

ного подкрепления. Возвращаясь к нашему эксперименту,- удар жи-

вотного током при появлении звука первоначальной интенсивности и

отсутствие удара при другой интенсивности постепенно приведет к тому,

что перепрыгивание будет следовать только в ответ на тот стимул, кото-

рый предъявляется при обучении. Процедура привела к стимульной

дифференциации.

Как ясно на основе этого обсуждения, судьба стимул-реактивной свя-

зи во многом зависит от последствий реакций - стимульных событий,

близко следующих за реакцией. Некоторые последствия приводят к уси-

лению связи, то есть повышении вероятности того, что при последую-

щем предъявлении стимула реакция будет более быстрой и энергичной.

Эти события рассматриваются как позитивные подкрепления или награ-

ды. Мы видели также, что прекращение событий другого типа, часто

вредных по своей природе, также может подкреплять реакции. Доллард

и Миллер искали общий принцип, который позволил бы определить,

следует ли тот или иной данный стимул рассматривать как подкрепле-

ние. Вслед за Халлом (1943) они выдвинули гипотезу редукции драйва,

согласно которой событие, приводящее к внезапной редукции драйва-

стимула, действует как награда или подкрепление любой реакции, кото-

рую сопровождает. В том, что Миллер (1959) описывает как сильную ее

556

форму, гипотеза редукции драйва утверждает далее, что редукция драйв-

стимула не просто достаточное условие для подкрепления, но необхо-

димое условие.

Сильная версия гипотезы редукции драйва, используемая Доллардом

и Миллером, предполагает, что формирование S-R ассоциации или на-

выка будет происходить только в случае подкрепления реакции. Гипоте-

за о том, что подкрепление необходимо для научения, породило сущес-

твенные возражения. Некоторые теоретики, например, Гатри (1959),

настаивали на том, что достаточно просто смежности стимула и реак-

ции; другие формулировали теории двух факторов, где предполагается,

что определенные виды научения требуют подкрепления дополнительно

к смежности, а другие - нет (см., например, Mowrer, 1947; Spence, 1956,

Tolman, 1949).

Критика была направлена и на допущение о том, что редукция драйв-

стимула производит эффект подкрепления. Сам Миллер указывал в не-

которых случаях (см., например, 1959), что, хотя он находит гипотезу

редукции драйва более привлекательной, чем любая конкурирующая,

он не убежден в ее полной корректности. Позже он в порядке пробы

предложил то, что считает возможной альтернативой гипотезе редукции

драйва (Miller, 1963). Возможно, полагает он, в мозгу есть один или

более <запускающих> или <активирующих> механизма, которые приво-

дятся в действие событиями, завершающимися с редукцией драйв-сти-

мулов. Эти <запускающие> механизмы служат интенсификации или

энергизации реакций, вызванных ключевыми стимулами, а эти энер-

гичные реакции усваиваются на основе простой смежности. Актива-

ция <запускающего> механизма сама является реакцией и, подобно

другим реакциям, может быть обусловлена смежностью. Так, прежде

нейтральный стимул может обрести способность включать <запуск>

механизма благодаря предшествовавшему появлению вместе с актива-

цией механизма.

Доминирующая тенденция среди теоретиков научения в настоящее

время - принять позицию смежности или вообще обойти этот вопрос.

К счастью, Доллард и Миллер высказали положение о том, что глав-

ные аргументы в их S-R анализе личности не находятся под влиянием