Книга Н. Смита рекомендована слушателям и преподавателям факультетов психологии и философии вузов по курсам общей психологии и истории психологии, системных методов ис­следования и преподавания психологии

Вид материалаКнига

Содержание


Основные положения
Раннее развитие и некоторые
Подобный материал:
1   ...   22   23   24   25   26   27   28   29   ...   50
Глава 6. Анализ поведения: от оперантного обусловливания к поведенческой терапии...

ВВЕДЕНИЕ

Если вы выбираете ключ и он открывает замок, вы, вероятно, и в дальнейшем будете выбирать этот ключ для того же замка. Если кто-то говорит вам, как хорошо вы выглядите в вашем новом свитере, вы, вероятно, чаще будете надевать этот свитер в буду­щем. Это примеры принципа подкрепления, играю­щего фундаментальную роль в анализе поведения. Термин «подкрепление» означает нечто, усиливаю­щее поведение или способствующее более вероятно­му его повторению. Термин «анализ поведения» про­тивостоит термину «психоанализ». Согласно точке зрения сторонников данного подхода, анализу под­вергается не психика (psyche), а поведение, да и сам анализ базируется на экспериментальном методе, а не на изучении истории пациентов. Поэтому иногда используется термин «экспериментальный анализ поведения».

^ ОСНОВНЫЕ ПОЛОЖЕНИЯ

Большинство студентов, изучающих психологию, знакомятся с четырьмя основными режимами под­крепления, обычно на примере крыс, нажимающих на рычаг, или голубей, клюющих диск. Эти «опера­ции» («operations»), которые выполняют животные, послужили основанием для названия «оперантное обусловливание» («operant conditioning»). Оперант­ное обусловливание отличается от классического (респондентного) обусловливания тем, что животное должно выполнить определенное действие (опера­цию), чтобы получить подкрепление, причем это дей­ствие предшествует подкреплению. При классичес­ком обусловливании, как в случае с собаками Пав­лова, у которых выделяется слюна в ответ на звук колокольчика, так как они ожидают, что за этим по­следует кормление, животные остаются пассивными. Они не делают ничего для того, чтобы «заработать» подкрепление в виде мяса, и выделение слюны насту­пает после звонка колокольчика. (Различие между оперантным и классическим обусловливанием ино­гда не является очевидным [Мооге, 1973; Rachlin, 1991а], и ряд последних исследований в области ана­лиза поведения посвящен выяснению взаимосвязей между обоими видами обусловливания.)

Каждый из четырех режимов подкрепления вызы­вает определенные, соответствующие ему паттерны поведения (Ferster & Skinner, 1957). Эти четыре ре­жима носят названия: (а) режим с фиксированной пропорцией, (б) режим с фиксированным интерва­лом, (в) режим с изменяющейся пропорцией и (г) режим с изменяющимся интервалом.

При режиме подкрепления с фиксированной про­порцией животное получает порцию пищи после каж-

дого фиксированного количества реакций. Если оно получает пищу после каждой реакции, данная разно­видность этого режима называется «постоянным подкреплением». Если постоянное подкрепление прекращается, животное скоро перестает реагиро­вать — происходит угашение реакции. Если пропор­ция отличается от значения, равного один к одному, и составляет, например, один к двадцати, темп реа­гирования между подкреплениями очень велик и за­тухание после прекращения подкрепления наступа­ет значительно медленнее. Таким образом, при силь­ном подкреплении реакции угашаются быстрее, чем при слабом подкреплении. Данный феномен получил название парадокса Хамфри в честь Ллойда Дж. Хам­фри (Lloyd G. Humphrey), впервые эксперименталь­но продемонстрировавшего его (Rachlin, 1991a).

При режиме подкрепления с фиксированным ин­тервалом животное получает подкрепление сразу после первой реакции, а затем через определенные периоды времени. Например, если интервал состав­ляет две минуты, голубь получает пищу через две минуты после того, как в первый раз клюнет диск. После того как голубь научится приблизительно оп­ределять временной интервал, он начинает клевать медленно почти до момента следующего подкрепле­ния, а затем начинает клевать очень быстро. Анало­гично многие студенты уделяют мало времени учебе почти до самого наступления экзаменов. Затем — за день или два, а то и в последнюю ночь перед экзаме­ном они начинают усиленно заниматься, заканчивая готовиться к экзамену глубоко за полночь. После сдачи экзамена они снова возвращаются к паттерну обучения кое-как до следующего экзамена. В этом отношении студенты, пожалуй, мало чем отличают­ся от голубей. Но как мы оценим поведение тех, чей график занятий отличается большей равномернос­тью и регулярностью? С точки зрения специалиста по анализу поведения, это означает, что такой режим работы также должен иметь подкрепление — воз­можно, в виде похвалы со стороны родителей; или же он подкрепляется успехами в учебе, являющимися следствием более рационального и эффективного метода обучения. Следовательно, эти студенты реа­гируют не только на фиксированный интервал.

Если подкрепление соответствует режиму с изме­няющейся пропорцией или с изменяющимся интер­валом, оно называется нерегулярным или «преры­вистым» («intermittent») подкреплением. При та­ком режиме животное сохраняет относительно равномерный темп реагирования, а угашение реак­ции после прекращения подкрепления происходит наиболее медленно по сравнению с остальными ре­жимами. Голубь, например, может продолжать кле­вать в течение часа или более после последнего под­крепления, и даже в этом случае — если на следую­щий день он окажется в той же ситуации — он снова начнет клевать с большой частотой. Вследствие не­регулярного характера подкрепления животному трудно определить, что подкрепление было прекра-

168

щено, поэтому реакция угашается медленно. Други­ми словами, сам по себе режим подкрепления в зна­чительной степени напоминает условия угашения реакции, поэтому животному трудно определить различие между условиями угашения и условиями подкрепления.

Классическим примером режима подкрепления с изменяющейся пропорцией являются азартные игры. Игрок никогда не знает, сколько раз он должен бро­сить кости или нажать на рычаг игрального автома­та, чтобы выиграть, и этот случайный выигрыш, как правило, меньший по размерам, чем сумма, затрачи­ваемая на игру, стимулирует продолжение игры. Множество форм человеческой деятельности выпол­няется под влиянием прерывистого подкрепления. Возможно, писателю удается найти издателя лишь для незначительной части своих произведений, одна­ко он продолжает работать, благодаря пусть и нере­гулярному заработку. Нумизмат перебирает тысячи монет и продолжает свои поиски, получая редкие подкрепления в тех случаях, когда ему удается най­ти монету, подходящую для его коллекции. Спорт­смен продолжает тренироваться благодаря наблюде­нию признаков своего прогресса и периодическим победам на соревнованиях. Истерики ребенка под­крепляются, когда родители уступают, а переменная частота подкреплений препятствует затуханию исте­рических реакций. Аналогично собака, выпрашива­ющая пищу с обеденного стола и в конце концов по­лучающая кусок, начинает просить подачку при лю­бой возможности.

В течение многих лет специалисты по анализу по­ведения исследовали различные режимы подкрепле­ния. Ни один из паттернов реакций, описанных ниже, не может быть вызван посредством применения на­казаний. Только благодаря положительному под­креплению удается сформировать устойчивые пат­терны реакций. Несмотря на это, большинство попы­ток использования обществом правовых систем в целях социального регулирования основаны на ис­пользовании наказаний, таких как штрафы и тюрем­ное заключение. Последствия применения наказаний весьма неоднозначны, однако в целом они отличают­ся значительно меньшей стабильностью в подавле­нии тех поведенческих реакций, формированию ко­торых способствуют положительные формы под­крепления. Например, уровень рецидивизма среди заключенных свидетельствует о том, что тюремное заключение малоэффективно с точки зрения искоре­нения преступности. Применение наказаний имеет и нежелательные последствия: наказания являются формой агрессии, которая вызывает ответную агрес­сию; они порождают страх и отвращение к видам де­ятельности, связанным с наказаниями; при этом лю­дям не предлагается никаких конструктивных аль­тернатив, показывающих, как им следует поступать.

Большинство профессиональных психологичес­ких организаций, таких как Американская психоло-

гическая ассоциация, требуют от своих членов еже­месячной уплаты взносов до определенного числа с целью избежать задержек платежей. Иными слова­ми, эти организации подчеркивают потенциальное наказание, ожидающее членов, не уплативших взно­сы вовремя. Однако в Ассоциации анализа поведе­ния (Association of Behavior Analysis) заведен дру­гой порядок: если член платит ранее определенного срока, размеры платы снижаются. Как кто-то сарка­стически заметил, анализ поведения сам по себе представляет пример положительного подкрепле­ния.

Результаты исследований, проводимых на живот­ных, показывают, что простая S —» R-модель класси­ческого бихевиоризма не объясняет феномена опе­рантного обусловливания, поскольку последствия экспериментальных действий являются частью само­го поведения, и потому должны быть включены в модель. Решение этой проблемы символически изоб­ражается в виде трехчленной ассоциации (three-term contingency):







(Эта структурная модель также известна в более общей форме как предшествующий стимул, поведе­ние и последствия.) Голубь различает звук колоколь­чика (SDistrim), клюет диск и получает подкрепление в виде пищи (SReinf). Все, что символизирует положи­тельную связь между подкреплением и реакцией, яв­ляется сигнальным (дифференцировочным) стиму­лом. Например, каждая кнопка с цифрой в автома­тическом лифте является сигнальным стимулом для соответствующего этажа (SRcinf). Если мы нажимаем на кнопку с цифрой 4 (Ro er), лифт доставит нас на четвертый этаж и мы получаем подкрепление, за­ставляющее нас нажимать на кнопку с цифрой 4 в следующий раз (если нам нужен тот же этаж). Од­нако если нам нужно попасть на первый этаж и мы нажимаем на кнопку с цифрой 1, а лифт доставляет нас в подвал, в следующий раз мы, вероятно, не бу­дем повторять ту же реакцию, а вместо этого попро­буем нажать на кнопку с цифрой 2. Если цифра 2 обеспечит нам подкрепление, мы, вероятно, повто­рим эту реакцию в будущем. Мы постоянно сталки­ваемся с сигнальными (дифференцировочными) сти­мулами, связанными с подкреплениями: заглавие книги на полке, указывающее на то, что это та самая книга, которую мы ищем, сигналы светофора, конт-

169

ролирующее наше поведение на перекрестке, стрел­ки часов, напоминающие нам, что пора отправлять­ся на встречу, пятно на костюме, говорящее нам, что костюм пора отдать в чистку, и тысячи других про­явлений, многие из которых, как отметил Скиннер (Skinner, 1953, р. 75), не всегда ясно осознаются нами.

Лишь немногие виды человеческой деятельности поддерживаются благодаря таким первичным под-крепителям (primary reinforcers), как пища, однако вторичные подкрепители (secondary reinforcers) иг­рают важную роль в нашей жизни. Вторичный под-крепитель — это стимул, появляющийся до первич­ного подкрепителя и первоначально не имеющий подкрепляющей силы, однако приобретающий ее после достаточного количества сочетаний с первич­ным подкрепителем. Мощным вторичным подкрепи-телем в нашей культуре являются деньги (фактичес­ки они являются «всеобщим вторичным подкрепите­лем», поскольку служат для подкрепления множества форм поведения). Монеты и банкноты сами по себе практически бесполезны, однако их можно обменять на пищу, жилье и все, что представ­ляет для человека ценность. Соответственно, люди работают, пускаются в махинации, воруют, занима­ются предпринимательством, играют в азартные игры, — и все ради этого вторичного подкрепителя. Иногда формируются целые цепочки вторичных подкрепителей. Человек может выполнять какую-либо работу за (а) обещание получить (б) чек, кото­рый можно обменять на (с) деньги, на которые мож­но купить продукт, который, в свою очередь, можно будет продать и получить прибыль в форме (г) дру­гого чека, который можно обменять на (д) деньги, на которые можно купить продукт потребления или услугу.

Анализ поведения более тесно связан со своей ме­тодологией, чем любая другая система, за исключе­нием эко-бихевиоральной науки (см. главу 7) и опе-рантного субъективизма (см. главу 11). Вместо ис­пользования дискретных попыток или интервалов между попытками, как это имеет место в большин­стве экспериментальных подходов, анализ поведения обеспечивает возможность свободного реагирования в любое время. Голубь может клевать диск в любой момент. Последовательная регистрация (cumulative record) позволяет увидеть реакции в непрерывной временной шкале и их связь с подкреплениями. Дан­ная методология настолько чувствительна к показа­телю частоты реакций, что даже отдельный испыту­емый может стать источником полезных и осмыслен­ных данных, явиться примером, выявляющим или подтверждающим тот или иной поведенческий прин­цип. При этом отпадает необходимость в использо­вании статистического вывода или выборочных ста­тистик, как и в участии многих испытуемых. Вариа­бельность (поведенческих реакций) не нивелируется в результате графического представления результа­тов и не исключается вследствие статистической об-

работки данных; не привлекается для ее объяснения и теория, постулирующая гипотетические промежу­точные переменные, наподобие драйва или обработ­ки информации, которые должны поглотить измен­чивость. Напротив, вариабельность непосредственно контролируется экспериментальной процедурой и описывается посредством этой процедуры.

^ РАННЕЕ РАЗВИТИЕ И НЕКОТОРЫЕ

ВОПРОСЫ

Анализ поведения был разработан человеком, чье имя в области психологии наиболее известно, — Б. Ф. Скиннером (В. F. Skinner, 1904-1990). В опро­се, проведенном среди историков психологии и про­фессоров кафедр психологии (Korn, Davis & Davis, 1991), он был поставлен на первое место как наибо­лее влиятельный современный психолог. Хотя Фрейд более известен среди широких слоев населе­ния и ему уделяется больше внимания в вводных курсах психологии (Perlman, 1991), система Фрейда является теорией личности и программой лечения, последователи которой связаны в большей степени с медициной (Фрейд был врачом), чем с психологи­ей. Система Скиннера, напротив, была ориентирова­на на экспериментальные исследования оперантно-го поведения и получила наибольшую поддержку со стороны академической психологии, а также таких областей практического использования психологи­ческих знаний, как обучение лиц с задержкой психи­ческого развития, программированное обучение и поведенческая терапия. Практически на каждом от­делении психологии при любом университете США студентам предлагается либо практическое ознаком­ление с оперантным обучением на животных, либо его демонстрация. А любой учебник по вводному курсу психологии содержит раздел, посвященный оперантному обусловливанию. Таким образом, ана­лиз поведения завоевал прочные позиции в амери­канской психологии.

Принцип подкрепления получает свою более ран­нюю и элементарную формулировку в законе эффек­та, предложенном Эдвардом Торндайком (Edward Thorndyke, 1874-1949). Данный закон гласил, что ре­акция «запечатлевается» («stamped in»), когда за ней следует «удовлетворительное положение вещей» («satisfying state of affairs»). В отличие от него Скин­нер не постулирует никаких положений и никакого «удовлетворения», а пытается опереться на описание отношений: «Если за оперантным поведением следует предъявление подкрепляющего стимула, сила (пове­денческой реакции) возрастает» (Skinner, 1938, р. 21).

Закон эффекта Торндайка также гласит, что «не­приятное положение вещей» («an annoying state of affairs») будет «угашать» («stamp out») реакцию.

170

В первоначальной формулировке Торндайк утверж­дал, что «удовлетворительное» и «неприятное» ус­ловия являются эквивалентными (по эффективно­сти) и противоположными (по эффекту): «удов­летворительные» условия закрепляют реакции в той же степени, в которой «неприятные» гасят их. После проведения дальнейших эксперименталь­ных исследований он признал, что они не являют­ся эквивалентными и противоположными, т. е., что «неприятные» условия не всегда «угашают» реак­ции. Хотя наказание обычно используется с целью уменьшения вероятности определенной реакции, работы Скиннера и многих других исследователей подтверждают результаты, обнаруженные Торн-дайком: наказание не является высокоэффектив­ным средством контролирования реакций. Оно временно подавляет реакцию, но, как правило, не устраняет ее полностью; когда угроза наказания ослабевает, реакция возобновляется в полном объеме (хотя крайне болезненные стимулы, по-ви­димому, окончательно подавляют реакции у жи­вотных).

Помимо наказаний Скиннер также признает отри­цательное подкрепление. Оно состоит в удалении стимула, повышающем вероятность повторения ре­акции. Таким образом, как отрицательное, так и по­ложительное подкрепление способствуют усилению реакций. Например, ученик может прилежно учить­ся, чтобы получать хорошие отметки (положитель­ное подкрепление) или чтобы избежать плохих (от­рицательное подкрепление). Условием, ведущим к ослаблению (decrease) реагирования («угашению» по Торндайку), является наказание. Во всех случаях, согласно данной системе, отбор форм поведения про­изводится по их последствиям.

Бихевиоризм Джона Уотсона (John Watson, 1878-1958) также явился важным предшественником скиннеровской разновидности бихевиоризма. Имен­но благодаря влиянию Уотсона психология (а) ото­шла от изучения содержаний сознания (mental contents) и перешла к изучению поведения, (б) заме­нила метод интроспекции объективными методами и (в) поставила своей целью предсказание и контроль поведения. Скиннер стал преемником всех этих но­вовведений.

Одна разновидность бихевиоризма обыкновенно предполагала, что психических событий не существу­ет и что формы поведения, называемые личными (не­доступными стороннему наблюдателю) или менталь­ными (например, мышление), поддаются изучению при наличии соответствующей технологии. Другая его разновидность, называемая «методологическим бихевиоризмом», утверждала, что недоступные сто­роннему наблюдателю ментальные события суще­ствуют, однако их можно игнорировать или обойти методологически. Скиннер отошел от обоих этих подходов. Он настаивал на том, что личные события и ментальные (психические) события — это не одно и то же. Ментальные события — это не что иное, как

искусственные измышления или конструкты, тогда как личные события имеют физический статус. Их можно относить к формам поведения с такой же уве­ренностью, с какой можно рассматривать как пове­дение потребление пива или разговор с приятелем. Скиннер назвал данный подход «радикальным бихе­виоризмом», чтобы отличить его от методологичес­кого бихевиоризма. (Первоначально термин «ради­кальный бихевиоризм» относился к непринятию Уотсоном ментализма.) Таким образом, Скиннер признал личные события в качестве поведения, од­нако отверг ментализм как своего рода гипотетичес­кую особую силу, содержащуюся в организме. К со­жалению, термин «радикальный» часто понимается в значении «экстремальный», однако Скиннер ис­пользовал его для обозначения более широкого, хотя и нементалистского подхода. Возможно, иногда ис­пользуемые по отношению к нему термины «полный (comprehensive) бихевиоризм» или «натуралистичес­кий бихевиоризм» порождали ли бы меньше про­блем.

Скиннер также радикально отошел от большин­ства используемых в экспериментальной психоло­гии статистических процедур и групповых сравне­ний. Традиционно предполагалось, что организм будет проявлять изменчивость реакций и что эту из­менчивость (или вариабельность) необходимо кон­тролировать путем использования больших групп, в которых индивидуальные вариации будут взаим­но нейтрализовывать друг друга, а одна эксперимен­тальная группа в целом будет сравнима с другой эк­спериментальной группой. Такие сравнения групп предполагают использование межгругшового плана эксперимента (between-group design) со статисти­ческим контролем. В противовес данной методоло­гии, Скиннер использовал внутригрупповой план эксперимента (within-treatment group design), час­то реализуемый в виде исследования единичного организма. Он предположил, что вариабельность вносит экспериментатор, и выдвинул требование не статистического, а экспериментального контроля (например, условий подкрепления). Благодаря ис­пользованию единичного организма, контролируе­мого экспериментальными процедурами, а также непринятию Скиннером статистики — включая средние по группе, дисперсии и т. п., — его подход оказался имеющим мало общего с подходами боль­шинства других психологов. Скиннера интересова­ло только раскрытие принципов, которые позволи­ли бы с высокой точностью предсказывать поведе­ние отдельного организма. Выявление тонких различий между средними больших групп не пред­ставляло для него интереса.

Скиннер опубликовал результаты своих ранних исследований в форме книги; однако когда его уче­ники пытались опубликовать свои работы в академи­ческих журналах, их исследования, как правило, Не принимались: издатели были не знакомы с данным подходом и не были готовы принять то, что они не

171

понимали. Кумулятивные графики были для них также непривычными'. В результате последователям анализа поведения пришлось основывать собствен­ные журналы.

Вводя свои революционные процедуры, Скиннер, вероятно, испытал более непосредственное влияние со стороны Т. Уильяма Крозьера (Т. William Crozier, 1892-1953), физиолога из Гарвардского университе­та, чем со стороны Торндайка или Уотсона. Крозьер выступал за (а) изучение отдельного организма с це­лью определения изменчивости индивидуального поведения (отношений стимула и реакции как общей причины или описания поведения), в отличие от изу­чения экспериментальных воздействий при различ­ных условиях и с соответствующим статистическим контролем; (б) изучение самого поведения, а не нерв­ной системы; (в) изучение вариативности поведения организмов как функции изменений в окружающей среде и в организме; (г) установление эмпирических связей и отношений, в отличие от развития теории. Скиннер принял все четыре этих положения, но по­шел дальше принципов, отстаиваемых