Книга Н. Смита рекомендована слушателям и преподавателям факультетов психологии и философии вузов по курсам общей психологии и истории психологии, системных методов исследования и преподавания психологии

Вид материала

Содержание

Основные положения
Раннее развитие и некоторые

Подобный материал:

1 ... 22 23 24 25 26 27 28 29 ... 50

Глава 6. Анализ поведения: от оперантного обусловливания к поведенческой терапии...

ВВЕДЕНИЕ

Если вы выбираете ключ и он открывает замок, вы, вероятно, и в дальнейшем будете выбирать этот ключ для того же замка. Если кто-то говорит вам, как хорошо вы выглядите в вашем новом свитере, вы, вероятно, чаще будете надевать этот свитер в будущем. Это примеры принципа подкрепления, играющего фундаментальную роль в анализе поведения. Термин «подкрепление» означает нечто, усиливающее поведение или способствующее более вероятному его повторению. Термин «анализ поведения» противостоит термину «психоанализ». Согласно точке зрения сторонников данного подхода, анализу подвергается не психика (psyche), а поведение, да и сам анализ базируется на экспериментальном методе, а не на изучении истории пациентов. Поэтому иногда используется термин «экспериментальный анализ поведения».

^ ОСНОВНЫЕ ПОЛОЖЕНИЯ

Большинство студентов, изучающих психологию, знакомятся с четырьмя основными режимами подкрепления, обычно на примере крыс, нажимающих на рычаг, или голубей, клюющих диск. Эти «операции» («operations»), которые выполняют животные, послужили основанием для названия «оперантное обусловливание» («operant conditioning»). Оперантное обусловливание отличается от классического (респондентного) обусловливания тем, что животное должно выполнить определенное действие (операцию), чтобы получить подкрепление, причем это действие предшествует подкреплению. При классическом обусловливании, как в случае с собаками Павлова, у которых выделяется слюна в ответ на звук колокольчика, так как они ожидают, что за этим последует кормление, животные остаются пассивными. Они не делают ничего для того, чтобы «заработать» подкрепление в виде мяса, и выделение слюны наступает после звонка колокольчика. (Различие между оперантным и классическим обусловливанием иногда не является очевидным [Мооге, 1973; Rachlin, 1991а], и ряд последних исследований в области анализа поведения посвящен выяснению взаимосвязей между обоими видами обусловливания.)

Каждый из четырех режимов подкрепления вызывает определенные, соответствующие ему паттерны поведения (Ferster & Skinner, 1957). Эти четыре режима носят названия: (а) режим с фиксированной пропорцией, (б) режим с фиксированным интервалом, (в) режим с изменяющейся пропорцией и (г) режим с изменяющимся интервалом.

При режиме подкрепления с фиксированной пропорцией животное получает порцию пищи после каж-

дого фиксированного количества реакций. Если оно получает пищу после каждой реакции, данная разновидность этого режима называется «постоянным подкреплением». Если постоянное подкрепление прекращается, животное скоро перестает реагировать — происходит угашение реакции. Если пропорция отличается от значения, равного один к одному, и составляет, например, один к двадцати, темп реагирования между подкреплениями очень велик и затухание после прекращения подкрепления наступает значительно медленнее. Таким образом, при сильном подкреплении реакции угашаются быстрее, чем при слабом подкреплении. Данный феномен получил название парадокса Хамфри в честь Ллойда Дж. Хамфри (Lloyd G. Humphrey), впервые экспериментально продемонстрировавшего его (Rachlin, 1991a).

При режиме подкрепления с фиксированным интервалом животное получает подкрепление сразу после первой реакции, а затем через определенные периоды времени. Например, если интервал составляет две минуты, голубь получает пищу через две минуты после того, как в первый раз клюнет диск. После того как голубь научится приблизительно определять временной интервал, он начинает клевать медленно почти до момента следующего подкрепления, а затем начинает клевать очень быстро. Аналогично многие студенты уделяют мало времени учебе почти до самого наступления экзаменов. Затем — за день или два, а то и в последнюю ночь перед экзаменом они начинают усиленно заниматься, заканчивая готовиться к экзамену глубоко за полночь. После сдачи экзамена они снова возвращаются к паттерну обучения кое-как до следующего экзамена. В этом отношении студенты, пожалуй, мало чем отличаются от голубей. Но как мы оценим поведение тех, чей график занятий отличается большей равномерностью и регулярностью? С точки зрения специалиста по анализу поведения, это означает, что такой режим работы также должен иметь подкрепление — возможно, в виде похвалы со стороны родителей; или же он подкрепляется успехами в учебе, являющимися следствием более рационального и эффективного метода обучения. Следовательно, эти студенты реагируют не только на фиксированный интервал.

Если подкрепление соответствует режиму с изменяющейся пропорцией или с изменяющимся интервалом, оно называется нерегулярным или «прерывистым» («intermittent») подкреплением. При таком режиме животное сохраняет относительно равномерный темп реагирования, а угашение реакции после прекращения подкрепления происходит наиболее медленно по сравнению с остальными режимами. Голубь, например, может продолжать клевать в течение часа или более после последнего подкрепления, и даже в этом случае — если на следующий день он окажется в той же ситуации — он снова начнет клевать с большой частотой. Вследствие нерегулярного характера подкрепления животному трудно определить, что подкрепление было прекра-

168

щено, поэтому реакция угашается медленно. Другими словами, сам по себе режим подкрепления в значительной степени напоминает условия угашения реакции, поэтому животному трудно определить различие между условиями угашения и условиями подкрепления.

Классическим примером режима подкрепления с изменяющейся пропорцией являются азартные игры. Игрок никогда не знает, сколько раз он должен бросить кости или нажать на рычаг игрального автомата, чтобы выиграть, и этот случайный выигрыш, как правило, меньший по размерам, чем сумма, затрачиваемая на игру, стимулирует продолжение игры. Множество форм человеческой деятельности выполняется под влиянием прерывистого подкрепления. Возможно, писателю удается найти издателя лишь для незначительной части своих произведений, однако он продолжает работать, благодаря пусть и нерегулярному заработку. Нумизмат перебирает тысячи монет и продолжает свои поиски, получая редкие подкрепления в тех случаях, когда ему удается найти монету, подходящую для его коллекции. Спортсмен продолжает тренироваться благодаря наблюдению признаков своего прогресса и периодическим победам на соревнованиях. Истерики ребенка подкрепляются, когда родители уступают, а переменная частота подкреплений препятствует затуханию истерических реакций. Аналогично собака, выпрашивающая пищу с обеденного стола и в конце концов получающая кусок, начинает просить подачку при любой возможности.

В течение многих лет специалисты по анализу поведения исследовали различные режимы подкрепления. Ни один из паттернов реакций, описанных ниже, не может быть вызван посредством применения наказаний. Только благодаря положительному подкреплению удается сформировать устойчивые паттерны реакций. Несмотря на это, большинство попыток использования обществом правовых систем в целях социального регулирования основаны на использовании наказаний, таких как штрафы и тюремное заключение. Последствия применения наказаний весьма неоднозначны, однако в целом они отличаются значительно меньшей стабильностью в подавлении тех поведенческих реакций, формированию которых способствуют положительные формы подкрепления. Например, уровень рецидивизма среди заключенных свидетельствует о том, что тюремное заключение малоэффективно с точки зрения искоренения преступности. Применение наказаний имеет и нежелательные последствия: наказания являются формой агрессии, которая вызывает ответную агрессию; они порождают страх и отвращение к видам деятельности, связанным с наказаниями; при этом людям не предлагается никаких конструктивных альтернатив, показывающих, как им следует поступать.

Большинство профессиональных психологических организаций, таких как Американская психоло-

гическая ассоциация, требуют от своих членов ежемесячной уплаты взносов до определенного числа с целью избежать задержек платежей. Иными словами, эти организации подчеркивают потенциальное наказание, ожидающее членов, не уплативших взносы вовремя. Однако в Ассоциации анализа поведения (Association of Behavior Analysis) заведен другой порядок: если член платит ранее определенного срока, размеры платы снижаются. Как кто-то саркастически заметил, анализ поведения сам по себе представляет пример положительного подкрепления.

Результаты исследований, проводимых на животных, показывают, что простая S —» R-модель классического бихевиоризма не объясняет феномена оперантного обусловливания, поскольку последствия экспериментальных действий являются частью самого поведения, и потому должны быть включены в модель. Решение этой проблемы символически изображается в виде трехчленной ассоциации (three-term contingency):

(Эта структурная модель также известна в более общей форме как предшествующий стимул, поведение и последствия.) Голубь различает звук колокольчика (S^Distrim), клюет диск и получает подкрепление в виде пищи (S^Reinf). Все, что символизирует положительную связь между подкреплением и реакцией, является сигнальным (дифференцировочным) стимулом. Например, каждая кнопка с цифрой в автоматическом лифте является сигнальным стимулом для соответствующего этажа (S^Rcinf). Если мы нажимаем на кнопку с цифрой 4 (R_o _er), лифт доставит нас на четвертый этаж и мы получаем подкрепление, заставляющее нас нажимать на кнопку с цифрой 4 в следующий раз (если нам нужен тот же этаж). Однако если нам нужно попасть на первый этаж и мы нажимаем на кнопку с цифрой 1, а лифт доставляет нас в подвал, в следующий раз мы, вероятно, не будем повторять ту же реакцию, а вместо этого попробуем нажать на кнопку с цифрой 2. Если цифра 2 обеспечит нам подкрепление, мы, вероятно, повторим эту реакцию в будущем. Мы постоянно сталкиваемся с сигнальными (дифференцировочными) стимулами, связанными с подкреплениями: заглавие книги на полке, указывающее на то, что это та самая книга, которую мы ищем, сигналы светофора, конт-

169

ролирующее наше поведение на перекрестке, стрелки часов, напоминающие нам, что пора отправляться на встречу, пятно на костюме, говорящее нам, что костюм пора отдать в чистку, и тысячи других проявлений, многие из которых, как отметил Скиннер (Skinner, 1953, р. 75), не всегда ясно осознаются нами.

Лишь немногие виды человеческой деятельности поддерживаются благодаря таким первичным под-крепителям (primary reinforcers), как пища, однако вторичные подкрепители (secondary reinforcers) играют важную роль в нашей жизни. Вторичный под-крепитель — это стимул, появляющийся до первичного подкрепителя и первоначально не имеющий подкрепляющей силы, однако приобретающий ее после достаточного количества сочетаний с первичным подкрепителем. Мощным вторичным подкрепи-телем в нашей культуре являются деньги (фактически они являются «всеобщим вторичным подкрепителем», поскольку служат для подкрепления множества форм поведения). Монеты и банкноты сами по себе практически бесполезны, однако их можно обменять на пищу, жилье и все, что представляет для человека ценность. Соответственно, люди работают, пускаются в махинации, воруют, занимаются предпринимательством, играют в азартные игры, — и все ради этого вторичного подкрепителя. Иногда формируются целые цепочки вторичных подкрепителей. Человек может выполнять какую-либо работу за (а) обещание получить (б) чек, который можно обменять на (с) деньги, на которые можно купить продукт, который, в свою очередь, можно будет продать и получить прибыль в форме (г) другого чека, который можно обменять на (д) деньги, на которые можно купить продукт потребления или услугу.

Анализ поведения более тесно связан со своей методологией, чем любая другая система, за исключением эко-бихевиоральной науки (см. главу 7) и опе-рантного субъективизма (см. главу 11). Вместо использования дискретных попыток или интервалов между попытками, как это имеет место в большинстве экспериментальных подходов, анализ поведения обеспечивает возможность свободного реагирования в любое время. Голубь может клевать диск в любой момент. Последовательная регистрация (cumulative record) позволяет увидеть реакции в непрерывной временной шкале и их связь с подкреплениями. Данная методология настолько чувствительна к показателю частоты реакций, что даже отдельный испытуемый может стать источником полезных и осмысленных данных, явиться примером, выявляющим или подтверждающим тот или иной поведенческий принцип. При этом отпадает необходимость в использовании статистического вывода или выборочных статистик, как и в участии многих испытуемых. Вариабельность (поведенческих реакций) не нивелируется в результате графического представления результатов и не исключается вследствие статистической об-

работки данных; не привлекается для ее объяснения и теория, постулирующая гипотетические промежуточные переменные, наподобие драйва или обработки информации, которые должны поглотить изменчивость. Напротив, вариабельность непосредственно контролируется экспериментальной процедурой и описывается посредством этой процедуры.

^ РАННЕЕ РАЗВИТИЕ И НЕКОТОРЫЕ

ВОПРОСЫ

Анализ поведения был разработан человеком, чье имя в области психологии наиболее известно, — Б. Ф. Скиннером (В. F. Skinner, 1904-1990). В опросе, проведенном среди историков психологии и профессоров кафедр психологии (Korn, Davis & Davis, 1991), он был поставлен на первое место как наиболее влиятельный современный психолог. Хотя Фрейд более известен среди широких слоев населения и ему уделяется больше внимания в вводных курсах психологии (Perlman, 1991), система Фрейда является теорией личности и программой лечения, последователи которой связаны в большей степени с медициной (Фрейд был врачом), чем с психологией. Система Скиннера, напротив, была ориентирована на экспериментальные исследования оперантно-го поведения и получила наибольшую поддержку со стороны академической психологии, а также таких областей практического использования психологических знаний, как обучение лиц с задержкой психического развития, программированное обучение и поведенческая терапия. Практически на каждом отделении психологии при любом университете США студентам предлагается либо практическое ознакомление с оперантным обучением на животных, либо его демонстрация. А любой учебник по вводному курсу психологии содержит раздел, посвященный оперантному обусловливанию. Таким образом, анализ поведения завоевал прочные позиции в американской психологии.

Принцип подкрепления получает свою более раннюю и элементарную формулировку в законе эффекта, предложенном Эдвардом Торндайком (Edward Thorndyke, 1874-1949). Данный закон гласил, что реакция «запечатлевается» («stamped in»), когда за ней следует «удовлетворительное положение вещей» («satisfying state of affairs»). В отличие от него Скиннер не постулирует никаких положений и никакого «удовлетворения», а пытается опереться на описание отношений: «Если за оперантным поведением следует предъявление подкрепляющего стимула, сила (поведенческой реакции) возрастает» (Skinner, 1938, р. 21).

Закон эффекта Торндайка также гласит, что «неприятное положение вещей» («an annoying state of affairs») будет «угашать» («stamp out») реакцию.

170

В первоначальной формулировке Торндайк утверждал, что «удовлетворительное» и «неприятное» условия являются эквивалентными (по эффективности) и противоположными (по эффекту): «удовлетворительные» условия закрепляют реакции в той же степени, в которой «неприятные» гасят их. После проведения дальнейших экспериментальных исследований он признал, что они не являются эквивалентными и противоположными, т. е., что «неприятные» условия не всегда «угашают» реакции. Хотя наказание обычно используется с целью уменьшения вероятности определенной реакции, работы Скиннера и многих других исследователей подтверждают результаты, обнаруженные Торн-дайком: наказание не является высокоэффективным средством контролирования реакций. Оно временно подавляет реакцию, но, как правило, не устраняет ее полностью; когда угроза наказания ослабевает, реакция возобновляется в полном объеме (хотя крайне болезненные стимулы, по-видимому, окончательно подавляют реакции у животных).

Помимо наказаний Скиннер также признает отрицательное подкрепление. Оно состоит в удалении стимула, повышающем вероятность повторения реакции. Таким образом, как отрицательное, так и положительное подкрепление способствуют усилению реакций. Например, ученик может прилежно учиться, чтобы получать хорошие отметки (положительное подкрепление) или чтобы избежать плохих (отрицательное подкрепление). Условием, ведущим к ослаблению (decrease) реагирования («угашению» по Торндайку), является наказание. Во всех случаях, согласно данной системе, отбор форм поведения производится по их последствиям.

Бихевиоризм Джона Уотсона (John Watson, 1878-1958) также явился важным предшественником скиннеровской разновидности бихевиоризма. Именно благодаря влиянию Уотсона психология (а) отошла от изучения содержаний сознания (mental contents) и перешла к изучению поведения, (б) заменила метод интроспекции объективными методами и (в) поставила своей целью предсказание и контроль поведения. Скиннер стал преемником всех этих нововведений.

Одна разновидность бихевиоризма обыкновенно предполагала, что психических событий не существует и что формы поведения, называемые личными (недоступными стороннему наблюдателю) или ментальными (например, мышление), поддаются изучению при наличии соответствующей технологии. Другая его разновидность, называемая «методологическим бихевиоризмом», утверждала, что недоступные стороннему наблюдателю ментальные события существуют, однако их можно игнорировать или обойти методологически. Скиннер отошел от обоих этих подходов. Он настаивал на том, что личные события и ментальные (психические) события — это не одно и то же. Ментальные события — это не что иное, как

искусственные измышления или конструкты, тогда как личные события имеют физический статус. Их можно относить к формам поведения с такой же уверенностью, с какой можно рассматривать как поведение потребление пива или разговор с приятелем. Скиннер назвал данный подход «радикальным бихевиоризмом», чтобы отличить его от методологического бихевиоризма. (Первоначально термин «радикальный бихевиоризм» относился к непринятию Уотсоном ментализма.) Таким образом, Скиннер признал личные события в качестве поведения, однако отверг ментализм как своего рода гипотетическую особую силу, содержащуюся в организме. К сожалению, термин «радикальный» часто понимается в значении «экстремальный», однако Скиннер использовал его для обозначения более широкого, хотя и нементалистского подхода. Возможно, иногда используемые по отношению к нему термины «полный (comprehensive) бихевиоризм» или «натуралистический бихевиоризм» порождали ли бы меньше проблем.

Скиннер также радикально отошел от большинства используемых в экспериментальной психологии статистических процедур и групповых сравнений. Традиционно предполагалось, что организм будет проявлять изменчивость реакций и что эту изменчивость (или вариабельность) необходимо контролировать путем использования больших групп, в которых индивидуальные вариации будут взаимно нейтрализовывать друг друга, а одна экспериментальная группа в целом будет сравнима с другой экспериментальной группой. Такие сравнения групп предполагают использование межгругшового плана эксперимента (between-group design) со статистическим контролем. В противовес данной методологии, Скиннер использовал внутригрупповой план эксперимента (within-treatment group design), часто реализуемый в виде исследования единичного организма. Он предположил, что вариабельность вносит экспериментатор, и выдвинул требование не статистического, а экспериментального контроля (например, условий подкрепления). Благодаря использованию единичного организма, контролируемого экспериментальными процедурами, а также непринятию Скиннером статистики — включая средние по группе, дисперсии и т. п., — его подход оказался имеющим мало общего с подходами большинства других психологов. Скиннера интересовало только раскрытие принципов, которые позволили бы с высокой точностью предсказывать поведение отдельного организма. Выявление тонких различий между средними больших групп не представляло для него интереса.

Скиннер опубликовал результаты своих ранних исследований в форме книги; однако когда его ученики пытались опубликовать свои работы в академических журналах, их исследования, как правило, Не принимались: издатели были не знакомы с данным подходом и не были готовы принять то, что они не

171

понимали. Кумулятивные графики были для них также непривычными'. В результате последователям анализа поведения пришлось основывать собственные журналы.

Вводя свои революционные процедуры, Скиннер, вероятно, испытал более непосредственное влияние со стороны Т. Уильяма Крозьера (Т. William Crozier, 1892-1953), физиолога из Гарвардского университета, чем со стороны Торндайка или Уотсона. Крозьер выступал за (а) изучение отдельного организма с целью определения изменчивости индивидуального поведения (отношений стимула и реакции как общей причины или описания поведения), в отличие от изучения экспериментальных воздействий при различных условиях и с соответствующим статистическим контролем; (б) изучение самого поведения, а не нервной системы; (в) изучение вариативности поведения организмов как функции изменений в окружающей среде и в организме; (г) установление эмпирических связей и отношений, в отличие от развития теории. Скиннер принял все четыре этих положения, но пошел дальше принципов, отстаиваемых

Blog

Содержание