Исследование мотивации: точки зрения, проблемы, экспериментальные планы

Вид материала

Содержание

Излишность понятия «подкрепление ожидания»
Анализ Уолкером понятийного аппарата теории научения
Рис. 5.15. Уолкеровская схема конструктов теории научения, один из которых («соединение»-"Подкрепление») избыточен [Е. L. Walker
Первый закон научения
Четвертый закон предшествующего опыта
Квазифизиологическая модель мотивации привлекательностью Биндры

Подобный материал:

1 ... 16 17 18 19 20 21 22 23 ... 44

^ Излишность понятия «подкрепление ожидания»

Мы уже затрагивали вопрос излиш-ности постулата об определяющем привычку подкреплении. С тех пор, как в конце 20-х гг. против этого понятия выступил Толмен, а в связи с результатами по латентному научению и изменению привлекательности теория оперантного научения Халла оказалась перед неразрешимой проблемой, теоретические подходы, как мы видели, все больше и больше сводились, пока окончательно не были сведены, к объяснению инструментального целенаправленного поведения с помощью ситуационных побуждений, в особенности связанной с ожиданием мотивации привлекательностью [см.: R. С. Bolles, S. A. Moot, 1972]. Эти теории отличаются от подходов Левина и Толмена только одним. Если Левин и Толмен считали, что мотивирующие ожидания имеют только когнитивную репрезентацию, то такие теоретики, как Сьюард, Шеффилд, Маурер, а также Логан [F. A. Logan, 1960], описывали промежуточные переменные на языке S — R (на что, несомненно, провоцировал детальный анализ экспериментальных данных). Классическое обусловливание в павловском смысле оказалось незаменимым при объяснении связанных с ожиданием действий *.

Инструментальное (оперантное) обусловливание, понимаемое по Торндайку и Халлу как образование с помощью подкрепления связи «раз-дражитель — реакция», подвергалось все большему сомнению. Закон эффекта из принципа научения превратился в принцип поведения. Теоретико-ассоциативный r_G—Sc-механизм превратился в теоретико-когнитивный эквивалент мотивирующей ожидание привлекательности.

Более значимым по сравнению с постулированием в теоретических системах «механических» (теоретико-ассоциативных) или «когнитивных» связей оказалось нечто другое, а именно перелом в понимании явлений мотивации. В двух словах он может быть описан так: от единичного толчка к непрерывному движению. Пришлось отказаться от представления, что целенаправленное поведение запускается откуда-то извне общим по своей природе влечением, а само управление им полностью перепоручено фиксированным в результате редукции влечения связям S — R, которые в случае непригодности должны аннулироваться и постепенно вырабатываться вновь.

Теперь движущей силой целенаправленного поведения выступили ожидаемые целевые состояния, быстро и гибко запускающие инструментальные реакции, поскольку наступление определяется уже не сочетанием S — R, а ожидаемыми последствиями действия. Таким образом, ведущие исследователи научения и мотивации отказались от теории подкрепления инструментального поведения.

* Впрочем, это никак не означает, что классическое обусловливание действительно основывается на процессе подкрепления, т. е. на упрочении связи S — R, как ее трактовали приверженцы теории «стимул — реакция» вполне в соответствии с происходившим при инструментальном обусловливании. Ведь возможно, что при классическом обусловливании происходит научение ожиданию цепи событий—сочетанию «стимул — последствия», вызывающему соответствующие характеру потребности и специфике вида реакции [R. A. Rescorla, R. L. Solomon, 1967].

^ Анализ Уолкером понятийного аппарата теории научения

Уолкер [Е. L. Walker, 1969] распределяет используемые в теории научения понятия по четырем классам гипотетических конструктов: толкание (push), притягивание (pull), структура (structure) и соединение (glue)*. Класс конструктов «толкание» составляют такие понятия, как влечение, мотив, активация, напряжение и т. д., «притягивание» — привлекательность, валентность и т. д., «структура» — когнитивная организация, знание, сила привычки и т. д. и «соединение» — подкрепление (как гипотетический процесс, формирующий и укрепляющий связи S — R). Если же «подкрепление» означает событие, связанное с целевым состоянием, т. е. с удовлетворением потребности, то оно должно быть причислено наряду с понятиями «побуждение» и «валентность» к классу конструктов «притягивание». Из четырех классов конструктов меняются в зависимости от наличных условий только три: «толкание» — соответственно продолжительности неудовлетворения потребности, «притягивание» — соответственно привлекательному характеру (притягательности) целевого объекта, «структура» — соответственно предшествующему опыту, т. е. числу попыток в эксперименте по научению. Подкрепление как «усилитель реакций» представляет собой гипотетический процесс, протекающий между двумя гипотетическими конструктами. «Притягивание», так сказать, отбирает «соединение», которое в «структуре» все крепче связывает реакцию с раздражителем. Рисунок 5.15. поясняет эту взаимосвязь.

* Приведенные в скобках термины в переводе с английского соответственно означают толчок, тяга, структура, клей. (Прим. ред.)

Насколько необходимо при объяснении поведения использование подкрепления как «соединения»? Для ответа на этот вопрос следует установить: меняется ли подкрепляемое поведение (в смысле удовлетворения потребности) больше поведения не-подкрепляемого, и если меняется, то нельзя ли это удовлетворительно объяснить с помощью конструктов трех других классов: «толкания», «притягивания», «структуры»? Уолкер показал, что изменение структуры (научение) всегда можно исчерпывающе объяснить с помощью трех конструктов и поэтому введение подкрепления как «соединения» излишне. Так, исчезновение выученных реакций проще всего объяснить уменьшением привлекательности объекта. Притягивания больше нет. Реакции исчезают постепенно, поскольку сначала необходимо разучиться привлекательности ассоциированных с первоначальным целевым объектом особенностей ситуации.

Уолкер приводит многочисленные доказательства ненужности конструкта «соединение». Наряду с данными по латентному научению и смене привлекательности он отмечает меж-i ду прочим, что вопреки основному постулату теории подкрепления сила привычки при постоянном подкреплении не остается на достигнутом уровне, а уменьшается и, наконец, вообще сходит на нет. Частота реакций падает до нуля, хотя всякое появление правильной реакции по-прежнему подкрепляется. Уолкер стремится показать не только то, что «соединение» подкреплением до сих пор не доказано, но и то, что для демонстрации существования этого эффекта необходимо было бы выделить значительно более сложные зависимые переменные.

^ Рис. 5.15. Уолкеровская схема конструктов теории научения, один из которых («соединение»-"Подкрепление») избыточен [Е. L. Walker, 1969, р. 51]

Боллсовская когнитивная модель мотивации привлекательностью

Боллс в подходе к проблеме мотивации начинал [R. С. Bolles, 1967] как представитель теории подкрепления, но затем [R. С. Bolles, 1972] предпочел основанную на теории привлекательности когнитивную модель. Он более не видел в подкреплении ни необходимого, ни достаточного условия инструментального научения. Согласно Боллсу, то, чему научаются, есть не связи S — R, а два вида ожиданий. Первый относится к сочетанию внешних ситуационных условий и их следствий (S — S*, сочетание «стимул — последствия»); второй — к сочетанию «собственных действий и их последствий» (R — S*, сочетание «действие — следствия»). Отказ от подкрепления позволил заняться изучением обоих видов ожиданий.

Поскольку подобные взгляды, будучи ориентированными в исследовании научения на теорию S — R, ближе всего подошли в психологии мотивации к когнитивным теориям и уже не просто конвергировали, а почти что совпадали с ними, боллсовскую модель объяснения поведения стоит рассмотреть подробнее. При обсуждении понятия «подкрепление» мы должны (как и в критическом анализе Уолтера) различать два его значения: подкрепление как создаваемое экспериментатором событие и подкрепление как процесс (функция) образования привычки, в дальнейшем последнее будет называться механизмом подкрепления.

Подкрепляющие события при последующем поведении часто позволяют узнать, какой вид научения соответствует постулированному механизму подкрепления. Однако накапливалось все больше наблюдений, когда ничего подобного не происходило. Или за подкрепляющими событиями не наступало научения, или же научение происходило значительно быстрее, чем оно могло бы происходить на основе механизма подкрепления. Рассмотрим коротко некоторые из приведенных Боллсом данных. О случаях, в которых подкрепление не дает эффекта научения, пишут, например, К. и М. Бреланды [К. Breland, М. Breland, 1961], называя их «дурным поведением животных»*.

Так, енота обучали приносить и бросать деревянную монету в свинью-копилку. Выученное поведение, однако, нарушалось, если нужно было бросить две монеты. К ситуации примешивалось сходное поведение по отыскиванию пищи. Енот тер монеты друг о друга, бросал их в копилку, а потом снова вынимал. Это поведение настолько преобладало, что дрессировщикам пришлось отступить**.

Примером научения, происходящего слишком быстро, чтобы его можно было объяснить механизмом подкрепления, является так называемое самоформирование поведения. В программу обучения американских студентов-психологов входит эксперимент по научению голубей в скиннеровском ящике. Голубь для получения корма должен научиться клевать маленькую шайбу. Это происходит обычно через 1 ч, если вознаграждать кормом постепенное приближение поведения к нужной реакции. Более поздние исследования показали, что все усилия экспериментатора по подкреплению не столь уж обязательны. Достаточно с самого начала установить автомат подачи корма на желаемую реакцию клевания независимо от того, что именно делает в данный момент голубь, который может то подходить, то удаляться от шайбы [P. L. Brown, Н. М. Jenkins, 1968]. Поскольку клевание, в особенности оптически выделяющихся предметов, является видос-пецифическим образцом поведения и эта реакция имеет большую вероятность появления, постепенное возрастание частоты поощряемых клеваний можно еще объяснить в рамках теории подкрепления. Однако это объяснение утрачивает силу, если, как в экспериментах Д. и Г. Вильям-сов [D. К. Williams, H. Williams, 1969], применить процедуру обратного подкрепления. Корм давался в случайном порядке, но не давался никогда при осуществлении голубем нужной реакции клевания. Тем не менее частота непоощряемых, т. е. неподкреп-лявшихся, реакций клевания возрастала. Экспериментальное животное, когда оно ждет корма, реагирует, как всякое животное его вида, проявляя входящие в его поведенческий репертуар потребностно-специфические реакции.

* Бреланды были учениками Скиннера и пытались использовать закономерности операн-тного поведения в цирковой дрессуре. При этом у различных видов животных наблюдались не совсем обычные сложности научения и промахи при выполнении трюков.

** Здесь, впрочем, сказываются границы, которые устанавливают операциональному обусловливанию видоспецифичные способы поведения. В ситуации обычного лабораторного эксперимента по научению, когда остается без внимания экологическая сторона поведения, эти границы до сих пор недостаточно учитываются. Именно этот аспект зоопсихо-логических исследований научения прежде всего критикуется этологами.

Подобные же данные получены в исследованиях научения избеганию. При некоторых нужных экспериментатору реакциях события подкрепления имеют для научения желаемый эффект, при других — не имеют. Подкрепление действенно в случае, когда желаемое (поощряемое) экспериментатором поведение избегания совпадает с видоспецифичными реакциями. Таким образом, события, происходящие в эксперименте по научению, можно представить так. Приведенное в состояние потребности животное, научившись ожидать корма или электроразряда, демонстрирует предназначенное для таких случаев видоспецифичное поведение. Если существует два возможных типа реакции, скажем убегание и замирание при появлении опасности, то экспериментатору достаточно штрафовать нежелаемый тип реакции (т. е. не выключать ток), чтобы запустить желательное поведение избегания. Не-видоспецифичные реакции избегания, например нажимание на рычаг у крысы, обусловливаются значительно труднее и скорее всего осуществляются лишь после того, как крыса сначала видоспецифически замирает вблизи рычага.

В рамках теории привлекательности легко объяснить данные, как противоречащие теории подкрепления, так и с ней согласующиеся. И мы уже подробно обсудили то, каким образом это делается. Перечислим лишь коротко три гипотезы, выдвинутые в связи с этим в теории S — R. Во-первых, привлекательные объекты обладают функцией мотивирования, К усиливает имеющиеся привычки. Во-вторых, активирующий процесс мотивации привлекательностью основывается на частичных антиципирующих цель реакциях, порождающих аффективное состояние раздражения. Введение зависимого, играющего роль посредника r_G— s_G -механизма позволяет применить комплекс законов научения, которые были получены в исследованиях, построенных на основе теории S — R. В-третьих, ассоциативные процессы осуществляются по образцу классического, а не инструментального обусловливания. (Конечно, здесь следует иметь в виду, что и при инструментально подкрепляемом научении, и при классическом обусловливании мы должны различать поддающиеся измерению события и гипостазированные процессы. Вопрос о том, укрепляется ли при этом связь S—R, или образуется ожидание последствий стимула типа S₁ — S₂ (см. сноску на с. 217), остается открытым.)

Боллс перестроил эти положения в когнитивном духе. На вопрос, чему же научаются, он ответил определенно: не сочетаниям S и R, а принимающей форму ожиданий связи S — S* и R — S*. Боллс сформулировал пять законов.

В первых двух речь идет о научении. В них определяются оба вида составляющих содержание научения ожиданий. ^ Первый закон научения, по Боллсу, гласит: научение состоит в образовании ожидания новых связей между событиями в мире. Вновь возникающим упорядоченным последовательностям событий научаются, т. е. научаются сочетанию стимулов и их последствий. Стимул предсказывает значимое для животного событие— удовлетворяющий потребность или угрожающий, способный причинить вред объект. Этот вид ожидания Боллс обозначил как S — S*.

Живые существа, конечно, в состоянии проследить поддающееся предсказанию отношение следования не только событий в окружающем мире, но и собственных действий и их последствий. Ожидания второго типа подчиняются второму закону науче-ния и обозначаются как R — S*-ожидания. ини проявляются в много-' образных феноменах инструментального научения: S — S*- и R — S*- ожидания соответствуют тому, что Толмен обозначал как SR — S- ожидания. Нужно, однако, различать оба вида ожиданий, поскольку в ситуации нового научения одно из них может оказаться сформированным (выучено раньше или врождено, см. ниже закон предшествующего опыта).

В третьем законе, законе выполнения, речь идет о способах связи и поведенческих функциях обоих видов ожиданий, когда и то и другое ожидания выучены. В качестве модели, объясняющей эту связь, служит про-стое логическое умозаключение (силлогизм): если есть S*—S* и R —S*, то я могу достичь S *, как только при наличии S осуществлю R. Специального экспериментального анализа заслуживает вопрос о степени дифференцированности и сложности, до которой могут довести силлогистические связи различные виды живых существ (или отдельные особи). Во всяком случае, запуск поведения и управление им, как показывают данные по латентному научению, основаны на более сложных процессах, чем простые сочетания S — R. В когнитивной теории за основу поведения берутся более сложные процессы. Тол-мен, например, объяснял целенаправленность выполняющихся действий при помощи такого образа, как считывание «когнитивной карты».

^ Четвертый закон предшествующего опыта рассматривает те врожденные или выученные ранее ожидания обоих видов, которые живое существо привносит в новую ситуацию и которые могут в ней преобладать. Этот закон объясняет отсутствие в некоторых случаях эффекта осуществляемого экспериментатором подкрепления, например в случае с енотом Брелан-дов, когда так и не преодолевались видовые способы отыскания пищи. Предшествующий опыт устанавливает для каждого вида свои границы научения. У млекопитающих, например у крыс, эти границы обнаруживаются очень скоро вторжением видоспеци-фических реакций при отсрочивании подкрепления.

И наконец, пятый закон Боллс сформулировал как закон мотивации:

«Вероятность реакции возрастает (а) с увеличением силы S — S'-ожидания; (Ь) силы R — S "-ожидания; (с) ценности S*» [R. С. Bolles, 1972, р. 405].

Мотивационный компонент всех детерминантов заключен в S*, значимом, но еще не достигнутом целевом состоянии (или, когда S * представляет угрозу, в состоянии, которое, если оно наступило, должно быть изменено, а если только может наступить, его следует избежать).

S* как ценность целевого события эквивалентна левиновской валентности и толменовской нужности цели. S* зависит от состояния потребности, что соответствует халловской D и левиновскому t. S — S *-ожидания того, что ситуация приведет к целевым объектам или событиям, есть эквивалент левиновской структуры жизненного пространства и халловской К. R — S* направляет поведение, если S — S* дано, у Левина это соответствует избранному способу действия, у Толмена—ожиданию соотношения средств и целей, у Халла — понимаемой чисто ассоциативно привычке.

Сила или вероятность наступления того или иного действия в модели Боллса определяется мультипликативной связью всех трех детерминантов. Как мы увидим, концепцию Боллса безоговорочно следует отнести к классу теорий «ожидаемой ценности», даже если она и возникла в рамках других исследовательских направлений (см. об этом ниже). Новым в ней является введение двух детерминантов: S — S*- и R — S'-ожиданий. Они различаются по тому, наступает ли представляющее ценность целевое событие само (S — S*), или для этого необходимы действия субъекта (R — S*) и какова вероятность того и другого. Мы еще увидим (гл. 10), что это различие становится основополагающим при приписывании причины (каузальной атрибуции) эффектам действия. Приписывание причин решающим образом влияет на феномены мотивации (см. гл. 11).

А как же сочетания S — R, разве они уже не играют никакой роли? По Боллсу, они сохраняют свое значение в двух случаях: (1) во врожденных образцах действия, инстинктах в это-логическом смысле; (2) в выученном поведении, когда речь идет об автоматизированных привычках выполнения и о навыках. В заключение остается сказать, что модель Боллса должна еще разрабатываться во многих отношениях. Связи между теоретическими конструктами подлежат уточнению, в особенности следует уточнить условия соответствия S — S* и R — S*. Теоретические конструкты нуждаются в операциональном определении. Только их количественная заданность сделает возможным экспериментальное подтверждение предсказаний.

^ Квазифизиологическая модель мотивации привлекательностью Биндры

Биндра [D. Bindra, 1974; 1969] предложил модель, во многом схожую с моделью Боллса. Он также отверг постулат теории S — R о подкреплении реакций. Аргументируя свою точку зрения, он указывает на то, что научение может происходить и тогда, когда осуществление реакций невозможно. Эксперимент, доказывавший это, заключался в следующем. Животные видят привлекательный объект, но не могут на него реагировать, находясь под действием кураре (кураре — яд органического происхождения, который временно блокирует нервно-мышечную передачу). Как только действие яда прекращается, научение этих животных делает значительный скачок [см.: Е. Та-ub, A. J. Berman, 1968]. Серьезный удар постулату подкрепления реакции нанесло также интенсивно исследуемое в 70-е гг. научение через подражание. Достаточно простого наблюдения модели, чтобы сразу овладеть совершенно новым способом поведения; естественно, что наблюдающий при этом не получает никакого подкрепления [см.: A. Bandura, 1971a].

В модели Биндры R — S "-ожидания не предусматриваются, так как он считает их сводимыми к ожиданиям типа S — S*, поскольку «вырабатываемая специфическая форма реакции представляет собой спонтанную конструкцию, образуемую из наличного состояния мотивации и пространственно-временного распределения различных дистальных и контактных стимулов, указывающих на привлекательный характер ситуации» [D. Bindra, 1974, р. 199].

Эти реакции напоминают локомо-цию в жизненном пространстве, которая, по Левину, свободно следует наличным силам и предоставляемым полем возможностям действия. Боллс [R. С. Bolles, 1972, р. 406] сомневается в правомерности отрицания существования особых R — S'-ожиданий, потому что в таком случае осуществляемые реакции оказались бы слишком сильно связанными с поведенческим репертуаром данного состояния мотивации, а это противоречит гибкости поведения многих млекопитающих, и тем более человека. За исключением этого расхождения основные позиции обоих авторов очень близки, но модель Биндры во многих отношениях разработана более детально, к тому же с привлечением физиологических данных.

Рис. 5.16. Модель Биндры процесса мотивации, влияющего на три различных вида реакций. В качестве примера взято необусловливаемое поведение (поиск корма)

Согласно Биндре, мотивация детерминируется не состоянием потребности организма или требовательными характеристиками внешних раздражителей, а взаимодействием обоих факторов, определяющих центральное состояние мотива, как его обозначил еще Морган [С. Т. Morgan, 1943]. Во временном отношении управление осуществляется привлекательными объектами окружения. Они возбуждают центральное состояние мотива в той мере, в какой готовность к этому уже имеется (например, с ними согласуются проприоцептивные указательные раздражители, или вообще нет никакой готовности центрального состояния мотива). Центральное состояние мотива оказывает, прежде всего, общее активирующее и стимулирующее воздействие на все способствующие поисковому (или уклоняющемуся) поведению сенсомоторные функции. Оно одновременно влияет на автономные телесные функции (такие, как выделение слюны при поиске еды) и усиливает репрезентацию привлекательного объекта среди центральных репрезентаций (в мозге) других объектов, как фигуру на фоне. Таким образом, речь идет о как бы взаимном усилении выраженности центральной когнитивной репрезентацией целевого объекта и центрального состояния мотива.

Изменение поведения (научение) происходит при центральной репрезентации сочетаемости ситуационных стимулов и стимулов привлекательности. Нейтральные до тех пор ситуационные стимулы превращаются в сигналы, обусловливающие привлекательность. Рисунок 5.16 дает представление об этой модели. Стрелки обозначают переход от доступных наблюдению событий к недоступным наблюдению (гипотетическим) процессам; заканчивающиеся развилкой линии представляют процессы, происходящие между гипотетическими переменными. Биндра различает три вида реакций: инструментальные (поиск и избегание), консумматорные (все, что делается в контакте с целевым объектом) и регуляторные (организмиче-ские реакции, такие, как секреция желёз). С помощью своей модели Биндра смог объяснить ряд феноменов, не поддающихся интерпретации в теории подкрепляемого научения.

Blog

Исследование мотивации: точки зрения, проблемы, экспериментальные планы

Содержание