Исследование мотивации: точки зрения, проблемы, экспериментальные планы

Вид материалаИсследование

Содержание


Излишность понятия «подкрепление ожидания»
Анализ Уолкером понятийного аппарата теории научения
Рис. 5.15. Уолкеровская схема конструктов теории научения, один из которых («соединение»-"Подкрепление») избыточен [Е. L. Walker
Первый закон научения
Четвертый закон предшествующего опыта
Квазифизиологическая модель мотивации привлекательностью Биндры
Подобный материал:
1   ...   16   17   18   19   20   21   22   23   ...   44

^ Излишность понятия «подкрепление ожидания»


Мы уже затрагивали вопрос излиш-ности постулата об определяющем привычку подкреплении. С тех пор, как в конце 20-х гг. против этого понятия выступил Толмен, а в связи с результатами по латентному науче­нию и изменению привлекательности теория оперантного научения Халла оказалась перед неразрешимой проб­лемой, теоретические подходы, как мы видели, все больше и больше сводились, пока окончательно не бы­ли сведены, к объяснению инструмен­тального целенаправленного поведе­ния с помощью ситуационных побуж­дений, в особенности связанной с ожиданием мотивации привлекатель­ностью [см.: R. С. Bolles, S. A. Moot, 1972]. Эти теории отличаются от под­ходов Левина и Толмена только од­ним. Если Левин и Толмен считали, что мотивирующие ожидания имеют только когнитивную репрезентацию, то такие теоретики, как Сьюард, Шеффилд, Маурер, а также Логан [F. A. Logan, 1960], описывали проме­жуточные переменные на языке S — R (на что, несомненно, провоциро­вал детальный анализ эксперимен­тальных данных). Классическое обус­ловливание в павловском смысле оказалось незаменимым при объясне­нии связанных с ожиданием дей­ствий *.

Инструментальное (оперантное) обусловливание, понимаемое по Тор­ндайку и Халлу как образование с помощью подкрепления связи «раз-дражитель — реакция», подвергалось все большему сомнению. Закон эф­фекта из принципа научения превра­тился в принцип поведения. Теорети­ко-ассоциативный rG—Sc-механизм превратился в теоретико-когнитивный эквивалент мотивирующей ожидание привлекательности.

Более значимым по сравнению с постулированием в теоретических си­стемах «механических» (теоретико-ассоциативных) или «когнитивных» связей оказалось нечто другое, а именно перелом в понимании явлений мотивации. В двух словах он может быть описан так: от единичного толчка к непрерывному движению. Пришлось отказаться от представле­ния, что целенаправленное поведение запускается откуда-то извне общим по своей природе влечением, а само управление им полностью перепору­чено фиксированным в результате редукции влечения связям S — R, ко­торые в случае непригодности долж­ны аннулироваться и постепенно вы­рабатываться вновь.

Теперь движущей силой целенап­равленного поведения выступили ожидаемые целевые состояния, быстро и гибко запускающие инструмен­тальные реакции, поскольку наступ­ление определяется уже не сочетани­ем S — R, а ожидаемыми последстви­ями действия. Таким образом, веду­щие исследователи научения и моти­вации отказались от теории подкреп­ления инструментального поведения.


* Впрочем, это никак не означает, что класси­ческое обусловливание действительно осно­вывается на процессе подкрепления, т. е. на упрочении связи S — R, как ее трактовали приверженцы теории «стимул — реакция» вполне в соответствии с происходившим при инструментальном обусловливании. Ведь возможно, что при классическом обуслов­ливании происходит научение ожиданию цепи событий—сочетанию «стимул — по­следствия», вызывающему соответствующие характеру потребности и специфике вида реакции [R. A. Rescorla, R. L. Solomon, 1967].


^ Анализ Уолкером понятийного аппарата теории научения


Уолкер [Е. L. Walker, 1969] распре­деляет используемые в теории науче­ния понятия по четырем классам ги­потетических конструктов: толкание (push), притягивание (pull), структура (structure) и соединение (glue)*. Класс конструктов «толкание» со­ставляют такие понятия, как вле­чение, мотив, активация, напряже­ние и т. д., «притягивание» — привлекательность, валентность и т. д., «структура» — когнитивная орга­низация, знание, сила привычки и т. д. и «соединение» — подкрепление (как гипотетический процесс, форми­рующий и укрепляющий связи S — R). Если же «подкрепление» означает событие, связанное с целевым состо­янием, т. е. с удовлетворением пот­ребности, то оно должно быть причис­лено наряду с понятиями «побужде­ние» и «валентность» к классу кон­структов «притягивание». Из четырех классов конструктов меняются в за­висимости от наличных условий толь­ко три: «толкание» — соответственно продолжительности неудовлетворения потребности, «притягивание» — соответственно привлекательно­му характеру (притягательности) це­левого объекта, «структура» — соответственно предшествующему опыту, т. е. числу попыток в экспери­менте по научению. Подкрепление как «усилитель реакций» представля­ет собой гипотетический процесс, про­текающий между двумя гипотетиче­скими конструктами. «Притягивание», так сказать, отбирает «соединение», которое в «структуре» все крепче связывает реакцию с раздражителем. Рисунок 5.15. поясняет эту взаимос­вязь.


* Приведенные в скобках термины в переводе с английского соответственно означают тол­чок, тяга, структура, клей. (Прим. ред.)


Насколько необходимо при объяс­нении поведения использование под­крепления как «соединения»? Для ответа на этот вопрос следует уста­новить: меняется ли подкрепляемое поведение (в смысле удовлетворения потребности) больше поведения не-подкрепляемого, и если меняется, то нельзя ли это удовлетворительно объяснить с помощью конструктов трех других классов: «толкания», «притягивания», «структуры»? Уолкер показал, что изменение структуры (научение) всегда можно исчерпыва­юще объяснить с помощью трех кон­структов и поэтому введение под­крепления как «соединения» излиш­не. Так, исчезновение выученных ре­акций проще всего объяснить умень­шением привлекательности объекта. Притягивания больше нет. Реакции исчезают постепенно, поскольку сна­чала необходимо разучиться привле­кательности ассоциированных с пер­воначальным целевым объектом осо­бенностей ситуации.

Уолкер приводит многочисленные доказательства ненужности конструк­та «соединение». Наряду с данными по латентному научению и смене привлекательности он отмечает меж-i ду прочим, что вопреки основному постулату теории подкрепления сила привычки при постоянном подкрепле­нии не остается на достигнутом уров­не, а уменьшается и, наконец, вообще сходит на нет. Частота реакций пада­ет до нуля, хотя всякое появление правильной реакции по-прежнему подкрепляется. Уолкер стремится по­казать не только то, что «соедине­ние» подкреплением до сих пор не доказано, но и то, что для демонстра­ции существования этого эффекта не­обходимо было бы выделить значи­тельно более сложные зависимые пе­ременные.





^ Рис. 5.15. Уолкеровская схема конструктов теории научения, один из которых («соединение»-"Подкрепление») избыточен [Е. L. Walker, 1969, р. 51]


Боллсовская когнитивная модель мотивации привлекательностью


Боллс в подходе к проблеме моти­вации начинал [R. С. Bolles, 1967] как представитель теории подкрепления, но затем [R. С. Bolles, 1972] предпо­чел основанную на теории привлека­тельности когнитивную модель. Он более не видел в подкреплении ни необходимого, ни достаточного усло­вия инструментального научения. Сог­ласно Боллсу, то, чему научаются, есть не связи S — R, а два вида ожиданий. Первый относится к соче­танию внешних ситуационных условий и их следствий (S — S*, сочетание «стимул — последствия»); второй — к сочетанию «собственных действий и их последствий» (R — S*, сочетание «действие — следствия»). Отказ от подкрепления позволил заняться изу­чением обоих видов ожиданий.

Поскольку подобные взгляды, буду­чи ориентированными в исследовании научения на теорию S — R, ближе всего подошли в психологии мотива­ции к когнитивным теориям и уже не просто конвергировали, а почти что совпадали с ними, боллсовскую мо­дель объяснения поведения стоит рассмотреть подробнее. При обсужде­нии понятия «подкрепление» мы должны (как и в критическом анали­зе Уолтера) различать два его значе­ния: подкрепление как создаваемое экспериментатором событие и под­крепление как процесс (функция) об­разования привычки, в дальнейшем последнее будет называться механиз­мом подкрепления.

Подкрепляющие события при пос­ледующем поведении часто позволя­ют узнать, какой вид научения соот­ветствует постулированному механиз­му подкрепления. Однако накаплива­лось все больше наблюдений, когда ничего подобного не происходило. Или за подкрепляющими событиями не наступало научения, или же науче­ние происходило значительно бы­стрее, чем оно могло бы происходить на основе механизма подкрепления. Рассмотрим коротко некоторые из приведенных Боллсом данных. О слу­чаях, в которых подкрепление не дает эффекта научения, пишут, на­пример, К. и М. Бреланды [К. Breland, М. Breland, 1961], называя их «дур­ным поведением животных»*.

Так, енота обучали приносить и бросать деревянную монету в свинью-копилку. Выученное поведение, одна­ко, нарушалось, если нужно было бросить две монеты. К ситуации при­мешивалось сходное поведение по отыскиванию пищи. Енот тер монеты друг о друга, бросал их в копилку, а потом снова вынимал. Это поведение настолько преобладало, что дресси­ровщикам пришлось отступить**.

Примером научения, происходящего слишком быстро, чтобы его можно было объяснить механизмом подкреп­ления, является так называемое са­моформирование поведения. В прог­рамму обучения американских студен­тов-психологов входит эксперимент по научению голубей в скиннеровском ящике. Голубь для получения корма должен научиться клевать маленькую шайбу. Это происходит обычно через 1 ч, если вознаграждать кормом по­степенное приближение поведения к нужной реакции. Более поздние ис­следования показали, что все усилия экспериментатора по подкреплению не столь уж обязательны. Достаточно с самого начала установить автомат подачи корма на желаемую реакцию клевания независимо от того, что именно делает в данный момент го­лубь, который может то подходить, то удаляться от шайбы [P. L. Brown, Н. М. Jenkins, 1968]. Поскольку кле­вание, в особенности оптически выде­ляющихся предметов, является видос-пецифическим образцом поведения и эта реакция имеет большую вероят­ность появления, постепенное возра­стание частоты поощряемых клева­ний можно еще объяснить в рамках теории подкрепления. Однако это объяснение утрачивает силу, если, как в экспериментах Д. и Г. Вильям-сов [D. К. Williams, H. Williams, 1969], применить процедуру обратного под­крепления. Корм давался в случай­ном порядке, но не давался никогда при осуществлении голубем нужной реакции клевания. Тем не менее ча­стота непоощряемых, т. е. неподкреп-лявшихся, реакций клевания возра­стала. Экспериментальное животное, когда оно ждет корма, реагирует, как всякое животное его вида, проявляя входящие в его поведенческий репер­туар потребностно-специфические реакции.


* Бреланды были учениками Скиннера и пыта­лись использовать закономерности операн-тного поведения в цирковой дрессуре. При этом у различных видов животных наблюда­лись не совсем обычные сложности научения и промахи при выполнении трюков.

** Здесь, впрочем, сказываются границы, кото­рые устанавливают операциональному обус­ловливанию видоспецифичные способы пове­дения. В ситуации обычного лабораторного эксперимента по научению, когда остается без внимания экологическая сторона поведе­ния, эти границы до сих пор недостаточно учитываются. Именно этот аспект зоопсихо-логических исследований научения прежде всего критикуется этологами.


Подобные же данные получены в исследованиях научения избеганию. При некоторых нужных эксперимента­тору реакциях события подкрепления имеют для научения желаемый эф­фект, при других — не имеют. Под­крепление действенно в случае, ког­да желаемое (поощряемое) экспери­ментатором поведение избегания сов­падает с видоспецифичными реакци­ями. Таким образом, события, проис­ходящие в эксперименте по науче­нию, можно представить так. Приве­денное в состояние потребности жи­вотное, научившись ожидать корма или электроразряда, демонстрирует предназначенное для таких случаев видоспецифичное поведение. Если су­ществует два возможных типа реак­ции, скажем убегание и замирание при появлении опасности, то экспери­ментатору достаточно штрафовать нежелаемый тип реакции (т. е. не выключать ток), чтобы запустить же­лательное поведение избегания. Не-видоспецифичные реакции избегания, например нажимание на рычаг у кры­сы, обусловливаются значительно труднее и скорее всего осуществля­ются лишь после того, как крыса сначала видоспецифически замирает вблизи рычага.

В рамках теории привлекательно­сти легко объяснить данные, как про­тиворечащие теории подкрепления, так и с ней согласующиеся. И мы уже подробно обсудили то, каким образом это делается. Перечислим лишь ко­ротко три гипотезы, выдвинутые в связи с этим в теории S — R. Во-первых, привлекательные объекты обладают функцией мотивирования, К усиливает имеющиеся привычки. Во-вторых, активирующий процесс моти­вации привлекательностью основыва­ется на частичных антиципирующих цель реакциях, порождающих аффек­тивное состояние раздражения. Вве­дение зависимого, играющего роль посредника rG— sG -механизма позво­ляет применить комплекс законов на­учения, которые были получены в исследованиях, построенных на осно­ве теории S — R. В-третьих, ассоци­ативные процессы осуществляются по образцу классического, а не инстру­ментального обусловливания. (Конеч­но, здесь следует иметь в виду, что и при инструментально подкрепляемом научении, и при классическом обус­ловливании мы должны различать поддающиеся измерению события и гипостазированные процессы. Вопрос о том, укрепляется ли при этом связь S—R, или образуется ожидание пос­ледствий стимула типа S1 — S2 (см. сноску на с. 217), остается откры­тым.)

Боллс перестроил эти положения в когнитивном духе. На вопрос, чему же научаются, он ответил определенно: не сочетаниям S и R, а принимающей форму ожиданий связи S — S* и R — S*. Боллс сформулировал пять законов.

В первых двух речь идет о науче­нии. В них определяются оба вида составляющих содержание научения ожиданий. ^ Первый закон научения, по Боллсу, гласит: научение состоит в образовании ожидания новых связей между событиями в мире. Вновь воз­никающим упорядоченным последова­тельностям событий научаются, т. е. научаются сочетанию стимулов и их последствий. Стимул предсказывает значимое для животного событие— удовлетворяющий потребность или угрожающий, способный причинить вред объект. Этот вид ожидания Боллс обозначил как S — S*.

Живые существа, конечно, в состо­янии проследить поддающееся пред­сказанию отношение следования не только событий в окружающем мире, но и собственных действий и их пос­ледствий. Ожидания второго типа подчиняются второму закону науче-ния и обозначаются как R — S*-ожидания. ини проявляются в много-' образных феноменах инструменталь­ного научения: S — S*- и R — S*- ожи­дания соответствуют тому, что Тол­мен обозначал как SR — S- ожидания. Нужно, однако, различать оба вида ожиданий, поскольку в ситуации ново­го научения одно из них может ока­заться сформированным (выучено раньше или врождено, см. ниже закон предшествующего опыта).

В третьем законе, законе выполне­ния, речь идет о способах связи и поведенческих функциях обоих видов ожиданий, когда и то и другое ожида­ния выучены. В качестве модели, объясняющей эту связь, служит про-стое логическое умозаключение (сил­логизм): если есть S*—S* и R —S*, то я могу достичь S *, как только при наличии S осуществлю R. Специаль­ного экспериментального анализа за­служивает вопрос о степени диффе­ренцированности и сложности, до ко­торой могут довести силлогистиче­ские связи различные виды живых существ (или отдельные особи). Во всяком случае, запуск поведения и управление им, как показывают дан­ные по латентному научению, основа­ны на более сложных процессах, чем простые сочетания S — R. В когнитив­ной теории за основу поведения бе­рутся более сложные процессы. Тол-мен, например, объяснял целенаправ­ленность выполняющихся действий при помощи такого образа, как считы­вание «когнитивной карты».

^ Четвертый закон предшествующего опыта рассматривает те врожденные или выученные ранее ожидания обоих видов, которые живое существо прив­носит в новую ситуацию и которые могут в ней преобладать. Этот закон объясняет отсутствие в некоторых случаях эффекта осуществляемого экспериментатором подкрепления, например в случае с енотом Брелан-дов, когда так и не преодолевались видовые способы отыскания пищи. Предшествующий опыт устанавливает для каждого вида свои границы на­учения. У млекопитающих, например у крыс, эти границы обнаруживаются очень скоро вторжением видоспеци-фических реакций при отсрочивании подкрепления.

И наконец, пятый закон Боллс сформулировал как закон мотивации:


«Вероятность реакции возрастает (а) с увели­чением силы S — S'-ожидания; (Ь) силы R — S "-ожидания; (с) ценности S*» [R. С. Bolles, 1972, р. 405].


Мотивационный компонент всех де­терминантов заключен в S*, значи­мом, но еще не достигнутом целевом состоянии (или, когда S * представля­ет угрозу, в состоянии, которое, если оно наступило, должно быть измене­но, а если только может наступить, его следует избежать).

S* как ценность целевого события эквивалентна левиновской валентно­сти и толменовской нужности цели. S* зависит от состояния потребности, что соответствует халловской D и левиновскому t. S — S *-ожидания то­го, что ситуация приведет к целевым объектам или событиям, есть эквива­лент левиновской структуры жизнен­ного пространства и халловской К. R — S* направляет поведение, если S — S* дано, у Левина это соответ­ствует избранному способу действия, у Толмена—ожиданию соотношения средств и целей, у Халла — понимаемой чисто ассоциативно при­вычке.

Сила или вероятность наступления того или иного действия в модели Боллса определяется мультиплика­тивной связью всех трех детерминан­тов. Как мы увидим, концепцию Боллса безоговорочно следует отне­сти к классу теорий «ожидаемой цен­ности», даже если она и возникла в рамках других исследовательских на­правлений (см. об этом ниже). Новым в ней является введение двух детер­минантов: S — S*- и R — S'-ожиданий. Они различаются по тому, наступает ли представляющее ценность целевое событие само (S — S*), или для этого необходимы действия субъекта (R — S*) и какова вероятность того и другого. Мы еще увидим (гл. 10), что это различие становится основопола­гающим при приписывании причины (каузальной атрибуции) эффектам действия. Приписывание причин ре­шающим образом влияет на феноме­ны мотивации (см. гл. 11).

А как же сочетания S — R, разве они уже не играют никакой роли? По Боллсу, они сохраняют свое значение в двух случаях: (1) во врожденных образцах действия, инстинктах в это-логическом смысле; (2) в выученном поведении, когда речь идет об авто­матизированных привычках выполне­ния и о навыках. В заключение оста­ется сказать, что модель Боллса должна еще разрабатываться во мно­гих отношениях. Связи между теоре­тическими конструктами подлежат уточнению, в особенности следует уточнить условия соответствия S — S* и R — S*. Теоретические кон­структы нуждаются в операциональ­ном определении. Только их количе­ственная заданность сделает возмож­ным экспериментальное подтвержде­ние предсказаний.


^ Квазифизиологическая модель мотивации привлекательностью Биндры


Биндра [D. Bindra, 1974; 1969] предложил модель, во многом схо­жую с моделью Боллса. Он также отверг постулат теории S — R о под­креплении реакций. Аргументируя свою точку зрения, он указывает на то, что научение может происходить и тогда, когда осуществление реакций невозможно. Эксперимент, доказы­вавший это, заключался в следу­ющем. Животные видят привлека­тельный объект, но не могут на него реагировать, находясь под действием кураре (кураре — яд органического происхождения, который временно блокирует нервно-мышечную переда­чу). Как только действие яда прекра­щается, научение этих животных де­лает значительный скачок [см.: Е. Та-ub, A. J. Berman, 1968]. Серьезный удар постулату подкрепления реак­ции нанесло также интенсивно иссле­дуемое в 70-е гг. научение через под­ражание. Достаточно простого наблю­дения модели, чтобы сразу овладеть совершенно новым способом поведе­ния; естественно, что наблюдающий при этом не получает никакого под­крепления [см.: A. Bandura, 1971a].

В модели Биндры R — S "-ожидания не предусматриваются, так как он считает их сводимыми к ожиданиям типа S — S*, поскольку «вырабатыва­емая специфическая форма реакции представляет собой спонтанную кон­струкцию, образуемую из наличного состояния мотивации и простран­ственно-временного распределения различных дистальных и контактных стимулов, указывающих на привлека­тельный характер ситуации» [D. Bindra, 1974, р. 199].

Эти реакции напоминают локомо-цию в жизненном пространстве, кото­рая, по Левину, свободно следует наличным силам и предоставляемым полем возможностям действия. Боллс [R. С. Bolles, 1972, р. 406] сомневает­ся в правомерности отрицания суще­ствования особых R — S'-ожиданий, потому что в таком случае осуще­ствляемые реакции оказались бы слишком сильно связанными с пове­денческим репертуаром данного со­стояния мотивации, а это противоре­чит гибкости поведения многих мле­копитающих, и тем более человека. За исключением этого расхождения основные позиции обоих авторов очень близки, но модель Биндры во многих отношениях разработана бо­лее детально, к тому же с привлече­нием физиологических данных.





Рис. 5.16. Модель Биндры процесса мотивации, влияющего на три различных вида реакций. В качестве примера взято необусловливаемое поведение (поиск корма)


Согласно Биндре, мотивация детер­минируется не состоянием потребности организма или требовательными характеристиками внешних раздражи­телей, а взаимодействием обоих фак­торов, определяющих центральное со­стояние мотива, как его обозначил еще Морган [С. Т. Morgan, 1943]. Во временном отношении управление осуществляется привлекательными объектами окружения. Они возбужда­ют центральное состояние мотива в той мере, в какой готовность к этому уже имеется (например, с ними согла­суются проприоцептивные указатель­ные раздражители, или вообще нет никакой готовности центрального со­стояния мотива). Центральное состо­яние мотива оказывает, прежде все­го, общее активирующее и стимулиру­ющее воздействие на все способству­ющие поисковому (или уклоняющему­ся) поведению сенсомоторные функции. Оно одновременно влияет на автономные телесные функции (та­кие, как выделение слюны при поис­ке еды) и усиливает репрезентацию привлекательного объекта среди центральных репрезентаций (в мозге) других объектов, как фигуру на фоне. Таким образом, речь идет о как бы взаимном усилении выраженности центральной когнитивной репрезента­цией целевого объекта и центрально­го состояния мотива.

Изменение поведения (научение) происходит при центральной репре­зентации сочетаемости ситуационных стимулов и стимулов привлекательно­сти. Нейтральные до тех пор ситуаци­онные стимулы превращаются в сиг­налы, обусловливающие привлека­тельность. Рисунок 5.16 дает пред­ставление об этой модели. Стрелки обозначают переход от доступных на­блюдению событий к недоступным наблюдению (гипотетическим) процес­сам; заканчивающиеся развилкой ли­нии представляют процессы, происхо­дящие между гипотетическими пере­менными. Биндра различает три вида реакций: инструментальные (поиск и избегание), консумматорные (все, что делается в контакте с целевым объ­ектом) и регуляторные (организмиче-ские реакции, такие, как секреция желёз). С помощью своей модели Биндра смог объяснить ряд феноме­нов, не поддающихся интерпретации в теории подкрепляемого научения.