Ученье свет, а неученье тьма народная мудрость

Вид материалаДокументы
Подобный материал:
1   ...   14   15   16   17   18   19   20   21   ...   37
201

остальных элементов оказывается менее эффективной. В доказательство своей точки зрения Канеман продемонстрировал существование эффек­та суффикса в зрительной модальности (см. 4.2.2).

Второе направление связано с анализом собственно феноменов па­мяти. Центральным при этом становится анализ кратковременной, или, в современной терминологии, рабочей памяти. Рабочая память со­держит целый ряд служебных компонентов, в том числе относительно пассивное фонологическое хранилище (см. подробно 5.2.3). Это послед­нее фиксирует продукты перцептивного анализа речи и оказывается более продолжительным (до нескольких секунд), чем гипотетический слуховой сенсорный регистр, или эхоическая память. По-видимому, су­ществование подобного фонологического хранилища, специализиро­ванного на поддержке процессов речевой обработки, и позволяет нам в ответ на справедливый упрек «Да ты меня просто не слушаешь!» прак­тически всегда достаточно успешно воспроизвести последнее из того, что сказал наш собеседник.

3.2.3 Микрогенез как альтернатива

Чтобы подойти к объяснению фактов, на которых основано предполо­жение о существовании иконической памяти, полезно обратиться к ра­ботам ученика Вундта и одного из основателей экспериментальной пси­хологии в России, профессора Одесского университета Николая Николаевича Ланге (1858—1921). В 1892 году им была опубликована ра­бота «Закон перцепции». Исходя из своих наблюдений с тахистоскопи-ческим показом изображений предметов, он описывает восприятие как процесс микрогенетического развития: «Процесс всякого восприятия состоит в чрезвычайно быстрой смене целого ряда моментов или ступе­ней, причем каждая предыдущая ступень представляет психическое со­стояние менее конкретного, более общего характера, а каждая следую­щая — более частного и дифференцированного» (Ланге, 1893, с. 3). Восприятие трактуется здесь как развернутый во времени процесс, а не моментальный, постепенно растворяющийся в воздухе снимок.

Можно ли операционализировать эту интерпретацию, сделав ее экс­периментально проверяемой? Один из таких подходов состоит в анализе зависимости «сенсорной инерции» от времени, прошедшего с момента предъявления стимула (stimulus onset asynchrony, SOA — асинхронность включения стимулов, ABC) и с момента его выключения (interstimulus interval, /57 — интерстимульный интервал, ИСИ). Микрогенез начинается в момент предъявления информации и поэтому должен быть связан с па­раметром асинхронности включения. Напротив, в случае эффектов сенсор­ной памяти решающее значение должен иметь интерстимульный интер­вал, так как инерция зрения (или слуха) просто увеличивает эффективную 202 продолжительность стимула после его физического окончания.

Имеющиеся данные дают однозначный ответ — как слуховые (см. выше 3.2.2), так и зрительные сенсорные эффекты определяются време­нем, прошедшим с момента включения стимула. В частности, канадским психологом Винцентом Ди Лолло (Di Lollo & Wilson, 1978) было показа­но, что возможность перцептивной интеграции зрительных конфигура­ций зависит от параметра ABC, a не от интерстимульного интервала. Он последовательно предъявлял своим испытуемым две матрицы 5x5, кото­рые при физическом наложении образовывали полную матрицу с одной пустой ячейкой (рис. 3.10). Задача заключалась в обнаружении этой ячейки при различных комбинациях длительности предъявления и ве­личины интерстимульного интервала. Когда время экспозиции первого изображения превышало 100—120 мс, то даже при интервале 10 мс не происходила суммация изображений — испытуемые не могли указать пустую ячейку. Если бы «иконическая память» на самом деле была па­мятью, то есть в известном смысле «следом стимуляции», ее продолжи­тельности с избытком должно было бы хватить для заполнения столь короткого интервала. Напротив, естественно предположить, что в пер­вые 100 мс после предъявления объект просто еще не воспринят как не­которое устойчивое и оформленное целое и всякая поступающая ин­формация легко интегрируется с ним.













первая матрица

вторая матрица


отсутствующая ячейка

комбинация

Рис. 3.10. Псевдослучайные матрицы, используемые для изучения зрительной интегра­ции: при наложении они образуют заполненную матрицу с одной пропущенной ячейкой. 203

Рассмотрим второй тезис Ланге, согласно которому актуальное раз­витие восприятия обнаруживает несколько «моментов или ступеней» в направлении от общих к более дифференцированным «психическим со­стояниям». К началу когнитивной революции взгляды Ланге и последу­ющие работы лейпцигской школы гештальтпсихологии были успешно забыты. Но в 1970-е годы было выдвинуто несколько похожих предпо­ложений. В частности, нами была обоснована теория микрогенеза, со­гласно которой восприятие предмета начинается с его динамической локализации в трехмерном окружении, после чего происходит специ­фикация его общих очертаний и, наконец, инвариантное восприятие тонких внутренних деталей (Величковский, 1973; 1982а; Velichkovsky, 1982). Базовый цикл микрогенеза восприятия может занимать до 300 мс и требует, особенно в отношении анализа индивидуальных характерис­тик и деталей предметов, участия внимания (то есть осуществляется в режиме так называемого «фокального зрения» — см. 3.3.2 и 3.4.2).

С этой точки зрения, через треть секунды после предъявления зри­тельный образ предмета обычно лишь впервые формируется, а отнюдь не прекращает свое существование. Отмечавшиеся многими авторами систематические расхождения в различных оценках длительности ико­ны (см. 3.1.2) могли бы тогда объясняться тем, что методики изучения видимой инерции основаны на относительно простых задачах обнаруже­ния и локализации, требующих для своего завершения около 100 мс, тогда как выявляемая с помощью методики частичного отчета информа­ционная инерция предполагает возможность идентификации формы объектов, то есть занимает в общем случае порядка 300 мс18. Так называ­емое «сканирование информации из иконы» осуществляется по ходу формирования зрительного образа и принципиально приурочено к тому или иному его этапу (например, 100 или 300 мс) в зависимости от харак­тера требуемого от испытуемого ответа.

Столь же естественно объясняется в рамках микрогенетических представлений и маскировка. Она возникает из-за ошибочной специ­фикации маскирующего стимула вслед за правильной локализацией те­стового. Иными словами, речь идет о подмене объекта: предъявление тестового объекта быстро (в течение примерно 100 мс) локализуется как некоторое требующее нашего внимания событие, но когда мы перехо­дим затем к детальной спецификации его индивидуальных характерис­тик, таких как цвет и форма, то находим в соответствующей области ок­ружения уже другой объект, который и воспринимается нами вместо первого (Enns & Di Lollo, 2000). Это объяснение, предполагающее по­вторное обращение к объекту на более высоком уровне обработки, по-

18 Известные исключения лишь подтверждают это правило: в случае идентификации формы видимая инерционность, определяемая по величине критического интервала сум-мации или с помощью упоминавшейся выше методики «как верблюду пройти через иголь-204 ное ушко», возрастает до 300 мс (например, Kahneman & Norman, 1964).

зволяет понять целый ряд особенностей маскировки, например, почему даже в условиях жесткой маскировки, когда испытуемые утверждают, что совершенно не видят тестовый объект, они, тем не менее, способны различать (в ситуации вынужденного выбора) те пробы, в которых он был предъявлен, от тех, где он не предъявлялся (Pollack, 1972)19.

В рамках этих представлений удается объяснить результаты экспе­риментов по частичному отчету, не прибегая к понятию «иконическая память» (Величковский, 1977). Дело в том, что в когнитивной психоло­гии не рассматривалось скрытое допущение о равенстве времени вос­приятия материала матрицы и восприятия послеинструкции в методике частичного отчета. В большинстве таких экспериментов необходимо было воспринимать и воспроизводить довольно сложную фигуративную информацию, тогда как инструкция содержала простую пространствен­ную информацию. Восприятие послеинструкции, следовательно, могло значительно опережать восприятие релевантных для решения задачи аспектов матрицы. Учитывая хронометрические данные по быстрым оценкам местоположения и формы объектов (см. 3.1.3), можно ожидать, что такое опережение будет достигать 200 мс. За это время испытуемый может сконцентрировать свое внимание, эффективно настроившись на восприятие формы объектов в указанной части матрицы, но не в других ее частях. Последнее делает процедуру умножения результатов в мето­дике частичного отчета неправомерной.

Можно предположить, что если кодировать положение критических элементов матрицы с помощью фигуративных послеинструкции (то есть стимулов, отличающихся формой, а не пространственным положением), то всякие указания на иконическую память должны исчезнуть, точнее, «функция затухания иконы» должна сдвинуться в область положитель­ных задержек «послеинструкции». Это подтвердили эксперименты, про­веденные нами некоторое время назад совместно с М.С. Капицей (см. Величковский, 19826)20. Как видно из результатов этих экспериментов,

19 Первоначально маскировку объясняли как своеобразные гонки между двумя сти­
мулами, причем восприниматься должен тот стимул, который первым достигает блока
«сознательной репрезентации». С этой точки зрения, однако, совершенно непонятно,
почему обратная маскировка обычно выражена более сильно, чем прямая, иными сло­
вами, почему «в гонках» побеждает стимул, предъявляемый последним. Предложенная
двухуровневая модель объясняет это задержкой в подключении внимательного анализа,
направленного на спецификацию индивидуальных характеристик объектов. Данная мо­
дель является частным случаем уровневых объяснений восприятия, более подробно рас­
смотренных нами ниже (см. 3.4.2 и 8.4.3).

20 В экспериментах применялась методика частичного опознания со зрительной пос-
леинструкцией, похожая на методику экспериментов Авербаха и Корайлла (см. 3.2.1).
Кстати, практически полное совпадение результатов этих авторов и Сперлинга (исполь­
зовавшего не зрительную, а акустическую послеинструкцию) представляет собой про­
блему для гипотезы иконической памяти, так как объединение информации из икони-
ческой и эхоической памяти допускается в блочных моделях лишь на уровне кратковре­
менного хранилища. Напротив, с нашей точки зрения, процессы быстрой пространствен­
ной локализации принципиально имеют интермодальный характер. 205



-500 -300 -100 0 100 300 500

Асинхронность предъявления послеинструкции, мс
О пространственная инструкция Δ фигуративная инструкция

Рис. 3.11. Результаты экспериментов по частичному опознанию зрительных форм в за­висимости от характера инструкции, асинхронности ее предъявления и состояния тем-новой адаптации зрения (по: Величковский, 19826).

206

представленных на рис. 3.11, использование в качестве кода признака формы, а не пространственного положения приводит к тому, что для улучшения восприятия элементов предъявлять инструкцию действи­тельно приходится до показа самой матрицы.

Из представленных на этом рисунке графиков также видно, каким образом на успешность опознания влияет предварительная темновая адаптация зрения, способствующая появлению выраженных последова­тельных образов стимульных объектов. Темновая адаптация улучшает результаты, давая возможность «считывать» информацию с послеобраза, но она никак не меняет вид выявляемых зависимостей, в частности, тот факт, что кривые для пространственных и фигуративных инструкций сдвинуты относительно друг друга примерно на 200 мс. Это говорит об относительной независимости микрогенеза и механизмов возникнове­ния последовательных образов, а также о том, что сперлинговский эф­фект частичного отчета зависит прежде всего от параметров микрогене­за восприятия, а не от последействия сенсорной стимуляции, резко возрастающего в условиях темновой адаптации.

Обсуждая общенаучные основания исследования процессов акту­ального развития восприятия, нельзя не отметить их несомненную ро­мантическую основу: микрогенетические представления естественно

соотносятся с данными о развитии восприятия в фило- и онтогенезе, а также с результатами неиропсихологических и нейрофизиологических исследований (см. 1.4.1 и 3.4.2). Этот факт в полной мере подчеркивал еще H.H. Ланге: «Подобно тому как эмбриологическое развитие челове­ка повторяет в несколько месяцев те ступени, которые некогда проходи­ло общее развитие рода, так и индивидуальное восприятие повторяет в несколько десятых секунды те ступени, какие в течение миллионов лет развивались в общей эволюции животных» (Ланге, 1893, с. 3).

Гетерохронность (разновременность) различных аспектов микроге-неза зрительного восприятия подтверждается нейрофизиологическими данными, свидетельствующими о существовании быстрых и медленных каналов сенсорной переработки. Они отличаются рядом анатомических особенностей (отсюда одно из их названий: магноцеллюлярные, M — крупноклеточные и парвоцвллюлярныв, Ρ —- мелкоклеточные). В функ­циональном отношении эти механизмы также весьма различны. Кана­лы первого типа быстро отвечают на «размытую» информацию, наличие больших пятен, движение и появление объектов в широком поле зре­ния. Механизмы второго типа работают сравнительно медленно, реаги­руя на локальные перепады яркости, тонкие линии, другие мелкие дета­ли (Tovée, 1996).

На вопрос о том, достаточно ли этого разделения для описания микрогенеза, следует ответить отрицательно. Во-первых, не совсем ясны взаимоотношения между этими группами каналов. Обычно пред­полагается, что фазические каналы тормозят активность тонических21. В одном из обзоров процессов маскировки Бруно Брейтмейер (Breitmeyer, 1980), однако, приходит к выводу, что такое торможение является вза­имным. Иконические репрезентации этот автор идентифицирует с по­ложительными последовательными образами, причем, по его мнению, в процессах восприятия (в частности, при чтении) такие «иконы» могут лишь мешать восприятию деталей, а следовательно, должны активно

21 Взаимодействие фазических и тонических каналов служит основой распространен­
ного объяснения обратной маскировки и метаконтраста. Предполагается, что фазичес-
кий ответ на маскировочный стимул тормозит более поздний тонический ответ на предъяв­
ление тестового стимула (коррелятом этого ответа может быть описание деталей). Для
данного объяснения существенно, чтобы маскировочный стимул предъявлялся с соот­
ветствующей задержкой. В последнее время обнаружены условия, при которых это объяс­
нение не работает. Например, полная маскировка (метаконтраст) возникает и в том слу­
чае, когда маскировочный стимул предъявляется одновременно с тестовым и просто про­
должает оставаться в поле зрения после того, как тест-объект примерно через 100 мс ис­
чезает (Enns & Di Lollo, 2000). Этот вариант маскировки легко предсказывается описан­
ной выше (см. 3.1.3) двухуровневой моделью восприятия: 1) вначале происходит регист­
рация и локализация тестового и маскирующего стимулов как некоторого недифферен­
цированного события; 2) с задержкой порядка 100 мс начинаются процессы детальной
спецификации этого события, которые ведут к восприятию индивидуальных характерис­
тик одного лишь маскировочного стимула. 207

подавляться22. По-видимому, зрение действительно занимается «иконо­борчеством» — вывод, который предвидел уже Вундт. К тому же, разде­ление двух групп каналов связано, главным образом, с анализом сенсор­ной переработки в сетчатке и в первичных, затылочных отделах коры. Как мы увидим в дальнейшем (см. 3.4.2), восприятие вовлекает и другие структуры мозга, включающие различные субкортикальные области, а также ассоциативные зоны теменных и височных долей.

3.3 Распознавание конфигураций

3.3.1 Традиционные психологические подходы

Важнейшей функцией восприятия является распознавание зрительных и акустических конфигураций, ведущее, в частности, к узнаванию предме­тов и их категоризации, то есть отнесению к той или иной семантичес­кой категории. Проблема механизмов распознавания, или «распознава­ния образов», является одной из центральных для целого комплекса когнитивных наук: психологии, нейрофизиологии, искусственного ин­теллекта и нейроинформатики. В когнитивной психологии ей прямо или косвенно посвящены десятки монографий и сотни статей. В даль­нейшем мы будем многократно возвращаться к ее рассмотрению из пер­спективы исследований памяти и организации семантической инфор­мации (см., например, 5.1.1 и 6.1.2). Данный раздел посвящен сенсорно-перцептивным механизмам распознавания.

Элементарной предпосылкой того, что некоторый объект вообще будет опознан, является его выделение в качестве фигуры из окружаю­щего фона. Кроме того, при распознавании акцент лежит на индиви­дуальных признаках, таких как цвет поверхности и форма. Про­странственно-ситуативные признаки (положение в пространстве, ориентация, движение, освещенность) выполняют при распознавании скорее технические функции — чаще всего их параметры лишь учиты­ваются нами для того, чтобы дать инвариантную (константную) оценку индивидуальным признакам. Таким образом, можно сказать, что рас­познавание связано с относительно поздними стадиями восприятия, как бы «надстраивающимися» над процессами динамической простран­ственной локализации (см. 3.1.3).

22 Инерционность восприятия увеличивается при утомлении, когда ослаблены цент­ральные процессы контроля. Это проявляется в увеличении продолжительности после­довательных образов, усилении маскировки и снижении критической частоты слияния 208 мелькании (Леонова, 1984)

В последние годы были проведены систематические исследования законов перцептивной организации, направленные на выяснение при­роды влияющих на выделение фигуры из фона факторов и их взаимоот­ношений. При этом оказалось, что динамическая локализация в про­странстве служит наиболее фундаментальной основой для такого выделения. Если разные законы перцептивной организации (см. 1.3.1) конфликтуют между собой, «навязывая» разные варианты группировки видимых компонентов сцены, то победителем обычно оказывается фак­тор близости, причем близости в трехмерном пространстве, а не на сет­чатке. Закономерное движение стимулов в трехмерном пространстве также оказывается сильнейшим фактором перцептивной организации. Если пространственно-динамические факторы нейтральны (например, когда в статичной конфигурации расстояния между элементами равны между собой), то второй по силе группой факторов оказывается глобаль­ное сходство, определяемое такими признаками, как окраска, общая ориентация (для элементов, имеющих выраженную ориентацию) или размеры (зернистость). Только тогда, когда все эти факторы нейтрали­зованы, группировка начинает учитывать особенности и сходство соб­ственно формы элементов.





Рис. 3.12. Различение текстур (А) может быть противоположным по профилю простоты

и сложности различению формы (Б) образующих эти текстуры элементов. 209

Очевидное объяснение этих зависимостей состоит в том, что воспри­ятие формы предполагает анализ уже выделенных из фона объектов, тог­да как группировка основана на глобальной оценке сходства без предва­рительного восприятия формы образующих текстуру элементов. Эти два процесса не просто различны, но часто противоположны по чувстви­тельности к отдельным признакам объектов. Так, хотя буквы «L» и «Т» явно отличаются по форме, образованные из них текстуры лишь с тру­дом отличаются друг от друга (см. рис. 3.12 справа). Напротив, неболь­шие вариации в наклоне «Т» практически не замечаются нами при узна­вании, однако они служат хорошей основой для дифференциации соответствующих текстур (рис. 3.12 слева).



Особенно важную роль в распознавании играют именно процессы спецификации и распознавания формы. Как особая, требующая специ­ального изучения проблема восприятие формы длительное время не осознавалась представителями «импрессионистической» (Эрнст Мах) ассоциативной психологии. Гештальтпсихологи считали восприятие формы первичным фактом восприятия, подчеркивая его «вещный», или предметный, характер. Если тезис о первичности восприятия фор­мы вызывает сегодня — на основании представленных выше данных о микрогенезе — обоснованные сомнения, то предметность действитель­но представляется весьма важной характеристикой этого класса пер­цептивных процессов, к обсуждению которой мы еше вернемся в кон­це этого раздела (см. 3.3.3).

В психологических подходах последних десятилетий центральное место занимают формальные теории описания структуры перцептив­ных конфигураций. Речь идет о синтаксическом подходе: сначала вы­деляются отдельные элементы (признаки), из которых по определен­ным правилам (грамматикам) строится перцептивное описание конфигурации. Фактически в основу этого подхода положена более ранняя идея Дональда М. Маккая (МасКау, 1950), согласно которой перцептивная сложность (информативность) конфигурации определя­ется числом операций, осуществляемых перцептивной системой для ее спецификации (см. 2.1.3). Но характер этих элементов и операций над ними по-прежнему остается не вполне ясен23. Одна из наиболее инте­ресных теорий такого рода развивается голландским психологом Э. Ле-венбергом и его коллегами (Leeuwenberg, 1978). Модель постулирует повторения, зеркальные отображения и другие избыточные операции с разными элементами конфигураций, иногда осуществляемые в итера­тивном (повторном) режиме, то есть в ходе нескольких последователь­ных обращений к продуктам процесса кодирования.

Оценка сложности различных перцептивных интерпретаций ис­пользуется для объяснения множества эффектов. Так, можно задать вопрос, почему на рис. 3.1 ЗА мы всегда видим два пересекающихся квадрата, хотя теоретически возможны и альтернативные варианты, ча­стично указанные в нижнем ряду. Ответ связан с относительной про­стотой процесса конструирования квадрата, для которого нужно по­вторное использование лишь двух элементов — отрезка фиксированной

21 Джулиан Хохберг следующим образом характеризует эти исследования1 «На физио­логическом и психофизическом уровнях идет лихорадочный поиск элементов сенсорно­го анализа (которые учитель Гельмгольца Иоханнес Мюллер назвал "специфическими энергиями органов чувств") и есть упоминания ментальных структур, к которым эти эле­менты должны относиться... Но если Титченер когда-то заявил, что небольшой (по се­годняшним масштабам) финансовой поддержки и пары лет работы было бы достаточно, чтобы поставить все точки над / и черточки на t его варианта ассоцианистской теории, ..мне что-то не приходилось слышать таких оптимистичных заявлений в последнее вре-210 мя» (Hochberg, 1979, ρ 138).







Потенциальные интерпретации













Прозрачность
низкая высокая













Рис. 3.13. Примеры влияния фигуративной сложности на восприятие: А. Однозначность восприятия потенциально многозначной конфигурации; Б. Эффект глубины в плоском изображении; В. Феноменальная прозрачность.

длины и угла 90°. При других интерпретациях число элементов и раз­нообразие операций с ними возрастает. Точно так же на рис. 3.1 ЗБ нами воспринимается, казалось бы, очень сложная трехмерная конструкция, а не плоский, нанесенный на поверхность узор. В действительности, с учетом высокой избыточности компонентов (они показаны справа), трехмерная интерпретация оказывается более простой, чем двумерная, требующая спецификации множества отличающихся по ряду парамет­ров элементов. Наконец, на рис. 3.13В слева мы видим плоский двумер­ный паттерн, тогда как справа похожая с точки зрения физических при-

211

знаков конфигурация распадается на две, причем та из них, которая лежит «сверху», к тому же оказывается феноменально прозрачной, позво­ляющей видеть детали, лежащие «внизу». Мы предоставляем читателю возможность объяснить этот феномен по аналогии с объяснениями, данными выше24. Несколько иной подход будет рассмотрен нами в кон­це данной главы (см. 3.4.1).

В когнитивной психологии существует несколько групп моделей, или теорий распознавания. Только что рассмотренные формальные те­ории восприятия формы служат хорошим введением в эту проблемати­ку. Дело в том, что наиболее распространенными в настоящее время являются теории признаков и структурные теории распознавания. Фактически они дополняют друг друга: признаки понимаются как ис­ходные элементы, а структурные теории — как правила их объединения. Возникающие «описания» сравниваются с хранящимися в памяти реп­резентациями (эталонами), и в случае совпадения происходит ассоциа­тивная активация соответствующих узлов или областей семантической памяти. Хотя мы часто ориентируемся на отдельные признаки, особен­но при поиске хорошо знакомых объектов, узнавание может происхо­дить и на основании их более целостных комбинаций, как это подчер­кивали гештальтпсихологи.

В силу их чрезвычайной значимости детальной классификации были подвергнуты речевые признаки, различающие отдельные буквы и, при акустическом предъявлении, фонемы (см. подробнее 7.1.1). Один из ос­новных признаков, различающих фонемы, называется местом артику­ляции, то есть местом перекрытия гортани при произнесении звука: подъемом задней части языка к нёбу, прикосновением языка к губам или соединением губ. Оказалось, что когда в психоакустических экспери­ментах на одно ухо подается звонкая согласная с так называемым пе­редним местом артикуляции [Ь] и одновременно на другое — глухая со­гласная со средним положением артикуляции [t], то ошибки часто комбинируют эти признаки — [р] и [d] слышатся чаще, чем [q] и [к], воз­можно, потому, что глухость (звонкость) сочетаются здесь с передним (либо, наоборот, более задним) положением места артикуляции. Однако такого рода аргументация наталкивается на трудности. Прежде всего, физические признаки фонем не остаются постоянными и меняются в зависимости от контекста. Далее, восприятие речи вполне возможно в

24 Данный подход можно легко распространить на слуховое восприятия. Один из ре­зультатов изучения избирательного восприятия речи («проблема вечеринки» — см. 2.2.1) состоит в том, что понимание релевантного речевого сообщения на фоне шума определя­ется возможностью его дифференциального описания в терминах локализации, громко­сти, тональности и тембра голоса собеседника. Если при восприятии музыки предъявля­ются короткие и сильные сигналы, замещающие участки мелодии, то последняя воспри­нимается непрерывной с тем большей вероятностью, чем меньше сходство ее ритмичес­кого рисунка с ритмом последовательности шумов. Иными словами, различие перцеп­тивных описаний шумовых сигналов и мелодии делает шум акустически «прозрачным» 212 (Bregman, 1990).

условиях, исключающих использование традиционных фонематических признаков (например, Remez, Rubin, Pisoni & Carrell, 1981).

Стивен Лупкер (Lupker, 1979) проверил гипотезу, согласно которой восприятие букв при чтении основано на выделении признаков. Ни одна из признаковых моделей при этом не подтвердилась. Напротив, данные хорошо описывались моделью микрогенетического типа — восприятие локальных особенностей букв начинало играть некоторую роль в их раз­личении лишь после восприятия обобщенных очертаний. Эксперимен­ты с маскировкой слов также показали, что она оказывается особенно сильной, если в качестве маски используются буквы, а не их фрагмен­ты. Это говорит о том, что репрезентация букв может быть наиболее дробным слоем анализа. Существенную роль в распознавании букв иг­рает контекст — распознавание резко улучшается, если этот контекст представляет собой осмысленное слово или, по крайней мере, произ­носимое псевдослово (см. ниже классический эффект превосходства слова — 7.2.1). Эта закономерность играет особенно большую роль в рас­познавании рукописного текста, когда один и тот же графический знак уверенно воспринимается как разные буквы (например, «А» или «Н») в зависимости от контекста.

Вторую группу теорий распознавания образуют так называемые теории шаблонов. Они предполагают наличие в памяти целостных реп­резентаций, с которыми сравниваются столь же целостные перцептив­ные описания предметов и событий. Идея целостного сравнения под­тверждается многочисленными результатами, свидетельствующими об ускорении опознания в случае общего перцептивного сходства тестово­го и эталонного объектов, а также данными Р. Шепарда и его коллег (на­пример, Shepard & Podgorny, 1978) по мысленному вращению и другим пространственным трансформациям зрительных образов объектов в процессах узнавания (см. подробно 5.3.1 и 6.3.1).

Споры вызывает, впрочем, вопрос о степени абстрактности подобных целостных репрезентаций. Первоначально преобладало мнение, что их детальность, или конкретность, зависит от времени, прошедшего с мо­мента восприятия. Считалось, что при очень коротких интервалах срав­ниваются детальные репрезентации, удерживаемые в иконической и эхоической памяти, так что распознавание зависит здесь от более или менее точного пространственного (зрение) и временного (слух) наложе­ния конфигураций. Рассмотренные нами выше данные (см. 3.2.1 и 3.2.2), а также эксперименты на так называемую транссаккадическую память (Irwin, 1996) показывают, что уже через сотые доли секунды пос­ле исчезновения изображения или смены точки фиксации в рабочей па­мяти сохраняется лишь относительно абстрактное описание одного-двух воспринятых объектов.

Несмотря на эту сравнительно обедненную постперцептивную ин­формацию, наша память, несомненно, умудряется строить детальные и разнообразные долговременные репрезентации осмысленных предмет­ных сцен. Эти репрезентации, например, оказываются достаточными для „. „

успешного узнавания тысяч видовых слайдов через недели после их од­нократного показа (Standing, 1973). Важным условием при этом явля­ются целостность и предметная правдоподобность — полностью абст­рактные изображения и предметные сцены, поставленные «на голову» или расчлененные на несколько переставленных кусков, не обнаружи­вают и доли успешности узнавания экологически естественного мате­риала. Интересно, что узнавание предметных сцен оказывается весьма успешным при повороте изображений относительно вертикали, не на­рушающем законы гравитации (Величковский, 19826). Это свидетель­ствует о целостности процессов сравнения, которые явно не сводятся к поэлементному совмещению тестовой сцены и репрезентаций памя­ти (см. 5.2.1). В конце этого раздела мы рассмотрим новые работы, вы­являющие особенности восприятия интактных предметных сцен, кото­рые, по-видимому, объясняют также и их последующее успешное узнавание (см. 3.3 3).

К группе теорий, допускающих возможность целостного сравне­ния, примыкают теории прототипов, согласно которым при ознаком­лении с элементами некоторого множества испытуемый постепенно выделяет одну или более центральных тенденций — прототипов. По от­ношению к ним и решается вопрос о принадлежности конкретного объекта к данному множеству. С существованием границ между класса­ми объектов, тяготеющим к разным прототипам, связываются обычно эффекты категориального восприятия — два незначительно различаю­щихся в отношении физических признаков объекта, которые попадают в разные классы (категории), кажутся более разными, чем объективно более различающиеся объекты, попадающие в одну и ту же категорию. Соответственно, во втором случае можно ожидать более быстрое узна­вание различных объектов как одинаковых. Такие эффекты обнаруже­ны при восприятии фонем, назывании оттенков цвета, идентификации сложных зрительных форм и т.д. (см. 7.1.1). Формирование прототипов не сводится к абстрагированию признаков, так как можно подобрать множество объектов, не обладающих признаками будущего прототипа — в отношении различительных признаков прототип будет находиться «между» конкретными образцами.

Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для част­ных случаев, например, упоминавшейся выше походки (см. 3.1.2). Осо­бенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмо­циональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выраже­ния, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц.



Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ори­ентации, а затем в нормальном и снова в перевернутом положении

Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спе­цификой деталей. В отличие от восприятия обычных предметов и объек­тов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей сте­пени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изме­нение диаметра зрачка обычно не воспринимается как таковое, а интер­претируется глобально, скажем, как увеличение привлекательности. Це­лостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображе­ния на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.

Зависимость восприятия «внутренней геометрии» лица от его ори­ентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215

можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не ме­нее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозго­вого картирования, эти формы восприятия, по-видимому, преимуще­ственно связаны с нижневисочными отделами правого полушария.

В нижневисочных отделах коры тоже локализуются процессы, су­щественные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы вос­приятия формы объектов и как это связано с межполушарными разли­чиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные меха­низмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработ­ке формы и узнавании повседневных предметов Однако они не вовле­чены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это пред­варительное объяснение подтверждается, в частности, анализом основ­ных синдромов дислексии — нарушения чтения при локальных пора­жениях мозга (см 7 2 2)

3.3.2 Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опира­ются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизи­ологии, нейропсихологии и нейроинформатики. Начало переориента­ции психологических описаний восприятия на физиологическую тер­минологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую изве­стность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды амери­канская исследовательница восприятия Науми Уайсстейн)

Эти данные, полученные при изучении зрительной системы кура-

ризированных кошек, были использованы в дальнейшем для моделиро-

216 вания различных аспектов зрительного восприятия. Если нейроны вы-

деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Мате­матическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отне­сением участков, ограниченных контурами, к одним и тем же или к раз­ным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некото­рое сочетание детекции пространственных частот и ориентации Участ­ки гладких поверхностей moi ут моделироваться путем выделения оваль­ных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).

На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ