Ученье свет, а неученье тьма народная мудрость

Вид материала

Подобный материал:

1 ... 14 15 16 17 18 19 20 21 ... 37

201

остальных элементов оказывается менее эффективной. В доказательство своей точки зрения Канеман продемонстрировал существование эффекта суффикса в зрительной модальности (см. 4.2.2).

Второе направление связано с анализом собственно феноменов памяти. Центральным при этом становится анализ кратковременной, или, в современной терминологии, рабочей памяти. Рабочая память содержит целый ряд служебных компонентов, в том числе относительно пассивное фонологическое хранилище (см. подробно 5.2.3). Это последнее фиксирует продукты перцептивного анализа речи и оказывается более продолжительным (до нескольких секунд), чем гипотетический слуховой сенсорный регистр, или эхоическая память. По-видимому, существование подобного фонологического хранилища, специализированного на поддержке процессов речевой обработки, и позволяет нам в ответ на справедливый упрек «Да ты меня просто не слушаешь!» практически всегда достаточно успешно воспроизвести последнее из того, что сказал наш собеседник.

3.2.3 Микрогенез как альтернатива

Чтобы подойти к объяснению фактов, на которых основано предположение о существовании иконической памяти, полезно обратиться к работам ученика Вундта и одного из основателей экспериментальной психологии в России, профессора Одесского университета Николая Николаевича Ланге (1858—1921). В 1892 году им была опубликована работа «Закон перцепции». Исходя из своих наблюдений с тахистоскопи-ческим показом изображений предметов, он описывает восприятие как процесс микрогенетического развития: «Процесс всякого восприятия состоит в чрезвычайно быстрой смене целого ряда моментов или ступеней, причем каждая предыдущая ступень представляет психическое состояние менее конкретного, более общего характера, а каждая следующая — более частного и дифференцированного» (Ланге, 1893, с. 3). Восприятие трактуется здесь как развернутый во времени процесс, а не моментальный, постепенно растворяющийся в воздухе снимок.

Можно ли операционализировать эту интерпретацию, сделав ее экспериментально проверяемой? Один из таких подходов состоит в анализе зависимости «сенсорной инерции» от времени, прошедшего с момента предъявления стимула (stimulus onset asynchrony, SOA — асинхронность включения стимулов, ABC) и с момента его выключения (interstimulus interval, /57 — интерстимульный интервал, ИСИ). Микрогенез начинается в момент предъявления информации и поэтому должен быть связан с параметром асинхронности включения. Напротив, в случае эффектов сенсорной памяти решающее значение должен иметь интерстимульный интервал, так как инерция зрения (или слуха) просто увеличивает эффективную 202 продолжительность стимула после его физического окончания.

Имеющиеся данные дают однозначный ответ — как слуховые (см. выше 3.2.2), так и зрительные сенсорные эффекты определяются временем, прошедшим с момента включения стимула. В частности, канадским психологом Винцентом Ди Лолло (Di Lollo & Wilson, 1978) было показано, что возможность перцептивной интеграции зрительных конфигураций зависит от параметра ABC, a не от интерстимульного интервала. Он последовательно предъявлял своим испытуемым две матрицы 5x5, которые при физическом наложении образовывали полную матрицу с одной пустой ячейкой (рис. 3.10). Задача заключалась в обнаружении этой ячейки при различных комбинациях длительности предъявления и величины интерстимульного интервала. Когда время экспозиции первого изображения превышало 100—120 мс, то даже при интервале 10 мс не происходила суммация изображений — испытуемые не могли указать пустую ячейку. Если бы «иконическая память» на самом деле была памятью, то есть в известном смысле «следом стимуляции», ее продолжительности с избытком должно было бы хватить для заполнения столь короткого интервала. Напротив, естественно предположить, что в первые 100 мс после предъявления объект просто еще не воспринят как некоторое устойчивое и оформленное целое и всякая поступающая информация легко интегрируется с ним.

первая матрица

вторая матрица

отсутствующая ячейка

комбинация

Рис. 3.10. Псевдослучайные матрицы, используемые для изучения зрительной интеграции: при наложении они образуют заполненную матрицу с одной пропущенной ячейкой. 203

Рассмотрим второй тезис Ланге, согласно которому актуальное развитие восприятия обнаруживает несколько «моментов или ступеней» в направлении от общих к более дифференцированным «психическим состояниям». К началу когнитивной революции взгляды Ланге и последующие работы лейпцигской школы гештальтпсихологии были успешно забыты. Но в 1970-е годы было выдвинуто несколько похожих предположений. В частности, нами была обоснована теория микрогенеза, согласно которой восприятие предмета начинается с его динамической локализации в трехмерном окружении, после чего происходит спецификация его общих очертаний и, наконец, инвариантное восприятие тонких внутренних деталей (Величковский, 1973; 1982а; Velichkovsky, 1982). Базовый цикл микрогенеза восприятия может занимать до 300 мс и требует, особенно в отношении анализа индивидуальных характеристик и деталей предметов, участия внимания (то есть осуществляется в режиме так называемого «фокального зрения» — см. 3.3.2 и 3.4.2).

С этой точки зрения, через треть секунды после предъявления зрительный образ предмета обычно лишь впервые формируется, а отнюдь не прекращает свое существование. Отмечавшиеся многими авторами систематические расхождения в различных оценках длительности иконы (см. 3.1.2) могли бы тогда объясняться тем, что методики изучения видимой инерции основаны на относительно простых задачах обнаружения и локализации, требующих для своего завершения около 100 мс, тогда как выявляемая с помощью методики частичного отчета информационная инерция предполагает возможность идентификации формы объектов, то есть занимает в общем случае порядка 300 мс¹⁸. Так называемое «сканирование информации из иконы» осуществляется по ходу формирования зрительного образа и принципиально приурочено к тому или иному его этапу (например, 100 или 300 мс) в зависимости от характера требуемого от испытуемого ответа.

Столь же естественно объясняется в рамках микрогенетических представлений и маскировка. Она возникает из-за ошибочной спецификации маскирующего стимула вслед за правильной локализацией тестового. Иными словами, речь идет о подмене объекта: предъявление тестового объекта быстро (в течение примерно 100 мс) локализуется как некоторое требующее нашего внимания событие, но когда мы переходим затем к детальной спецификации его индивидуальных характеристик, таких как цвет и форма, то находим в соответствующей области окружения уже другой объект, который и воспринимается нами вместо первого (Enns & Di Lollo, 2000). Это объяснение, предполагающее повторное обращение к объекту на более высоком уровне обработки, по-

¹⁸ Известные исключения лишь подтверждают это правило: в случае идентификации формы видимая инерционность, определяемая по величине критического интервала сум-мации или с помощью упоминавшейся выше методики «как верблюду пройти через иголь-204 ное ушко», возрастает до 300 мс (например, Kahneman & Norman, 1964).

зволяет понять целый ряд особенностей маскировки, например, почему даже в условиях жесткой маскировки, когда испытуемые утверждают, что совершенно не видят тестовый объект, они, тем не менее, способны различать (в ситуации вынужденного выбора) те пробы, в которых он был предъявлен, от тех, где он не предъявлялся (Pollack, 1972)¹⁹.

В рамках этих представлений удается объяснить результаты экспериментов по частичному отчету, не прибегая к понятию «иконическая память» (Величковский, 1977). Дело в том, что в когнитивной психологии не рассматривалось скрытое допущение о равенстве времени восприятия материала матрицы и восприятия послеинструкции в методике частичного отчета. В большинстве таких экспериментов необходимо было воспринимать и воспроизводить довольно сложную фигуративную информацию, тогда как инструкция содержала простую пространственную информацию. Восприятие послеинструкции, следовательно, могло значительно опережать восприятие релевантных для решения задачи аспектов матрицы. Учитывая хронометрические данные по быстрым оценкам местоположения и формы объектов (см. 3.1.3), можно ожидать, что такое опережение будет достигать 200 мс. За это время испытуемый может сконцентрировать свое внимание, эффективно настроившись на восприятие формы объектов в указанной части матрицы, но не в других ее частях. Последнее делает процедуру умножения результатов в методике частичного отчета неправомерной.

Можно предположить, что если кодировать положение критических элементов матрицы с помощью фигуративных послеинструкции (то есть стимулов, отличающихся формой, а не пространственным положением), то всякие указания на иконическую память должны исчезнуть, точнее, «функция затухания иконы» должна сдвинуться в область положительных задержек «послеинструкции». Это подтвердили эксперименты, проведенные нами некоторое время назад совместно с М.С. Капицей (см. Величковский, 19826)²⁰. Как видно из результатов этих экспериментов,

¹⁹Первоначально маскировку объясняли как своеобразные гонки между двумя сти
мулами, причем восприниматься должен тот стимул, который первым достигает блока
«сознательной репрезентации». С этой точки зрения, однако, совершенно непонятно,
почему обратная маскировка обычно выражена более сильно, чем прямая, иными сло
вами, почему «в гонках» побеждает стимул, предъявляемый последним. Предложенная
двухуровневая модель объясняет это задержкой в подключении внимательного анализа,
направленного на спецификацию индивидуальных характеристик объектов. Данная мо
дель является частным случаем уровневых объяснений восприятия, более подробно рас
смотренных нами ниже (см. 3.4.2 и 8.4.3).

²⁰В экспериментах применялась методика частичного опознания со зрительной пос-
леинструкцией, похожая на методику экспериментов Авербаха и Корайлла (см. 3.2.1).
Кстати, практически полное совпадение результатов этих авторов и Сперлинга (исполь
зовавшего не зрительную, а акустическую послеинструкцию) представляет собой про
блему для гипотезы иконической памяти, так как объединение информации из икони-
ческой и эхоической памяти допускается в блочных моделях лишь на уровне кратковре
менного хранилища. Напротив, с нашей точки зрения, процессы быстрой пространствен
ной локализации принципиально имеют интермодальный характер. 205

-500 -300 -100 0 100 300 500

Асинхронность предъявления послеинструкции, мс
О пространственная инструкция Δ фигуративная инструкция

Рис. 3.11. Результаты экспериментов по частичному опознанию зрительных форм в зависимости от характера инструкции, асинхронности ее предъявления и состояния тем-новой адаптации зрения (по: Величковский, 19826).

206

представленных на рис. 3.11, использование в качестве кода признака формы, а не пространственного положения приводит к тому, что для улучшения восприятия элементов предъявлять инструкцию действительно приходится до показа самой матрицы.

Из представленных на этом рисунке графиков также видно, каким образом на успешность опознания влияет предварительная темновая адаптация зрения, способствующая появлению выраженных последовательных образов стимульных объектов. Темновая адаптация улучшает результаты, давая возможность «считывать» информацию с послеобраза, но она никак не меняет вид выявляемых зависимостей, в частности, тот факт, что кривые для пространственных и фигуративных инструкций сдвинуты относительно друг друга примерно на 200 мс. Это говорит об относительной независимости микрогенеза и механизмов возникновения последовательных образов, а также о том, что сперлинговский эффект частичного отчета зависит прежде всего от параметров микрогенеза восприятия, а не от последействия сенсорной стимуляции, резко возрастающего в условиях темновой адаптации.

Обсуждая общенаучные основания исследования процессов актуального развития восприятия, нельзя не отметить их несомненную романтическую основу: микрогенетические представления естественно

соотносятся с данными о развитии восприятия в фило- и онтогенезе, а также с результатами неиропсихологических и нейрофизиологических исследований (см. 1.4.1 и 3.4.2). Этот факт в полной мере подчеркивал еще H.H. Ланге: «Подобно тому как эмбриологическое развитие человека повторяет в несколько месяцев те ступени, которые некогда проходило общее развитие рода, так и индивидуальное восприятие повторяет в несколько десятых секунды те ступени, какие в течение миллионов лет развивались в общей эволюции животных» (Ланге, 1893, с. 3).

Гетерохронность (разновременность) различных аспектов микроге-неза зрительного восприятия подтверждается нейрофизиологическими данными, свидетельствующими о существовании быстрых и медленных каналов сенсорной переработки. Они отличаются рядом анатомических особенностей (отсюда одно из их названий: магноцеллюлярные, M — крупноклеточные и парвоцвллюлярныв, Ρ —- мелкоклеточные). В функциональном отношении эти механизмы также весьма различны. Каналы первого типа быстро отвечают на «размытую» информацию, наличие больших пятен, движение и появление объектов в широком поле зрения. Механизмы второго типа работают сравнительно медленно, реагируя на локальные перепады яркости, тонкие линии, другие мелкие детали (Tovée, 1996).

На вопрос о том, достаточно ли этого разделения для описания микрогенеза, следует ответить отрицательно. Во-первых, не совсем ясны взаимоотношения между этими группами каналов. Обычно предполагается, что фазические каналы тормозят активность тонических²¹. В одном из обзоров процессов маскировки Бруно Брейтмейер (Breitmeyer, 1980), однако, приходит к выводу, что такое торможение является взаимным. Иконические репрезентации этот автор идентифицирует с положительными последовательными образами, причем, по его мнению, в процессах восприятия (в частности, при чтении) такие «иконы» могут лишь мешать восприятию деталей, а следовательно, должны активно

²¹ Взаимодействие фазических и тонических каналов служит основой распространен
ного объяснения обратной маскировки и метаконтраста. Предполагается, что фазичес-
кий ответ на маскировочный стимул тормозит более поздний тонический ответ на предъяв
ление тестового стимула (коррелятом этого ответа может быть описание деталей). Для
данного объяснения существенно, чтобы маскировочный стимул предъявлялся с соот
ветствующей задержкой. В последнее время обнаружены условия, при которых это объяс
нение не работает. Например, полная маскировка (метаконтраст) возникает и в том слу
чае, когда маскировочный стимул предъявляется одновременно с тестовым и просто про
должает оставаться в поле зрения после того, как тест-объект примерно через 100 мс ис
чезает (Enns & Di Lollo, 2000). Этот вариант маскировки легко предсказывается описан
ной выше (см. 3.1.3) двухуровневой моделью восприятия: 1) вначале происходит регист
рация и локализация тестового и маскирующего стимулов как некоторого недифферен
цированного события; 2) с задержкой порядка 100 мс начинаются процессы детальной
спецификации этого события, которые ведут к восприятию индивидуальных характерис
тик одного лишь маскировочного стимула. 207

подавляться²². По-видимому, зрение действительно занимается «иконоборчеством» — вывод, который предвидел уже Вундт. К тому же, разделение двух групп каналов связано, главным образом, с анализом сенсорной переработки в сетчатке и в первичных, затылочных отделах коры. Как мы увидим в дальнейшем (см. 3.4.2), восприятие вовлекает и другие структуры мозга, включающие различные субкортикальные области, а также ассоциативные зоны теменных и височных долей.

3.3 Распознавание конфигураций

3.3.1 Традиционные психологические подходы

Важнейшей функцией восприятия является распознавание зрительных и акустических конфигураций, ведущее, в частности, к узнаванию предметов и их категоризации, то есть отнесению к той или иной семантической категории. Проблема механизмов распознавания, или «распознавания образов», является одной из центральных для целого комплекса когнитивных наук: психологии, нейрофизиологии, искусственного интеллекта и нейроинформатики. В когнитивной психологии ей прямо или косвенно посвящены десятки монографий и сотни статей. В дальнейшем мы будем многократно возвращаться к ее рассмотрению из перспективы исследований памяти и организации семантической информации (см., например, 5.1.1 и 6.1.2). Данный раздел посвящен сенсорно-перцептивным механизмам распознавания.

Элементарной предпосылкой того, что некоторый объект вообще будет опознан, является его выделение в качестве фигуры из окружающего фона. Кроме того, при распознавании акцент лежит на индивидуальных признаках, таких как цвет поверхности и форма. Пространственно-ситуативные признаки (положение в пространстве, ориентация, движение, освещенность) выполняют при распознавании скорее технические функции — чаще всего их параметры лишь учитываются нами для того, чтобы дать инвариантную (константную) оценку индивидуальным признакам. Таким образом, можно сказать, что распознавание связано с относительно поздними стадиями восприятия, как бы «надстраивающимися» над процессами динамической пространственной локализации (см. 3.1.3).

²² Инерционность восприятия увеличивается при утомлении, когда ослаблены центральные процессы контроля. Это проявляется в увеличении продолжительности последовательных образов, усилении маскировки и снижении критической частоты слияния 208 мелькании (Леонова, 1984)

В последние годы были проведены систематические исследования законов перцептивной организации, направленные на выяснение природы влияющих на выделение фигуры из фона факторов и их взаимоотношений. При этом оказалось, что динамическая локализация в пространстве служит наиболее фундаментальной основой для такого выделения. Если разные законы перцептивной организации (см. 1.3.1) конфликтуют между собой, «навязывая» разные варианты группировки видимых компонентов сцены, то победителем обычно оказывается фактор близости, причем близости в трехмерном пространстве, а не на сетчатке. Закономерное движение стимулов в трехмерном пространстве также оказывается сильнейшим фактором перцептивной организации. Если пространственно-динамические факторы нейтральны (например, когда в статичной конфигурации расстояния между элементами равны между собой), то второй по силе группой факторов оказывается глобальное сходство, определяемое такими признаками, как окраска, общая ориентация (для элементов, имеющих выраженную ориентацию) или размеры (зернистость). Только тогда, когда все эти факторы нейтрализованы, группировка начинает учитывать особенности и сходство собственно формы элементов.

Рис. 3.12. Различение текстур (А) может быть противоположным по профилю простоты

и сложности различению формы (Б) образующих эти текстуры элементов. 209

Очевидное объяснение этих зависимостей состоит в том, что восприятие формы предполагает анализ уже выделенных из фона объектов, тогда как группировка основана на глобальной оценке сходства без предварительного восприятия формы образующих текстуру элементов. Эти два процесса не просто различны, но часто противоположны по чувствительности к отдельным признакам объектов. Так, хотя буквы «L» и «Т» явно отличаются по форме, образованные из них текстуры лишь с трудом отличаются друг от друга (см. рис. 3.12 справа). Напротив, небольшие вариации в наклоне «Т» практически не замечаются нами при узнавании, однако они служат хорошей основой для дифференциации соответствующих текстур (рис. 3.12 слева).

Особенно важную роль в распознавании играют именно процессы спецификации и распознавания формы. Как особая, требующая специального изучения проблема восприятие формы длительное время не осознавалась представителями «импрессионистической» (Эрнст Мах) ассоциативной психологии. Гештальтпсихологи считали восприятие формы первичным фактом восприятия, подчеркивая его «вещный», или предметный, характер. Если тезис о первичности восприятия формы вызывает сегодня — на основании представленных выше данных о микрогенезе — обоснованные сомнения, то предметность действительно представляется весьма важной характеристикой этого класса перцептивных процессов, к обсуждению которой мы еше вернемся в конце этого раздела (см. 3.3.3).

В психологических подходах последних десятилетий центральное место занимают формальные теории описания структуры перцептивных конфигураций. Речь идет о синтаксическом подходе: сначала выделяются отдельные элементы (признаки), из которых по определенным правилам (грамматикам) строится перцептивное описание конфигурации. Фактически в основу этого подхода положена более ранняя идея Дональда М. Маккая (МасКау, 1950), согласно которой перцептивная сложность (информативность) конфигурации определяется числом операций, осуществляемых перцептивной системой для ее спецификации (см. 2.1.3). Но характер этих элементов и операций над ними по-прежнему остается не вполне ясен²³. Одна из наиболее интересных теорий такого рода развивается голландским психологом Э. Ле-венбергом и его коллегами (Leeuwenberg, 1978). Модель постулирует повторения, зеркальные отображения и другие избыточные операции с разными элементами конфигураций, иногда осуществляемые в итеративном (повторном) режиме, то есть в ходе нескольких последовательных обращений к продуктам процесса кодирования.

Оценка сложности различных перцептивных интерпретаций используется для объяснения множества эффектов. Так, можно задать вопрос, почему на рис. 3.1 ЗА мы всегда видим два пересекающихся квадрата, хотя теоретически возможны и альтернативные варианты, частично указанные в нижнем ряду. Ответ связан с относительной простотой процесса конструирования квадрата, для которого нужно повторное использование лишь двух элементов — отрезка фиксированной

²¹ Джулиан Хохберг следующим образом характеризует эти исследования¹ «На физиологическом и психофизическом уровнях идет лихорадочный поиск элементов сенсорного анализа (которые учитель Гельмгольца Иоханнес Мюллер назвал "специфическими энергиями органов чувств") и есть упоминания ментальных структур, к которым эти элементы должны относиться... Но если Титченер когда-то заявил, что небольшой (по сегодняшним масштабам) финансовой поддержки и пары лет работы было бы достаточно, чтобы поставить все точки над / и черточки на t его варианта ассоцианистской теории, ..мне что-то не приходилось слышать таких оптимистичных заявлений в последнее вре-210 мя» (Hochberg, 1979, ρ 138).

Потенциальные интерпретации

Прозрачность
низкая высокая

Рис. 3.13. Примеры влияния фигуративной сложности на восприятие: А. Однозначность восприятия потенциально многозначной конфигурации; Б. Эффект глубины в плоском изображении; В. Феноменальная прозрачность.

длины и угла 90°. При других интерпретациях число элементов и разнообразие операций с ними возрастает. Точно так же на рис. 3.1 ЗБ нами воспринимается, казалось бы, очень сложная трехмерная конструкция, а не плоский, нанесенный на поверхность узор. В действительности, с учетом высокой избыточности компонентов (они показаны справа), трехмерная интерпретация оказывается более простой, чем двумерная, требующая спецификации множества отличающихся по ряду параметров элементов. Наконец, на рис. 3.13В слева мы видим плоский двумерный паттерн, тогда как справа похожая с точки зрения физических при-

211

знаков конфигурация распадается на две, причем та из них, которая лежит «сверху», к тому же оказывается феноменально прозрачной, позволяющей видеть детали, лежащие «внизу». Мы предоставляем читателю возможность объяснить этот феномен по аналогии с объяснениями, данными выше²⁴. Несколько иной подход будет рассмотрен нами в конце данной главы (см. 3.4.1).

В когнитивной психологии существует несколько групп моделей, или теорий распознавания. Только что рассмотренные формальные теории восприятия формы служат хорошим введением в эту проблематику. Дело в том, что наиболее распространенными в настоящее время являются теории признаков и структурные теории распознавания. Фактически они дополняют друг друга: признаки понимаются как исходные элементы, а структурные теории — как правила их объединения. Возникающие «описания» сравниваются с хранящимися в памяти репрезентациями (эталонами), и в случае совпадения происходит ассоциативная активация соответствующих узлов или областей семантической памяти. Хотя мы часто ориентируемся на отдельные признаки, особенно при поиске хорошо знакомых объектов, узнавание может происходить и на основании их более целостных комбинаций, как это подчеркивали гештальтпсихологи.

В силу их чрезвычайной значимости детальной классификации были подвергнуты речевые признаки, различающие отдельные буквы и, при акустическом предъявлении, фонемы (см. подробнее 7.1.1). Один из основных признаков, различающих фонемы, называется местом артикуляции, то есть местом перекрытия гортани при произнесении звука: подъемом задней части языка к нёбу, прикосновением языка к губам или соединением губ. Оказалось, что когда в психоакустических экспериментах на одно ухо подается звонкая согласная с так называемым передним местом артикуляции [Ь] и одновременно на другое — глухая согласная со средним положением артикуляции [t], то ошибки часто комбинируют эти признаки — [р] и [d] слышатся чаще, чем [q] и [к], возможно, потому, что глухость (звонкость) сочетаются здесь с передним (либо, наоборот, более задним) положением места артикуляции. Однако такого рода аргументация наталкивается на трудности. Прежде всего, физические признаки фонем не остаются постоянными и меняются в зависимости от контекста. Далее, восприятие речи вполне возможно в

²⁴ Данный подход можно легко распространить на слуховое восприятия. Один из результатов изучения избирательного восприятия речи («проблема вечеринки» — см. 2.2.1) состоит в том, что понимание релевантного речевого сообщения на фоне шума определяется возможностью его дифференциального описания в терминах локализации, громкости, тональности и тембра голоса собеседника. Если при восприятии музыки предъявляются короткие и сильные сигналы, замещающие участки мелодии, то последняя воспринимается непрерывной с тем большей вероятностью, чем меньше сходство ее ритмического рисунка с ритмом последовательности шумов. Иными словами, различие перцептивных описаний шумовых сигналов и мелодии делает шум акустически «прозрачным» 212 (Bregman, 1990).

условиях, исключающих использование традиционных фонематических признаков (например, Remez, Rubin, Pisoni & Carrell, 1981).

Стивен Лупкер (Lupker, 1979) проверил гипотезу, согласно которой восприятие букв при чтении основано на выделении признаков. Ни одна из признаковых моделей при этом не подтвердилась. Напротив, данные хорошо описывались моделью микрогенетического типа — восприятие локальных особенностей букв начинало играть некоторую роль в их различении лишь после восприятия обобщенных очертаний. Эксперименты с маскировкой слов также показали, что она оказывается особенно сильной, если в качестве маски используются буквы, а не их фрагменты. Это говорит о том, что репрезентация букв может быть наиболее дробным слоем анализа. Существенную роль в распознавании букв играет контекст — распознавание резко улучшается, если этот контекст представляет собой осмысленное слово или, по крайней мере, произносимое псевдослово (см. ниже классический эффект превосходства слова — 7.2.1). Эта закономерность играет особенно большую роль в распознавании рукописного текста, когда один и тот же графический знак уверенно воспринимается как разные буквы (например, «А» или «Н») в зависимости от контекста.

Вторую группу теорий распознавания образуют так называемые теории шаблонов. Они предполагают наличие в памяти целостных репрезентаций, с которыми сравниваются столь же целостные перцептивные описания предметов и событий. Идея целостного сравнения подтверждается многочисленными результатами, свидетельствующими об ускорении опознания в случае общего перцептивного сходства тестового и эталонного объектов, а также данными Р. Шепарда и его коллег (например, Shepard & Podgorny, 1978) по мысленному вращению и другим пространственным трансформациям зрительных образов объектов в процессах узнавания (см. подробно 5.3.1 и 6.3.1).

Споры вызывает, впрочем, вопрос о степени абстрактности подобных целостных репрезентаций. Первоначально преобладало мнение, что их детальность, или конкретность, зависит от времени, прошедшего с момента восприятия. Считалось, что при очень коротких интервалах сравниваются детальные репрезентации, удерживаемые в иконической и эхоической памяти, так что распознавание зависит здесь от более или менее точного пространственного (зрение) и временного (слух) наложения конфигураций. Рассмотренные нами выше данные (см. 3.2.1 и 3.2.2), а также эксперименты на так называемую транссаккадическую память (Irwin, 1996) показывают, что уже через сотые доли секунды после исчезновения изображения или смены точки фиксации в рабочей памяти сохраняется лишь относительно абстрактное описание одного-двух воспринятых объектов.

Несмотря на эту сравнительно обедненную постперцептивную информацию, наша память, несомненно, умудряется строить детальные и разнообразные долговременные репрезентации осмысленных предметных сцен. Эти репрезентации, например, оказываются достаточными для „. „

успешного узнавания тысяч видовых слайдов через недели после их однократного показа (Standing, 1973). Важным условием при этом являются целостность и предметная правдоподобность — полностью абстрактные изображения и предметные сцены, поставленные «на голову» или расчлененные на несколько переставленных кусков, не обнаруживают и доли успешности узнавания экологически естественного материала. Интересно, что узнавание предметных сцен оказывается весьма успешным при повороте изображений относительно вертикали, не нарушающем законы гравитации (Величковский, 19826). Это свидетельствует о целостности процессов сравнения, которые явно не сводятся к поэлементному совмещению тестовой сцены и репрезентаций памяти (см. 5.2.1). В конце этого раздела мы рассмотрим новые работы, выявляющие особенности восприятия интактных предметных сцен, которые, по-видимому, объясняют также и их последующее успешное узнавание (см. 3.3 3).

К группе теорий, допускающих возможность целостного сравнения, примыкают теории прототипов, согласно которым при ознакомлении с элементами некоторого множества испытуемый постепенно выделяет одну или более центральных тенденций — прототипов. По отношению к ним и решается вопрос о принадлежности конкретного объекта к данному множеству. С существованием границ между классами объектов, тяготеющим к разным прототипам, связываются обычно эффекты категориального восприятия — два незначительно различающихся в отношении физических признаков объекта, которые попадают в разные классы (категории), кажутся более разными, чем объективно более различающиеся объекты, попадающие в одну и ту же категорию. Соответственно, во втором случае можно ожидать более быстрое узнавание различных объектов как одинаковых. Такие эффекты обнаружены при восприятии фонем, назывании оттенков цвета, идентификации сложных зрительных форм и т.д. (см. 7.1.1). Формирование прототипов не сводится к абстрагированию признаков, так как можно подобрать множество объектов, не обладающих признаками будущего прототипа — в отношении различительных признаков прототип будет находиться «между» конкретными образцами.

Относительно слабо изученными остаются механизмы узнавания событий и сложных трансформаций биологических объектов. Более или менее правдоподобные объяснения разработаны здесь лишь для частных случаев, например, упоминавшейся выше походки (см. 3.1.2). Особенно большое внимание уделялось исследованию узнавания наиболее важного «стимула» в нашем окружении — человеческого лица и его эмоциональных выражений. Эти результаты выявляют асимметрическую зависимость: знакомость (например, в случае фотографий известных политических деятелей) улучшает узнавание эмоционального выражения, но варьирование выражения не оказывает какого-либо однознач-214 ного влияния на узнавание лиц.

Рис. 3.14. Иллюзия Тэтчер." можно сначала сравнить оба изображения при данной ориентации, а затем в нормальном и снова в перевернутом положении

Изучение признаков, обеспечивающих узнавание лиц, привело и в этой области к разделению целостных (конфигурационных, связанных со взаимным положением) и локальных признаков, определяемых спецификой деталей. В отличие от восприятия обычных предметов и объектов в нашем окружении (и в отличие от процессов чтения в культурах с алфавитной письменностью — см. 7.2.1), узнавание лица в большей степени определяется именно целостными характеристиками, так что даже если в действительности речь идет об изменении некоторого локального признака, испытуемые воспринимают его глобально. Например, изменение диаметра зрачка обычно не воспринимается как таковое, а интерпретируется глобально, скажем, как увеличение привлекательности. Целостное узнавание возможно только при нормальной пространственной ориентации, как это демонстрирует иллюзия Тэтчер (по имени главы британского правительства, сократившей в свое время финансирование научных исследований). Хотя мы легко можем установить, что изображения на рис. 3.14 не совпадают между собой в деталях, мы даже отдаленно не можем себе представить, в какой степени на самом деле различаются между собой выражения этих лиц.

Зависимость восприятия «внутренней геометрии» лица от его ориентации в пространстве ведет к тому, что при необычной ориентации мы, в известном смысле, становимся функционально слепыми к целостным фигуративным признакам. Эта зависимость имеет общий характер, но в случае лиц она выражена особенно сильно. Особый статус восприятия лиц доказывается существованием прозопагнозии — нейропсихологичес-кого синдрома, который связан с селективным выпадением узнавания преимущественно именно этого класса объектов. Интересно, что воз- 215

можны варианты этого синдрома, когда пациенты не могут зрительно узнавать даже своих близких родственников и знакомых, но, тем не менее, вполне успешно определяют «по выражению лица» эмоциональное состояние. Как показывают данные клинических наблюдений и мозгового картирования, эти формы восприятия, по-видимому, преимущественно связаны с нижневисочными отделами правого полушария.

В нижневисочных отделах коры тоже локализуются процессы, существенные для узнавания, а также, что интересно, даже для простой детекции (Grill-Spector, 2004) других категорий сложных зрительных стимулов (см 3 3 3 и 3 4 2) Продолжительные споры относительно того, до какой степени могут быть специализированы процессы восприятия формы объектов и как это связано с межполушарными различиями, привели в последнее время к возникновению представления о своеобразной полуспециализации полушарий. Правополушарные механизмы вентрального потока переработки зритетьной информации обеспечивают целостное восприятие лиц, а также участвуют в обработке формы и узнавании повседневных предметов Однако они не вовлечены сколько-нибудь существенно в процессы восприятия формы букв (в культурах алфавитной письменности) Левополушарные механизмы, напротив, работают скорее с отдельными признаками объектов Они обеспечивают процессы побуквенного чтения и частично участвуют в узнавании повседневных предметов, но не в узнавании лиц Это предварительное объяснение подтверждается, в частности, анализом основных синдромов дислексии — нарушения чтения при локальных поражениях мозга (см 7 2 2)

3.3.2 Влияние нейронаук и информатики

Многие из числа известных современных теорий распознавания опираются, как мы только что видели, на данные и модели, заимствованные из становящейся все более обширной области нейронаук — нейрофизиологии, нейропсихологии и нейроинформатики. Начало переориентации психологических описаний восприятия на физиологическую терминологию и нейросетевые объяснительные модели было положено открытием нейронов-детекторов признаков стимуляции. Особую известность получила основанная на данных микроэлектродного отведения активности отдельных нейронов модель Нобелевских лауреатов 1981 года Д. Хьюбела и Т. Визела. Согласно этой модели, на разных уровнях зрительной системы последовательно выделяются пятна, линии, углы, а затем и более сложные комбинации элементов контура («вплоть до детектора моей бабушки», как иронически заметила однажды американская исследовательница восприятия Науми Уайсстейн)

Эти данные, полученные при изучении зрительной системы кура-

ризированных кошек, были использованы в дальнейшем для моделиро-

216 вания различных аспектов зрительного восприятия. Если нейроны вы-

деляют соединения контуров, то почему разные соединения, например типов «Y», «X», «L» или «Т», выделяются с различной частотой? Математическое моделирование описаний трехмерных сцен показало, что такие соединения могут выполнять разные функции, связанные с отнесением участков, ограниченных контурами, к одним и тем же или к разным предметам Так, особенно часто выделяемое соединение типа «Y» с высокой степенью вероятности представляет собой вершину (впадину) единого объекта с тремя гранями. Напротив, соединение «Т» скорее свидетельствует о перекрытии одного предмета другим, причем верхняя «перекладина» принадлежит перекрывающему предмету, а центральная «ось» разделяет две поверхности перекрываемого предмета. Как в таком случае быть с участками объектов, не имеющими контуров, но, тем не менее, явно демонстрирующими «телесность», подобно изображенному на рис. 3.15А торсу? Возможно, что в этом случае используется некоторое сочетание детекции пространственных частот и ориентации Участки гладких поверхностей moi ут моделироваться путем выделения овальных теней и бликов различной величины и ориентации в пространстве (рис. 3.15Б).

На развитие формальных моделей распознавания в последние годы оказывают особенно сильное влияние идеи, возникшие в рамках работ