Ученье свет, а неученье тьма народная мудрость

Вид материалаДокументы
Подобный материал:
1   ...   8   9   10   11   12   13   14   15   ...   37
150 -,





100 -







вербальный интеллект

невербальный интеллект


Рис. 2.8. Результаты тестов на вербальные и невербальные интеллектуальные способ­ности у трех групп детей: контрольная группа нормальных детей, дети с синдромом Дауна и синдромом Уильямса (неопубликованные данные, с разрешения Department of Psychology, Emory University).

131

и вы получите стандартный список обитателей зоомагазинов и приго­родных ферм: собака, кошка, лошадь, корова, свинья. Попросите об этом ребенка с синдромом Уильямса, и вы получите более интересный набор: единорог, птеранодон, як, ибекс, саблезубый тигр, коала, дракон и, к особой радости палеонтологов, бронтозаврус реке» (Pinker, 1994, р. 53). В одной из недавних публикаций итальянских нейропсихологов приводится случай 9-летнего мальчика с этим синдромом, который был лучшим в своем классе по развитию навыков чтения. В то же время ин­теллектуально он был так слаб, что играя в любимую игру — футбол, так и не мог понять разницу между своими и чужими воротами.

Второй признак модулярности — информационная закрытость соот­ветствующих механизмов (Фодор использует более выразительный тер­мин «инкапсулированность»). Лучше всего этот признак иллюстрирует­ся хорошо известными оптико-геометрическими иллюзиями, такими как иллюзия Мюллера-Лайера (рис. 2.9). Выраженность этой иллюзии не меняется при полном знании о физическом равенстве центральных отрезков13, а значит, процессы восприятия оказываются когнитивно не­проницаемыми для наших знаний о ситуации. Соавтор Фодора по ряду публикаций Зенон Пылишин считает когнитивную непроницаемость основным критерием анализа фиксированных компонентов архитекту­ры познавательных процессов. Для Фодора существенными являются и некоторые другие признаки. Третий признак в его классификации — это обязательный («мандатный») и баллистический характер модулярных процессов: если на входе некоего модуля оказывается соответствующая информация, то ничто уже не может остановить или изменить его рабо­ту. Так, если, открыв дверь, мы наблюдаем некоторую сцену, мы не в со­стоянии не увидеть ее или увидеть ее иначе, если нам не нравится то, что мы видим.

Перцептивные процессы и потенциально любые другие, модуляр-но организованные процессы переработки информации, с этой точки зрения, являются вычислительными рефлексами. Из этого, в частности, естественно следует четвертый признак: модули работают очень быстро. Пятый признак тесно связан с предыдущим и заключается в том, что результатом работы модулярных систем оказываются сравнительно по­верхностные репрезентации, зачастую служащие лишь сырым материа­лом для дальнейшего использования центральными системами.

Три последних признака модулярности, описываемые Фодором, оказали в дальнейшем особое влияние на переориентацию всего комп-

13 Более того, как показали наблюдения одного из классиков гештальт-психологии Вольфганга Метцгера, иллюзорному искажению подвержены даже металлические балки (!), если они образуют соответствующую перцептивную конфигурацию (Metzger, 1941/ 2001) В последние годы были, впрочем, получены новые данные, описывающие усло­вия, при которых данная и некоторые другие оптико-геометрические иллюзии не возни-132 кают (см. 3.4.1)







Рис. 2.9. Иллюзия Мюллера-Лайера — выраженный иллюзорный эффект сохраняется, несмотря на знание истинных размеров и наличие линейки.

лекса когнитивных исследований. Согласно шестому признаку, очень похожие когнитивные модули могут встречаться у представителей раз­личных биологических видов. Седьмой признак заключается в том, что нарушения и распад работы некоторого модуля обнаруживают свою собственную картину симптомов и могут происходить на фоне полной сохранности других механизмов. В нейропсихологии соответствующая особенность организации мозговых процессов по сути дела давно пред­полагалась таким методическим приемом, как поиск двойных диссоциа­ций: выявления такой пары мозговых поражений, которые селективно вызывают один из двух контрастируемых неиропсихологических синд­ромов (см. 2.4.1). Не удивительно, что последним, восьмым признаком когнитивных модулей оказывается фиксированность их нейроанатоми-ческой локализации. В целом, эта группа признаков позволяет сделать дополнительный и, надо сказать, достаточно сильный (если не провока­ционный) вывод о врожденности модулярных компонентов когнитив­ной архитектуры.

Вызванные книгой Фодора дискуссии продолжаются в психоло­гии и за ее пределами, не утихая, и по сегодняшний день. Оценивая эту работу, следует отдельно обсудить ее конкретные положения, часть из которых не выдерживает критики, и те, скорее неспецифические последствия, которые она имела для современных когнитивных иссле-

133

дований в целом. Конкретные положения действительно вызывают множество вопросов. Насколько правомерны, например, приписыва­ние модулярных характеристик перцептивным «системам входа» и под­черкнуто «изотропная» интерпретация функционирования «централь­ных систем»?

Одной из базовых функций перцептивных механизмов (то есть «сис­тем входа», по Фодору) является пространственная локализация объектов и самого наблюдателя. По ряду параметров процессы пространственно­го восприятия, однако, трудно отнести к типичным модулярным меха­низмам. Так, восприятие пространства связано с широкой интермодаль­ный интеграцией сенсорной информации (зрение, слух, кинестезия, гаптика и т.д.) и сенсомоторных навыков, основанных на опыте актив­ных локомоций и действий (см. 3.1.1 и 3.4.3). Далее, восприятие про­странства оказывается чрезвычайно пластичным, способным корректи­ровать драматические изменения сенсорной информации. Пластичность восприятия сохраняется и у взрослых индивидов, как это было показано в многочисленных экспериментах с адаптацией к искажающим изобра­жение на сетчатке оптическим устройствам (см. 3.4.3). При этом может учитываться также и семантическая информация — на промежуточных этапах адаптации к переворачивающим ретинальное изображение лин­зам свечка, видимая сначала в перевернутом положении, иногда вдруг воспринимается правильно, если ее поджигают и пламя начинает указы­вать направление «вверх» (O'Reagan & Noe, 2001).

Обращаясь к центральным системам, можно, напротив, найти массу примеров отклонений от предполагаемой гомогенности («изотропнос­ти») высших когнитивных процессов. Лучше всего это иллюстрируют работы по нейропсихологическим механизмам социального интеллекта. Узкая функциональная специализация, типичная картина выпадения, известная как аутизм, и даже возможная узкая локализация мозговых механизмов, которые предположительно связаны с префронтальными областями коры (см. 8.1.1), — все эти признаки механизмов социально­го интеллекта вполне соответствуют их модулярной интерпретации. Следует сказать, что многочисленные последователи Фодора пытаются в последние годы модифицировать его исходную концепцию, причем главным образом путем распространения модулярного подхода на самые разные, в том числе на высшие познавательные функции (Cosmides & Tooby, 1994). На основании данных, полученных с помощью методов трехмерного мозгового картирования, распространенным становится представление о модулярной организации именно высших форм позна­ния и контроля деятельности (см. подробнее 2.4.2, 4.4.2 и 8.2.3).

В следующих главах мы будем часто упоминать разнообразные спе­циализированные механизмы познавательной активности и анализиро­вать ведущиеся вокруг этого комплекса вопросов дискуссии. Широта и интенсивность споров демонстрируют тот факт, что публикации Фодо­ра по модулярности спровоцировали настоящий всплеск интереса (иногда, впрочем, с элементами протеста) к классическим проблемам

развития и мозговых механизмов познавательных процессов. Хотя соот­ветствующие упоминания работ Выготского, Пиаже и Лурия давно уже стали в когнитивной психологии правилом хорошего тона, лишь с кон­ца 1980-х годов интересовавшие этих авторов проблемы постепенно пе­ремещаются в фокус внимания междисциплинарного научного сообще­ства когнитологов (см. 9.1.3 и 9.4.2). С этой точки зрения, поиск относительно автономных когнитивных модулей и их возможных ней­рофизиологических механизмов действительно может считаться одним из числа наиболее влиятельных и интересных подходов в новейших ис­следованиях познания.

2.3.3 Нейронные сети в психологии

Другим влиятельным подходом в течение последних 20 лет стал так на­зываемый PDP-подход (от parallel distributed processing = параллельная распределенная обработка), широко известный также как коннекцио-низмн. И в этом случае речь идет об отказе от компьютерной метафоры в ее символьном варианте, связанном первоначально с логико-матема­тическими работами Алана Тьюринга и Джона фон Неймана. Однако, если концепция когнитивных модулей Фодора и его последователей лишь допускает определенную параллельность обработки в каких-то звеньях когнитивной архитектуры, в коннекционизме параллельность обработки становится уже всеобщим принципом. Речь идет о массивной параллельности обработки — все элементы системы, интерпретируемой как обширная нейронная сеть, рассматриваются как потенциально свя­занные между собой и одновременно участвующие в формировании от­вета на стимульную конфигурацию.

Типичная коннекционистская сеть показана на рис. 2.10. Наличие нескольких слоев элементов: входного и выходного слоя плюс не менее одного промежуточного (или «скрытого», от англ. hidden) слоя — отли­чительная черта современных коннекционистских моделей. Попытки демонстрации вычислительных возможностей сетей формальных ней­ронов предпринимались американскими нейрофизиологами Мак-Кал-локом и Питтсом еще в 1940-е годы. В последующие два десятилетия простые (один входной и один выходной слой) сети под названием «персептроны» использовались для машинного распознавания изобра­жений, однако без особого успеха, так как оказалось, что они неспособ­ны к строгой дизъюнкции («либо А» — «либо В») — логической опера­ции, необходимой для различения состояний мира. Лишь в начале

14 Распространенный сегодня в психологии и за ее пределами термин «коннекцио-
низм» в историческом контексте впервые был использован Эдвардом Торндайком (на­
пример, Thorndike, 1932) для обозначения его основанной на ассоциативных связях сти­
мулов и реакций бихевиористской теории научения (см. 1.3.2 и 5.4.2). 135

1980-х годов было показано, что добавление по крайней мере одного «скрытого» слоя нейроноподобных элементов снимает эту проблему, позволяя осуществлять на базе параллельных архитектур весь спектр логических операций. В 1986 году Румелхарт и Макклелланд опублико­вали двухтомную «библию» коннекционизма (McClelland & Rumelhart, 1986; Rumelhart & McClelland, 1986), содержащую, наряду с описанием формального аппарата моделирования, многочисленные примеры пси­хологических и нейрофизиологических применений этого подхода.

Главное преимущество коннекционистских моделей по сравнению с традиционными когнитивными моделями — это возможность ассоци­ативного (контентно-адресованного) и распределенного хранения инфор­мации, а также, что особенно важно, адаптивного обучения. Первая осо­бенность означает, что любой фрагмент первоначальной ситуации или любое сопутствующее обстоятельство способны ассоциативно поддер­жать припоминание. «Распределенным» хранение является потому, что его субстратом является в каждом конкретном случае не какой-то от­дельный элемент, а сеть в целом, то есть состояния всех ее узлов и весо­вые коэффициенты их связей. Наконец, коннекционизм позволяет есте­ственно описывать некоторые элементарные формы обучения. Процессы обучения в искусственных нейронных сетях имеют известную специфи­ку, которая должна стать понятной из нижеследующих примеров. Про­стейшая, сугубо ассоциативная процедура обучения в нейронных сетях

активация на выходе





выходной слой


тренируемые связи

скрытый слой

входной слой

О О О

активация на входе

136

Рис. 2.10. Однонаправленная (feedforward) коннекционистская сеть, включающая скры­тый слой элементов

восходит к классическим идеям проторения путей павловской физиоло­гии и клеточных ансамблей Дональда Хэбба (см. 1.4.2).

В «Организации поведения» Хэбб (Hebb, 1949) предположил, что по­вторная стимуляция тех же рецепторов постепенно ведет к функцио­нальному объединению нейронов ассоциативных областей мозга, так что этот клеточный ансамбль может сохранять активацию после окон­чания стимуляции и вновь возбуждаться при возникновении похожего узора стимуляции. В нейроинформатике используется следующее прави­ло Хэбба: между всеми одновременно (синхронно) активированными ней­ронами (то есть элементами сети) снижаются пороги синаптических связей (повышаются весовые коэффициенты активационных связей). В результате многократных повторений распространение активации при возникновении на входе той же ситуации происходит быстрее, группа элементов, «ансамбль», активируется как целое, и, что важно, эта активация происходит даже при изменениях ситуации, например, выпадении каких-то компонентов изображения, а равно «отмирании» части «нейронов» самой сети. Тем самым удается моделировать особен­ности целостного восприятия, описанного гештальтпсихологией (см. 1.3.1). Подобная терпимость (graceful degradation) к искажениям на вхо­де и к нарушениям механизма обработки информации разительно кон­трастирует с хрупкостью обычных символьных программ, где лишний пропуск или неправильно поставленная запятая способны остановить работу программы и даже самого компьютера. Кроме того, пластичность синаптических связей, лежащая в основе формирования ансамблей, по­зволяет дать физиологическое объяснение процессам обобщения (кате­горизации) отдельных стимульных ситуаций.

Недостатком описанного механизма самоорганизации нейронных связей является его чрезвычайно медленный, требующий сотен и тысяч повторений характер. В 1981 году немецко-американский нейрофизио­лог К. фон дер Мальсбург предположил, что для объяснения одноразо­вого обучения должны существовать быстрые синапсы, меняющие свои характеристики в ответ на однократное возникновение некоторой, обычно новой или значимой ситуации. Мальсбург назвал их «хэббов-скими синапсами». Такие синапсы действительно были обнаружены в последнее время и по предложению Нобелевского лауреата по биологии Фрэнсиса Крика иногда называются теперь «мальсбургскими». Мы под­робнее остановимся на обсуждении этих нейрофизиологических меха­низмов в последующих главах, посвященных сознанию и памяти (см. 4.4.3 и 5.3.2).

Примером более эффективного компьютерного алгоритма обучения в самой нейроинформатике служит предложенный канадским информа­тикой Джеффри Хинтоном и его коллегами метод обратного распрост­ранения ошибки (backpropagation of error). В этом случае сети предъявля­ется некоторая конфигурация, а затем ответ на выходе сравнивается с идеальным, желаемым ответом. Результат подобного сравнения того, что должно быть (Sollwert), с тем, что есть (Istwert), вычисляется и пропуска­ется затем в обратном направлении: от выхода сети к ее входному слою, причем на каждом промежуточном этапе осуществляются некоторые

коррекции весовых коэффициентов связей элементов с целью последу­ющей минимизации рассогласования. Телеологизм этих процессов и не­обходимость эксплицитного надсмотра за обучающейся сетью порожда­ют, с одной стороны, множество смутных психологических аналогий, а с другой стороны, известный скептицизм в оценке «обратного распрос­транения» как подходящего средства моделирования когнитивных про­цессов. Дело в том, что «контролируемая минимизация рассогласова­ния» оставляет сильное впечатление произвольного подбора желаемого результата15.

Ряд коннекционистских моделей использует обратные связи для повторного пропускания продуктов обработки через нейронную сеть. Это свойство, называемое рекуррентностью, позволяет обрабатывать конфигурации на входе в контексте предыдущих событий («прошлого опыта»). Два варианта рекуррентных сетей, использовавшихся для мо­делирования синтаксического анализа речи, показаны на рис. 2.11. Су­ществует практически открытое множество других вариантов коммута­ции элементов, а также возможность соединения коннекционистских моделей с традиционными символьными архитектурами в рамках гиб­ридных моделей, включающих как символические, так и коннекцио-нистские компоненты. Так, в литературе интенсивно обсуждается воз­можность существования разных нейролингвистических механизмов для работы с регулярными и нерегулярными глаголами (Pinker, 2000). В случае регулярных глаголов, склоняемых по определенным фиксиро­ванным правилам, в памяти могла бы сохраняться лишь корневая мор­фема, по отношению к которой осуществляются традиционные сим­вольные трансформации (скажем, добавление «-ed» при переходе к прошедшему времени в английском языке). Работа с нерегулярными глаголами, напротив, требует заучивания индивидуальных паттернов (как в случае грамматических форм английского глагола «to be»: am, are, is, was, were). При моделировании такого, скорее механического, заучи­вания могли бы помочь нейронные сети (см. 7.1.3).

Коннекционизм не мог не вызвать острых научных дискуссий. Они возникли прежде всего с представителями символьного и модулярного подходов (Fodor & Pylyshin, 1988), для которых подобное применение идеи параллельности ведет слишком далеко, вплоть до отказа от основ­ных принципов переработки символьной информации, выделенных к началу 1980-х годов. В самом деле, в распределенных архитектурах не выполняются основные логические требования к символьной записи информации, а следовательно, к коннекционистским репрезентациям не применимы средства исчисления предикатов (см. 2.3.3). Поэтому,

15 Вне психологии — нейроинформатика, компьютерное зрение и роботика — широ­ко используются алгоритмы обучения нейронных сетей, не требующие внешнего над­смотра. Речь идет прежде всего о разновидности разработанных финским информатикой 138 Т. Кохоненом самоорганизующихся карт (self-organizing maps).







- контекстные нейроны ''

Рис. 2.11. Рекуррентные нейронные сети, применяющиеся для (А) моделирования пост­роения форм прошлого времени английских глаголов и (Б) предсказания грамматичес­кой категории следующего слова в предложении (по: Cooper, 1996).

кстати, сами коннекционисты говорят об изучении субсимвольных про­цессов. Для некоторых видных психологов и лингвистов (например, Levelt, 1990) попытки моделирования познания с помощью обучаю­щихся искусственных нейронных сетей представляют собой лишь слег­ка осовремененную редакцию упрощенных ассоцианистских взглядов. Интересно, что слабые и сильные стороны более традиционных символьных и относительно новых коннекционистских моделей разли­чаются между собой. Символьные программы относительно удобны при реализации эксплицитных правил и практически беспомощны в облас­ти интуитивных достижений, таких как разделение сцены .на фигуру и фон в процессах зрительного восприятия (см. 1.3.1 и 4.3.3). Искусствен­ные нейронные сети, напротив, впервые позволили легко смоделиро­вать эффекты перцептивной организации и, скажем, эффекты ассоциа­тивного обучения и запоминания, но они плохо, путем многочисленных повторных приближений справляются с выделением, казалось бы, со­всем простых правил. Это позволяет предположить, что наиболее веро­ятным будущим в области моделирования познавательных возможнос­тей человека и животных станет использование интегральных или гибридных архитектур, сочетающих достоинства символьного и субсим­вольного подходов (и, будем надеяться, свободных от их недостатков!).

Одним из самых первых примеров интегрального подхода, заполня­ющего брешь между субсимвольными и символьными репрезентациями,

139

являются работы ученика Румелхарта Пола Смоленского (Smolensky, 2005). Использовав математический аппарат тензорного исчисления, он доказал принципиальную возможность построения коннещионистско-символъных когнитивных архитектур (ICS = Integrated Connectionist/ Symbolic), в которых свойства символьных преобразований реализуются

1 на макроуровне описания, тогда как на микроуровне ментальные репре-

зентации описываются как массивно-параллельные процессы распрос­транения волн активации по нейронным сетям. Этот подход был приме­нен Смоленским и его коллегами в области теоретической лингвистики, где они, прежде всего, попытались объяснить разнообразные феномены маркированности — использование специальных лингвистических средств для выражения относительно нетипичных (или «менее гармо­ничных») в данном контексте языковых конструкций (см. 7.3.2 и 8.1.2). Несмотря на то, что их реализация осуществляется посредством нейро-сетевых механизмов, подобные «гармоничные грамматики» способны, по мнению Смоленского, полностью заменить генеративные граммати­ки при описании общих принципов функционирования языка. Процесс порождения речевых звуков (модель относится пока преимущественно к сфере фонологии речи — Prince & Smolensky, 1997) описывается при этом как оптимизация решения, удовлетворяющая нескольким гетеро­генным правилам, таким как запрет на возникновение последовательно­стей из большого числа согласных звуков (см. 7.1.1).

В столь динамичной области, как когнитивная наука, трудно предсказывать будущее развитие событий. В рамках работ по вычисли­тельной нейронауке (нейроинтеллекту) и эволюционному моделированию в последнее время начинают рассматриваться более реалистичные, с биологической и биофизической точки зрения, альтернативы искусст­венным нейронным сетям (такие как самоорганизующиеся карты, кле­точные автоматы и, в отдаленной перспективе, квантовые компьюте­ры — см. Doyle, 2003; O'Reilly & Munakata, 2003). При увеличении объе­ма мозга в процессе эволюции исходный сетевой принцип «всё связано со всем» перестает выполняться, возникают элементы модулярной макроорганизации (Striedter, 2004). Кроме того, при моделировании познания до сих пор практически никак не учитывалась роль нейро-трансмиттеров, химических передатчиков сигналов между нейрона­ми и модуляторов их активности. Диффузное, не ограниченное одним лишь преодолением синапсов действие нейротрансмиттеров может, ле­жать в основе регуляции эмоциональных состояний и интеграции ней­ронов в сложные самоорганизующиеся системы. Последнее представ­ляется очень существенным — ведь целостный мозг демонстрирует не только способности решения тех или иных узкопознавательных задач, но и множество других биологически и социально необходимых функ­ций, в частности, связанных с эмоциями и мотивированным поведени­ем (см. 2.4.3 и 9.4.3).