Ученье свет, а неученье тьма народная мудрость
Вид материала | Документы |
- Ученье свет, а неученье тьма народная мудрость, 3885.89kb.
- Каер Жанна Алексеевна моу вознесенская сош 10 класс сочинение, 63.71kb.
- «Ученье – свет, а неученье – тьма», 41.62kb.
- Внеклассное мероприятие по литературному чтению Долмашкина А. В.,Моу сош №44, 60.21kb.
- Задание Придумайте название для своей команды. Составьте небольшой рассказ о своей, 338.38kb.
- Ученье свет, а неученье жди проверки, 103.98kb.
- City of ember официальный дистрибьютор в России кинокомпания «Вест», 1964.97kb.
- Анхель де Куатьэ Тайна печатей (книги 1-6), 6473.48kb.
- Лекция 1-2, 1001.75kb.
- Говорят, нет дыма без огня, а, как известно, народная мудрость редко ошибается., 100.75kb.
150 -,
100 -
вербальный интеллект
невербальный интеллект
Рис. 2.8. Результаты тестов на вербальные и невербальные интеллектуальные способности у трех групп детей: контрольная группа нормальных детей, дети с синдромом Дауна и синдромом Уильямса (неопубликованные данные, с разрешения Department of Psychology, Emory University).
131
и вы получите стандартный список обитателей зоомагазинов и пригородных ферм: собака, кошка, лошадь, корова, свинья. Попросите об этом ребенка с синдромом Уильямса, и вы получите более интересный набор: единорог, птеранодон, як, ибекс, саблезубый тигр, коала, дракон и, к особой радости палеонтологов, бронтозаврус реке» (Pinker, 1994, р. 53). В одной из недавних публикаций итальянских нейропсихологов приводится случай 9-летнего мальчика с этим синдромом, который был лучшим в своем классе по развитию навыков чтения. В то же время интеллектуально он был так слаб, что играя в любимую игру — футбол, так и не мог понять разницу между своими и чужими воротами.
Второй признак модулярности — информационная закрытость соответствующих механизмов (Фодор использует более выразительный термин «инкапсулированность»). Лучше всего этот признак иллюстрируется хорошо известными оптико-геометрическими иллюзиями, такими как иллюзия Мюллера-Лайера (рис. 2.9). Выраженность этой иллюзии не меняется при полном знании о физическом равенстве центральных отрезков13, а значит, процессы восприятия оказываются когнитивно непроницаемыми для наших знаний о ситуации. Соавтор Фодора по ряду публикаций Зенон Пылишин считает когнитивную непроницаемость основным критерием анализа фиксированных компонентов архитектуры познавательных процессов. Для Фодора существенными являются и некоторые другие признаки. Третий признак в его классификации — это обязательный («мандатный») и баллистический характер модулярных процессов: если на входе некоего модуля оказывается соответствующая информация, то ничто уже не может остановить или изменить его работу. Так, если, открыв дверь, мы наблюдаем некоторую сцену, мы не в состоянии не увидеть ее или увидеть ее иначе, если нам не нравится то, что мы видим.
Перцептивные процессы и потенциально любые другие, модуляр-но организованные процессы переработки информации, с этой точки зрения, являются вычислительными рефлексами. Из этого, в частности, естественно следует четвертый признак: модули работают очень быстро. Пятый признак тесно связан с предыдущим и заключается в том, что результатом работы модулярных систем оказываются сравнительно поверхностные репрезентации, зачастую служащие лишь сырым материалом для дальнейшего использования центральными системами.
Три последних признака модулярности, описываемые Фодором, оказали в дальнейшем особое влияние на переориентацию всего комп-
13 Более того, как показали наблюдения одного из классиков гештальт-психологии Вольфганга Метцгера, иллюзорному искажению подвержены даже металлические балки (!), если они образуют соответствующую перцептивную конфигурацию (Metzger, 1941/ 2001) В последние годы были, впрочем, получены новые данные, описывающие условия, при которых данная и некоторые другие оптико-геометрические иллюзии не возни-132 кают (см. 3.4.1)
Рис. 2.9. Иллюзия Мюллера-Лайера — выраженный иллюзорный эффект сохраняется, несмотря на знание истинных размеров и наличие линейки.
лекса когнитивных исследований. Согласно шестому признаку, очень похожие когнитивные модули могут встречаться у представителей различных биологических видов. Седьмой признак заключается в том, что нарушения и распад работы некоторого модуля обнаруживают свою собственную картину симптомов и могут происходить на фоне полной сохранности других механизмов. В нейропсихологии соответствующая особенность организации мозговых процессов по сути дела давно предполагалась таким методическим приемом, как поиск двойных диссоциаций: выявления такой пары мозговых поражений, которые селективно вызывают один из двух контрастируемых неиропсихологических синдромов (см. 2.4.1). Не удивительно, что последним, восьмым признаком когнитивных модулей оказывается фиксированность их нейроанатоми-ческой локализации. В целом, эта группа признаков позволяет сделать дополнительный и, надо сказать, достаточно сильный (если не провокационный) вывод о врожденности модулярных компонентов когнитивной архитектуры.
Вызванные книгой Фодора дискуссии продолжаются в психологии и за ее пределами, не утихая, и по сегодняшний день. Оценивая эту работу, следует отдельно обсудить ее конкретные положения, часть из которых не выдерживает критики, и те, скорее неспецифические последствия, которые она имела для современных когнитивных иссле-
133
дований в целом. Конкретные положения действительно вызывают множество вопросов. Насколько правомерны, например, приписывание модулярных характеристик перцептивным «системам входа» и подчеркнуто «изотропная» интерпретация функционирования «центральных систем»?
Одной из базовых функций перцептивных механизмов (то есть «систем входа», по Фодору) является пространственная локализация объектов и самого наблюдателя. По ряду параметров процессы пространственного восприятия, однако, трудно отнести к типичным модулярным механизмам. Так, восприятие пространства связано с широкой интермодальный интеграцией сенсорной информации (зрение, слух, кинестезия, гаптика и т.д.) и сенсомоторных навыков, основанных на опыте активных локомоций и действий (см. 3.1.1 и 3.4.3). Далее, восприятие пространства оказывается чрезвычайно пластичным, способным корректировать драматические изменения сенсорной информации. Пластичность восприятия сохраняется и у взрослых индивидов, как это было показано в многочисленных экспериментах с адаптацией к искажающим изображение на сетчатке оптическим устройствам (см. 3.4.3). При этом может учитываться также и семантическая информация — на промежуточных этапах адаптации к переворачивающим ретинальное изображение линзам свечка, видимая сначала в перевернутом положении, иногда вдруг воспринимается правильно, если ее поджигают и пламя начинает указывать направление «вверх» (O'Reagan & Noe, 2001).
Обращаясь к центральным системам, можно, напротив, найти массу примеров отклонений от предполагаемой гомогенности («изотропности») высших когнитивных процессов. Лучше всего это иллюстрируют работы по нейропсихологическим механизмам социального интеллекта. Узкая функциональная специализация, типичная картина выпадения, известная как аутизм, и даже возможная узкая локализация мозговых механизмов, которые предположительно связаны с префронтальными областями коры (см. 8.1.1), — все эти признаки механизмов социального интеллекта вполне соответствуют их модулярной интерпретации. Следует сказать, что многочисленные последователи Фодора пытаются в последние годы модифицировать его исходную концепцию, причем главным образом путем распространения модулярного подхода на самые разные, в том числе на высшие познавательные функции (Cosmides & Tooby, 1994). На основании данных, полученных с помощью методов трехмерного мозгового картирования, распространенным становится представление о модулярной организации именно высших форм познания и контроля деятельности (см. подробнее 2.4.2, 4.4.2 и 8.2.3).
В следующих главах мы будем часто упоминать разнообразные специализированные механизмы познавательной активности и анализировать ведущиеся вокруг этого комплекса вопросов дискуссии. Широта и интенсивность споров демонстрируют тот факт, что публикации Фодора по модулярности спровоцировали настоящий всплеск интереса (иногда, впрочем, с элементами протеста) к классическим проблемам
развития и мозговых механизмов познавательных процессов. Хотя соответствующие упоминания работ Выготского, Пиаже и Лурия давно уже стали в когнитивной психологии правилом хорошего тона, лишь с конца 1980-х годов интересовавшие этих авторов проблемы постепенно перемещаются в фокус внимания междисциплинарного научного сообщества когнитологов (см. 9.1.3 и 9.4.2). С этой точки зрения, поиск относительно автономных когнитивных модулей и их возможных нейрофизиологических механизмов действительно может считаться одним из числа наиболее влиятельных и интересных подходов в новейших исследованиях познания.
2.3.3 Нейронные сети в психологии
Другим влиятельным подходом в течение последних 20 лет стал так называемый PDP-подход (от parallel distributed processing = параллельная распределенная обработка), широко известный также как коннекцио-низмн. И в этом случае речь идет об отказе от компьютерной метафоры в ее символьном варианте, связанном первоначально с логико-математическими работами Алана Тьюринга и Джона фон Неймана. Однако, если концепция когнитивных модулей Фодора и его последователей лишь допускает определенную параллельность обработки в каких-то звеньях когнитивной архитектуры, в коннекционизме параллельность обработки становится уже всеобщим принципом. Речь идет о массивной параллельности обработки — все элементы системы, интерпретируемой как обширная нейронная сеть, рассматриваются как потенциально связанные между собой и одновременно участвующие в формировании ответа на стимульную конфигурацию.
Типичная коннекционистская сеть показана на рис. 2.10. Наличие нескольких слоев элементов: входного и выходного слоя плюс не менее одного промежуточного (или «скрытого», от англ. hidden) слоя — отличительная черта современных коннекционистских моделей. Попытки демонстрации вычислительных возможностей сетей формальных нейронов предпринимались американскими нейрофизиологами Мак-Кал-локом и Питтсом еще в 1940-е годы. В последующие два десятилетия простые (один входной и один выходной слой) сети под названием «персептроны» использовались для машинного распознавания изображений, однако без особого успеха, так как оказалось, что они неспособны к строгой дизъюнкции («либо А» — «либо В») — логической операции, необходимой для различения состояний мира. Лишь в начале
14 Распространенный сегодня в психологии и за ее пределами термин «коннекцио-
низм» в историческом контексте впервые был использован Эдвардом Торндайком (на
пример, Thorndike, 1932) для обозначения его основанной на ассоциативных связях сти
мулов и реакций бихевиористской теории научения (см. 1.3.2 и 5.4.2). 135
1980-х годов было показано, что добавление по крайней мере одного «скрытого» слоя нейроноподобных элементов снимает эту проблему, позволяя осуществлять на базе параллельных архитектур весь спектр логических операций. В 1986 году Румелхарт и Макклелланд опубликовали двухтомную «библию» коннекционизма (McClelland & Rumelhart, 1986; Rumelhart & McClelland, 1986), содержащую, наряду с описанием формального аппарата моделирования, многочисленные примеры психологических и нейрофизиологических применений этого подхода.
Главное преимущество коннекционистских моделей по сравнению с традиционными когнитивными моделями — это возможность ассоциативного (контентно-адресованного) и распределенного хранения информации, а также, что особенно важно, адаптивного обучения. Первая особенность означает, что любой фрагмент первоначальной ситуации или любое сопутствующее обстоятельство способны ассоциативно поддержать припоминание. «Распределенным» хранение является потому, что его субстратом является в каждом конкретном случае не какой-то отдельный элемент, а сеть в целом, то есть состояния всех ее узлов и весовые коэффициенты их связей. Наконец, коннекционизм позволяет естественно описывать некоторые элементарные формы обучения. Процессы обучения в искусственных нейронных сетях имеют известную специфику, которая должна стать понятной из нижеследующих примеров. Простейшая, сугубо ассоциативная процедура обучения в нейронных сетях
активация на выходе
выходной слой
тренируемые связи
скрытый слой
входной слой
О О О
активация на входе
136
Рис. 2.10. Однонаправленная (feedforward) коннекционистская сеть, включающая скрытый слой элементов
восходит к классическим идеям проторения путей павловской физиологии и клеточных ансамблей Дональда Хэбба (см. 1.4.2).
В «Организации поведения» Хэбб (Hebb, 1949) предположил, что повторная стимуляция тех же рецепторов постепенно ведет к функциональному объединению нейронов ассоциативных областей мозга, так что этот клеточный ансамбль может сохранять активацию после окончания стимуляции и вновь возбуждаться при возникновении похожего узора стимуляции. В нейроинформатике используется следующее правило Хэбба: между всеми одновременно (синхронно) активированными нейронами (то есть элементами сети) снижаются пороги синаптических связей (повышаются весовые коэффициенты активационных связей). В результате многократных повторений распространение активации при возникновении на входе той же ситуации происходит быстрее, группа элементов, «ансамбль», активируется как целое, и, что важно, эта активация происходит даже при изменениях ситуации, например, выпадении каких-то компонентов изображения, а равно «отмирании» части «нейронов» самой сети. Тем самым удается моделировать особенности целостного восприятия, описанного гештальтпсихологией (см. 1.3.1). Подобная терпимость (graceful degradation) к искажениям на входе и к нарушениям механизма обработки информации разительно контрастирует с хрупкостью обычных символьных программ, где лишний пропуск или неправильно поставленная запятая способны остановить работу программы и даже самого компьютера. Кроме того, пластичность синаптических связей, лежащая в основе формирования ансамблей, позволяет дать физиологическое объяснение процессам обобщения (категоризации) отдельных стимульных ситуаций.
Недостатком описанного механизма самоорганизации нейронных связей является его чрезвычайно медленный, требующий сотен и тысяч повторений характер. В 1981 году немецко-американский нейрофизиолог К. фон дер Мальсбург предположил, что для объяснения одноразового обучения должны существовать быстрые синапсы, меняющие свои характеристики в ответ на однократное возникновение некоторой, обычно новой или значимой ситуации. Мальсбург назвал их «хэббов-скими синапсами». Такие синапсы действительно были обнаружены в последнее время и по предложению Нобелевского лауреата по биологии Фрэнсиса Крика иногда называются теперь «мальсбургскими». Мы подробнее остановимся на обсуждении этих нейрофизиологических механизмов в последующих главах, посвященных сознанию и памяти (см. 4.4.3 и 5.3.2).
Примером более эффективного компьютерного алгоритма обучения в самой нейроинформатике служит предложенный канадским информатикой Джеффри Хинтоном и его коллегами метод обратного распространения ошибки (backpropagation of error). В этом случае сети предъявляется некоторая конфигурация, а затем ответ на выходе сравнивается с идеальным, желаемым ответом. Результат подобного сравнения того, что должно быть (Sollwert), с тем, что есть (Istwert), вычисляется и пропускается затем в обратном направлении: от выхода сети к ее входному слою, причем на каждом промежуточном этапе осуществляются некоторые
коррекции весовых коэффициентов связей элементов с целью последующей минимизации рассогласования. Телеологизм этих процессов и необходимость эксплицитного надсмотра за обучающейся сетью порождают, с одной стороны, множество смутных психологических аналогий, а с другой стороны, известный скептицизм в оценке «обратного распространения» как подходящего средства моделирования когнитивных процессов. Дело в том, что «контролируемая минимизация рассогласования» оставляет сильное впечатление произвольного подбора желаемого результата15.
Ряд коннекционистских моделей использует обратные связи для повторного пропускания продуктов обработки через нейронную сеть. Это свойство, называемое рекуррентностью, позволяет обрабатывать конфигурации на входе в контексте предыдущих событий («прошлого опыта»). Два варианта рекуррентных сетей, использовавшихся для моделирования синтаксического анализа речи, показаны на рис. 2.11. Существует практически открытое множество других вариантов коммутации элементов, а также возможность соединения коннекционистских моделей с традиционными символьными архитектурами в рамках гибридных моделей, включающих как символические, так и коннекцио-нистские компоненты. Так, в литературе интенсивно обсуждается возможность существования разных нейролингвистических механизмов для работы с регулярными и нерегулярными глаголами (Pinker, 2000). В случае регулярных глаголов, склоняемых по определенным фиксированным правилам, в памяти могла бы сохраняться лишь корневая морфема, по отношению к которой осуществляются традиционные символьные трансформации (скажем, добавление «-ed» при переходе к прошедшему времени в английском языке). Работа с нерегулярными глаголами, напротив, требует заучивания индивидуальных паттернов (как в случае грамматических форм английского глагола «to be»: am, are, is, was, were). При моделировании такого, скорее механического, заучивания могли бы помочь нейронные сети (см. 7.1.3).
Коннекционизм не мог не вызвать острых научных дискуссий. Они возникли прежде всего с представителями символьного и модулярного подходов (Fodor & Pylyshin, 1988), для которых подобное применение идеи параллельности ведет слишком далеко, вплоть до отказа от основных принципов переработки символьной информации, выделенных к началу 1980-х годов. В самом деле, в распределенных архитектурах не выполняются основные логические требования к символьной записи информации, а следовательно, к коннекционистским репрезентациям не применимы средства исчисления предикатов (см. 2.3.3). Поэтому,
15 Вне психологии — нейроинформатика, компьютерное зрение и роботика — широко используются алгоритмы обучения нейронных сетей, не требующие внешнего надсмотра. Речь идет прежде всего о разновидности разработанных финским информатикой 138 Т. Кохоненом самоорганизующихся карт (self-organizing maps).
- контекстные нейроны ''
Рис. 2.11. Рекуррентные нейронные сети, применяющиеся для (А) моделирования построения форм прошлого времени английских глаголов и (Б) предсказания грамматической категории следующего слова в предложении (по: Cooper, 1996).
кстати, сами коннекционисты говорят об изучении субсимвольных процессов. Для некоторых видных психологов и лингвистов (например, Levelt, 1990) попытки моделирования познания с помощью обучающихся искусственных нейронных сетей представляют собой лишь слегка осовремененную редакцию упрощенных ассоцианистских взглядов. Интересно, что слабые и сильные стороны более традиционных символьных и относительно новых коннекционистских моделей различаются между собой. Символьные программы относительно удобны при реализации эксплицитных правил и практически беспомощны в области интуитивных достижений, таких как разделение сцены .на фигуру и фон в процессах зрительного восприятия (см. 1.3.1 и 4.3.3). Искусственные нейронные сети, напротив, впервые позволили легко смоделировать эффекты перцептивной организации и, скажем, эффекты ассоциативного обучения и запоминания, но они плохо, путем многочисленных повторных приближений справляются с выделением, казалось бы, совсем простых правил. Это позволяет предположить, что наиболее вероятным будущим в области моделирования познавательных возможностей человека и животных станет использование интегральных или гибридных архитектур, сочетающих достоинства символьного и субсимвольного подходов (и, будем надеяться, свободных от их недостатков!).
Одним из самых первых примеров интегрального подхода, заполняющего брешь между субсимвольными и символьными репрезентациями,
139
являются работы ученика Румелхарта Пола Смоленского (Smolensky, 2005). Использовав математический аппарат тензорного исчисления, он доказал принципиальную возможность построения коннещионистско-символъных когнитивных архитектур (ICS = Integrated Connectionist/ Symbolic), в которых свойства символьных преобразований реализуются
1 на макроуровне описания, тогда как на микроуровне ментальные репре-
зентации описываются как массивно-параллельные процессы распространения волн активации по нейронным сетям. Этот подход был применен Смоленским и его коллегами в области теоретической лингвистики, где они, прежде всего, попытались объяснить разнообразные феномены маркированности — использование специальных лингвистических средств для выражения относительно нетипичных (или «менее гармоничных») в данном контексте языковых конструкций (см. 7.3.2 и 8.1.2). Несмотря на то, что их реализация осуществляется посредством нейро-сетевых механизмов, подобные «гармоничные грамматики» способны, по мнению Смоленского, полностью заменить генеративные грамматики при описании общих принципов функционирования языка. Процесс порождения речевых звуков (модель относится пока преимущественно к сфере фонологии речи — Prince & Smolensky, 1997) описывается при этом как оптимизация решения, удовлетворяющая нескольким гетерогенным правилам, таким как запрет на возникновение последовательностей из большого числа согласных звуков (см. 7.1.1).
В столь динамичной области, как когнитивная наука, трудно предсказывать будущее развитие событий. В рамках работ по вычислительной нейронауке (нейроинтеллекту) и эволюционному моделированию в последнее время начинают рассматриваться более реалистичные, с биологической и биофизической точки зрения, альтернативы искусственным нейронным сетям (такие как самоорганизующиеся карты, клеточные автоматы и, в отдаленной перспективе, квантовые компьютеры — см. Doyle, 2003; O'Reilly & Munakata, 2003). При увеличении объема мозга в процессе эволюции исходный сетевой принцип «всё связано со всем» перестает выполняться, возникают элементы модулярной макроорганизации (Striedter, 2004). Кроме того, при моделировании познания до сих пор практически никак не учитывалась роль нейро-трансмиттеров, химических передатчиков сигналов между нейронами и модуляторов их активности. Диффузное, не ограниченное одним лишь преодолением синапсов действие нейротрансмиттеров может, лежать в основе регуляции эмоциональных состояний и интеграции нейронов в сложные самоорганизующиеся системы. Последнее представляется очень существенным — ведь целостный мозг демонстрирует не только способности решения тех или иных узкопознавательных задач, но и множество других биологически и социально необходимых функций, в частности, связанных с эмоциями и мотивированным поведением (см. 2.4.3 и 9.4.3).