На правах рукописи
Салтыков Александр Борисович
КОНЦЕПЦИЯ СИСТЕМООБРАЗУЮЩЕГО ФАКТОРА
В ТЕОРИИ ФУНКЦИОНАЛЬНЫХ СИСТЕМ
14.00.16 - патологическая физиология
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
доктора медицинских наук
Москва
2009
Работа выполнена в ГОУ ВПО Московская медицинская академия им. И.М.Сеченова
Научный консультант:
доктор медицинских наук, профессор Войнов Владимир Антипович
Официальные оппоненты:
доктор медицинских наук,
профессор Дроздова Галина Александровна
доктор медицинских наук,
профессор Журавлев Борис Васильевич
доктор медицинских наук,
профессор Болевич Сергей Бранкович
Ведущая организация: Научно-исследовательский институт общей патологии и патофизиологии РАМН
Защита диссертации состоится "_____"_______________ 2009 г. в ______ часов на заседании диссертационного совета Д.208.040.08 при Московской медицинской академии им.И.М.Сеченова (119992, г. Москва, ул. Трубецкая, д.8, стр. 2)
С диссертацией можно ознакомиться в библиотеке Московской медицинской академии им. И.М.Сеченова (117198, г. Москва, Нахимовский проспект, д. 49).
Автореферат разослан " " 2009 г.
Ученый секретарь
диссертационного совета
доктор медицинских наук,
профессор Миронов Андрей Юрьевич
Хитрову Николаю Константиновичу
посвящается
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Системный подход имеет фундаментальное значение для диагностики, лечения и профилактики заболеваний. При этом особый интерес вызывают работы школы П.К.Анохина по теории функциональных систем (ТФС), раскрывающей универсальные механизмы регуляции жизнедеятельности в условиях нормы и патологии (Анохин П.К., 1970, 1978, 1980; Судаков К.В., 1984; 1999, 2006). Ее ключевым элементом является концепция системообразующего фактора, рассматриваемая как методологический принцип, своего рода "концептуальный мост", позволяющий исследователю оценить аналитические данные с точки зрения системных организаций (Судаков К.В., 1997).
Универсальным системообразующим фактором - неотъемлемым и решающим компонентом системы, упорядочивающим взаимодействия других ее компонентов - считается достижение полезного (адаптивного) результата. Это представление лежит в основе принципа квантования процессов жизнедеятельности (от потребности к ее удовлетворению) и информационной модели поведенческого акта, используемой также для анализа эмоциональных реакций (биологическая теория эмоций) и гомеостатических функций. Благодаря ему "в корне изменилась расшифровка компенсаторного процесса при восстановлении нарушенных функций, более глубоко понят генез гипертензивных состояний вообще и, в частности, гипертонической болезни, изменилась расшифровка понятий заболевания и выздоровления и т.д. Практически все формы нарушений и нормальные функции организма более легко расшифровываются с точки зрения теории функциональных систем, чем при обычном подходе" (Анохин П.К., 1978). Однако предполагаемое адаптивное значение системной деятельности ограничивает клиническое использование теории рамками адаптивно-компенсаторных реакций. Изучение информационной патологии высшей нервной деятельности (ВНД) дополнительно затрудняется игнорированием вероятностного прогнозирования.
Основоположник теории писал: л... выражение "вероятностное (?) прогнозирование" просто не соответствует физиологическому смыслу событий и неправильно ориентирует читателей, интересующихся нашими работами. Вероятность прогноза, т.е. параметров акцептора результата действия, всегда максимальная и равна единице, поскольку она отражает потребность организма на данный момент. Наоборот, результат всегда менее вероятен по отношению к акцептору действия, и, следовательно, выражение "вероятностное прогнозирование" едва ли оказывается полезным при изучении живых систем (Анохин, 1978). Вместе с тем, его учет представляется необходимым при анализе ВНД в вероятностно организованной ("случайной") среде (Батуев А.С., 2005; Фейгенберг И.М., 2008; Wilde G.S., 1998; Brune H., 2003; LePelley M.E. e. a., 2004), обычно воспроизводимой в эксперименте на основе неоднозначной для индивидуума связи между условным раздражителем и подкреплением (вероятностный характер безусловного раздражителя, околопороговая интенсивность условного стимула, варьирование межстимульных интервалов и т.д.); жестко детерминированная среда при этом рассматривается как частный случай. Подобные условия впервые были воспроизведены в опытах И.П.Павлова по дифференцировке сходных условных раздражителей (овал и круг, близкие по частоте звуковые сигналы и т.п.), инициировавших у животных эмоциональное напряжение вплоть до формирования невроза.
Связь эмоций, поведения и вероятностного прогнозирования наиболее глубоко представлена в потребностно-информационной теории П.В.Симонова (1975, 1987, 1993). Утверждается, что эмоция отражает интенсивность актуальной потребности и вероятность ее удовлетворения, обычно неосознанно оцениваемой на основе врожденного и приобретенного опыта. Положительные эмоции возникают при увеличении прогнозируемой вероятности достижения цели, отрицательные - при ее уменьшении или изначально низких значениях. За исключением ключевого положения о вероятностном прогнозировании, эта трактовка соответствует биологической теории эмоций, ранее разработанной в рамках ТФС (положительные эмоции возникают при совпадении достигнутого результата с прогнозом аппарата акцептора, отрицательные - при несовпадении). Более того, именно ТФС, в отличии от других теорий и концепций (Батуев А.С., 1981, 2005; Хананашвили М.М., 1983; Симонов П.В., 1993; Pribram K., 1975; Mackintosh N.J., 1974; Izard C., 1999; Regia J.A. et al., 2002; Mayes L. et. al., 2007), наиболее полно раскрывает универсальные этапы поведенческой деятельности (афферентный синтез, формирование цели и т.д.). Учет их специфики необходим при изучении информационной патологии ВНД, что, однако, предполагает интеграцию ТФС с представлением о вероятностном прогнозировании.
Информационная патология ВНД - фактор риска многих психических и психосоматических заболеваний: синдрома хронической усталости, реккурентных депрессивных расстройств, ишемической болезни сердца, эссенциальной гипертонии, язвенной болезни желудка и др. Стрессорные и невротические расстройства информационного генеза формируются при неблагоприятном сочетании трех "первичных" факторов: объема обрабатываемой информации; времени, отведенного для этой работы мозга; уровня мотивации поведенческой деятельности (Хананашвили М.М., 1978, 1983, 2007; Restian A., 1997; Milton C.H., 1998). Сочетание считается неблагоприятным, во-первых, при обработке большого объема информации в условиях дефицита времени и высокого уровня мотивации, и, во-вторых, при длительном дефиците необходимой информации на фоне высокой мотивация поведения. В обоих случаях характерно вынужденное использование вероятностных оценок с соответствующим психоэмоциональным напряжением и возможностью информационной патологии ВНД (Бодров В.А., 2000; Фейгенберг И.М., 2008; Dworkin B., 1993; Mazur J., 1995; Crone E.A. et al, 2003).
Цель работы: изучить механизмы информационной патологии ВНД в рамках ТФС, интегрированной с представлением о вероятностном прогнозировании на основе концепции о системообразующей роли полезного результата.
Задачи:
1. Обосновать согласованность концепции универсального системообразующего фактора (достижение полезного результата) с представлением о вероятностном прогнозировании.
2. На основе концепции системообразующего фактора интегрировать модель поведенческого акта и принцип системного квантования (от потребности к ее удовлетворению), с одной стороны, и представление о вероятностном прогнозировании, с другой. Охарактеризовать значение вероятностных оценок в формировании информационной патологии ВНД на разных этапах поведенческой деятельности: афферентного синтеза, принятия решения и др.
3. В рамках ТФС, интегрированной с представлением о вероятностном прогнозировании, провести компьютерное моделирование условнорефлекторной деятельности в "случайной" среде; сопоставить выявленные закономерности с экспериментальными данными, известными из литературы. Охарактеризовать возможное значение в генезе информационной патологии ВНД ранее не учитываемого параметра - вероятности случайной правильной реакции (ВСПР).
4. Разработать методику оценки условнорефлекторной деятельности, учитывающую влияние величины ВСПР на процесс информационного взаимодействия индивидуума со средой.
5. Проверить в экспериментах на животных влияние ВСПР на формирование инструментального рефлекса в вероятностно организованной среде (вероятностный характер подкрепления, околопороговая интенсивность условного стимула). Доказать необходимость учета этого параметра при изучении патогенеза информационного стресса и информационного невроза, а также при разработке методов их профилактики.
6. На основе принципа системного квантования, интегрированного с представлением о вероятностном прогнозировании, разработать способ оптимизации процесса выработки у человека неосознаваемых субсенсорных условных реакций.
Научная новизна. Впервые сформулирована целостная концепция, отражающая значение вероятностного прогнозирования в формировании информационной патологии ВНД на разных этапах поведенческой деятельности (афферентного синтеза, формирования цели и др.). Стрессорные и невротические расстройства информационного генеза возникают на фоне высокой мотивации поведения в ситуации субъективной неопределенности, инициирующей вероятностное прогнозирование и психоэмоциональное напряжение. Субъективная неопределенность возникает при наличии взаимоисключающих мотиваций или путей удовлетворения одной и той же потребности, сложном характере обстановочной и пусковой афферентаций, конкуренции целей (моделей будущего результата) и в других случаях, наиболее полно раскрываемых в рамках ТФС.
Впервые обоснована согласованность концепции универсального системообразующего фактора (достижение адаптивного результата) с представлением о вероятностном прогнозировании. Системообразующий эффект полезного результата в вероятностно организованных средах реализуется относительно медленно (не незамедлительно), что предполагает возможность комплексной оценки различных по значению промежуточных результатов (оценку вероятности интересующего события с последующим вероятностным прогнозированием). Учет этого обстоятельства позволяет использовать аппарат ТФС, наиболее полно раскрывающей последовательность универсальных этапов поведенческой деятельности, для анализа информационной патологии ВНД.
Впервые показано, что достижение полезного результата (как системообразующего фактора) не всегда инициирует образование функциональных систем со строго адаптивным значением. В зависимости от особенностей метаболизма, параметров внешней среды и других условий его достижение может приводить к образованию систем с амбивалентным и даже дизадаптивным значением: некоторые варианты условнорефлекторной деятельности, ожирения, наркомании, алкоголизма. Это представление расширяет сферу применения ТФС, подчеркивая отсутствие четкой границы между адаптивными и дизадаптивными проявлениями жизнедеятельности (нормой и патологией). С другой стороны, облегчается возможная интеграция ТФС с представлением о патологических функциональных системах (Крыжановский Г.Н, 2002), имеющих патогенное значение.
Теоретическая и практическая значимость работы
На основе концепции системообразующего фактора интегрированы модель поведенческого акта и принцип системного квантования жизнедеятельности, с одной стороны, и представление о вероятностном прогнозировании, с другой. Сформулировано положение о вероятностном характере принятия решения об изменении программы поведения: оно принимается на основе комплексного учета результатов поведенческих актов, выполненных в процессе реализации текущей программы (информация о них накапливается в "буфере памяти"). Вероятностное прогнозирование допускается также на других этапах поведения (афферентный синтез, формирование цели и др.), что позволяет изучать информационные механизмы их формирования в вероятностно организованной среде в условиях нормы и патологии.
Информационная патология ВНД возможна на любом универсальном этапе поведенческой деятельности (выделяемых в рамках ТФС) в условиях субъективной неопределенности, предполагающих использование вероятностных оценок. При этом каждый этап характеризуется определенной спецификой: афферентный синтез - сложной и неоднозначной обстановочной афферентацией, конкуренцией нескольких потребностей за первоочередное удовлетворение; формирование цели - ее субъективно расплывчатым (вероятностным) характером, конкуренцией различных моделей будущего результата; и т.д. Рассмотрение в рамках единого подхода разных вариантов информационных расстройств облегчает их диагностику, лечение и профилактику, а также разработку и сопоставление соответствующих экспериментальных моделей.
Разработана методика компьютерной имитации процесса выработки условного рефлекса, учитывающая в рамках ТФС представление о вероятностном прогнозировании. Это значительно облегчает планирование экспериментов при различных комбинациях значений вероятностно организованной среды.
Теоретически предсказано и экспериментально подтверждено влияние ранее не учитываемого параметра (вероятности случайного правильного выполнения вырабатываемой реакции) на формирование инструментальных рефлексов. Неблагоприятные для обучения значения параметра затрудняют информационное взаимодействие со средой, способствуя развитию стрессорных и невротических расстройств информационного генеза вплоть до формирования приобретенной беспомощности. Полученные результаты следует учитывать при разработке методов профилактики информационной патологии, оценке устойчивости к стрессорным воздействиям, компенсации нарушенных функций клинико-психологическими методами, разработке новых способов фармакологической коррекции расстройств ВНД.
Разработана методика оценки процесса выработки инструментального рефлекса, учитывающая априорную вероятность случайного выполнения правильной реакции. Подтверждена целесообразность ее использования для статистического сравнения результатов экспериментов, проведенных в разных условиях (при разных ВСПР).
Доказана возможность оптимизации когнитивной деятельности человека на основе неосознаваемого восприятия информационно значимых стимулов, предъявляемых в электронегативные фазы ЭЭГ (ритм ЭЭГ навязывался световыми мельканиями с частотой 10 Гц). Методика разработана на основе классического для ТФС принципа системного квантования процессов жизнедеятельности, интегрированного с представлением о вероятностном прогнозировании. Полученные результаты следует учитывать при проведении процедур неосознаваемой стимуляции, осуществляемых с диагностической или лечебной целью.
Связь задач исследований с проблемным планом
Работа выполнена по плану научно-исследовательских работ ММА им.И.М.Сеченова в рамках научной темы: "Разработка современных технологий подготовки специалистов с высшим медицинским образованием на основе достижений медико-биологических исследований" (номер регистрации: 01.2.006 06352).
Апробация работы
Материалы диссертации представлены и обсуждены на: 1) Междунар. конф. Эмоции и поведение: системный подход (Москва, 1984); 2) 9-й Всес. конф. Измерения в медицине и их метрологическое обеспечение (Москва, 1989); 3) Всес. съезде патофизиологов (Кишинев, 1989); 4) Всес. семинаре "Моделирование функционирования развивающихся систем с изменяющейся структурой" (Киев, 1990); 5) учредит. конгрессе Международного общества патофизиологов (Москва, 1991); 6) 1-м Рос. конгрессе по патофизиологии (Москва, 1996).
Апробация работы состоялась на совместном заседании кафедры патологической физиологии и кафедры патологической анатомии с курсом общей патологии ММА им.И.М.Сеченова 18 декабря 2008 г.
Внедрение результатов исследования
Результаты работы используются в преподавании курса общей патологии при кафедре патологической анатомии ММА им. И.М.Сеченова, представлены в курсе лекций по патологии (под ред. М.А.Пальцева. - М., 2007) и учебнике по патологии (под ред. М.А.Пальцева, В.С.Паукова. - М., 2008).
Основные положения, выносимые на защиту
1. Концепция системообразующего фактора предполагает использование вероятностного прогнозирования при реализации ВНД в "случайных" средах (вероятностный характер безусловного подкрепления, околопороговый условный сигнал и т.д.). В этих условиях устойчивое достижение полезного результата (как системообразующего фактора) возможно только с использованием вероятностных оценок. Поэтому традиционное для ТФС положение о несоответствии вероятностного прогнозирования "физиологическому смыслу событий" не распространяется на поведение в вероятностно организованной среде. Концепция системообразующего фактора позволяет интегрировать ТФС с представлением о вероятностном прогнозировании, что облегчает анализ ВНД в условиях нормы и патологии.
2. Интеграция ТФС с представлением о вероятностном прогнозировании повышает эвристическое значение теории: предсказано и экспериментально подтверждено влияние ранее не учитываемого параметра (вероятности случайного выполнения правильной реакции) на формирование условных рефлексов. Оптимальные для обучения значения параметра облегчают выработку рефлекса при вероятностном режиме безусловного подкрепления или околопороговой интенсивности условной стимуляции. Напротив, при неблагоприятных для обучения значениях процесс информационного взаимодействия индивидуума со средой затрудняется, что способствует развитию информационной патологии ВНД.
3. Информационная патология ВНД возможна на любом из универсальных этапов поведенческой деятельности, наиболее полно раскрываемых в рамках ТФС: афферентный синтез, принятие решения и др. В основе ее патогенеза лежит сложность и неоднозначность информационного взаимодействия индивидуума со средой (необходимость срочной обработки больших объемов информации, дефицит в течение длительного времени необходимой информации). Субъективная неопределенность, возникающая на любом этапе поведения, снижает прогнозируемую вероятность удовлетворения доминирующей потребности, инициируя психоэмоциональное напряжение. Обычно оно оказывается чрезмерным (формирующим стрессорные и невротические расстройства информационного генеза) в случае высокой мотивации поведенческой деятельности.
Публикации по теме диссертации
По теме диссертации опубликовано 33 печатных работы (из них - одна монография).
Структура и объем диссертации
Диссертация изложена на 174 страницах машинописи, содержит введение, обзор литературы, материал и методы исследования, главу полученных результатов и их обсуждение, заключение, выводы, список литературы. Работа содержит 16 рисунков и 12 таблиц. Список литературы включает 392 источника, из которых 167 - в отечественных изданиях.
МАТЕРИАЛ И МЕТОДЫ
Исследование с участием практически здоровых лиц в возрасте от 18 до 35 лет (всего 34 человека, из них 3 женщины) проводилось в соответствии с требованиями межвузовского комитета по этике при ассоциации медицинских и фармацевтических вузов. Опыты на животных выполнены на белых беспородных крысах-самцах массой 250-310 г (всего 258 животных). Также проводилась компьютерная имитация условнорефлекторного обучения при различных сочетаниях параметров вероятностно организованной среды (более 32 000 имитационных экспериментов). Исследования на испытуемых-добровольцах проведены автором лично, эксперименты на животных - совместно в А.В.Толокновым и Н.К.Хитровым. Первичная и статистическая обработка данных, анализ литературы, разработка теоретических положений и выводов, подготовка текстов публикаций, а также компьютерных программ (имитационного моделирования условнорефлекторного обучения, неосознаваемой ритмической стимуляции) сделаны автором лично.
В 1-й, 2-й и 4-й сериях экспериментов на животных вырабатывали инструментальный рефлекс нажатия на педаль на фоне светового (в 3-й серии - звукового) условного сигнала. Подкрепляющим было электрокожное раздражение лап через решетку пола, превышающее болевой порог на 20-30% и длящееся 5 с. Если при этом осуществлялось нажатие на педаль, электрокожное раздражение досрочно прекращалось, что стимулировало поисковые (пробные) инструментальные реакции. Крысы могли полностью избежать электрокожного раздражения при правильном выполнении инструментального акта (нажатии на педаль в период действия условного сигнала). При этом в одних экспериментальных группах электрокожная стимуляция отменялась в 100% случаев, тогда как в других использовали 50% или 25%-е вероятностное подкрепление. Ежедневно в каждом опыте предъявляли 40 сочетаний.
При определении продолжительности условной стимуляции и межстимульных интервалов не учитывалось время нажатия на педаль; животное удалялось с педали, если длительность нажатия превышала 15 с. При определении длительности интервалов между условными сигналами не учитывалось также время электрокожной стимуляции и период в 2 с после нее (необходимый для прекращения хаотических перемещений и восстановления поисковой активности), а выполняемые при этом нажатия как поисковые реакции не учитывались. Рефлекс считали выработанным при достоверном превышении общего (за все опыты с данным животным) числа правильных реакций над априорным уровнем их случайного осуществления (Салтыков А.Б. и др., 1986). Для этого использовали критерий χ2, р < 0,05.
Эмоциональное напряжение оценивали по частоте дефекации, интенсивности хаотичных перемещений, визгу, царапаньям клетки (Хананашвили М.М., 1983, 2008). Если от опыта к опыту нарастало эмоциональное безразличие к стимуляции, снижались поисковая активность и масса тела, выпадала шерсть и наблюдались другие признаки приобретенной беспомощности, животное устранялось из эксперимента.
В 1-й серии крысы были разделены на 4 группы по 10 особей в каждой (табл. 1). Интервалы между условными стимулами задавали по таблице случайных чисел: для 1-й и 3-й групп они колебались от 1 до 113 с (в среднем 57 с), для 2-й и 4-й от 1 до 17 с (в среднем 9 с). При равномерном во времени распределении поисковых инструментальных реакций (до выявления связи между условным сигналом и подкреплением) априорная вероятность случайного нажатия на педаль на фоне 3-секундного горения лампочки в 1-й и 3-й группах составляла 3 с / (3 с + 57 с) = 0,05, а во 2-й и 4-й - 3 с / (3 с + 9 с) = 0,25. В 1-й и 2-й группах
Таблица 1
Условия выработки инструментального оборонительного рефлекса у крыс 1-й серии (ВСПР - вероятность случайной правильной реакции; в скобках - математическое ожидание варьируемых величин)
№ груп- пы | ВСПР | Продолжительность | Частота подкрепления правильных реакций, % | |
условного сигнала, с | Интервалов между ус-ловными сигналами, с | |||
1 2 3 4 | 0,05 0,25 0,05 0,25 | 3 3 3 3 | 1-113 (57) 1-17 (9) 1-113 (57) 1-17 (9) | 100 100 50 50 |
применяли 100%-е подкрепление правильных реакций, а в 3-й и 4-й - 50%-е (определяемое по таблице случайных чисел).
Во 2-й серии было 8 групп по 8 особей в каждой. В группах I-IV правильные инструментальные реакции подкреплялись отменой электрокожной стимуля-ции в 100% случаев, а в группах V-VIII - в 25%. В каждой группе длительности светового стимула и межстимульного периода подбирали так, чтобы их суммарная продолжительность в среднем равнялась 40 с (табл. 2). Длительность каждого условного стимула определяли по таблице случайных чисел. Продолжительность последующего межстимульного интервала зависела от длительности предшествовавшей условной стимуляции: в группах I и V они были одинаковыми, в группах II и VI межстимульный интервал превышал
Таблица 2
Условия выработки инструментального оборонительного рефлекса у крыс 2-й серии (в скобках указано математическое ожидание варьируемых величин)
№ груп-пы | ВСПР | Продолжительность | Частота подкрепления правильных реакций, % | |
условного сигнала, с | Интервалов между условными сигналами, с | |||
I II II IV V VI VII VIII | 0,5 0,25 0,125 0,05 0,5 0,25 0,125 0,05 | 1 - 39 (20) 1 - 19 (10) 1 - 9 (5) 1 - 3 (2) 1 - 39 (20) 1 - 19 (10) 1 - 9 (5) 1 - 3 (2) | 1 -39 (20) 3 - 57 (30) 7 - 63 (35) 19 - 57 (38) 1 - 39 (20) 3-57 (30) 7 - 63 (35) 19 - 57 (38) | 100 100 100 100 25 25 25 25 |
предшествующий условный сигнал в 3 раза, в III и VII - в 7 раз, в IV и VIII - в 19 раз. До выявления связи между условным сигналом и подкреплением ВСПР для указанных пар групп составило (табл. 2): 20 с / (20 с + 20 с) = 0,5; 10 с / (10 с + 30 с) = 0,25; 5 с / (5 с + 35 с) = 0,125; 2 с / (2 с + 38 с) = 0,05.
В 3-й серии предъявлялся звуковой условный сигнал при 100%-м подкреплении правильных реакций. Было сформировано 8 групп животных по 9 особей в каждой. В группах 1, 3, 5, 7 использовали сильный звуковой раздражитель (60 дБ), в группах 2, 4, 6, 8 - слабый (20 дБ). Условия эксперимента подбирали так, чтобы в разных группах продолжительность межстимульных интервалов и/или интенсивность условной стимуляции были разными (табл. 3).
ВСПР в 1-й и 2-й группах составляла 2 с / (2 с + 38 с) = 0,05; в 3-й и 4-й - 10 с / (10 с + 30 с) = 0,25; и т.д. Эксперимент был автоматизирован на базе компьютера
Таблица 3
Условия выработки инструментального оборонительного рефлекса у крыс 3-й серии
№ груп-пы | ВСПР | Продолжительность | Интенсивность звукового условного стимула, дБ | |
условного сигнала, с | Интервалов между условными сигналами, с. | |||
1-я 2-я 3-я 4-я 5-я 6-я 7-я 8-я | 0,05 0,05 0,25 0,25 0,05 0,05 0,25 0,25 | 2 2 10 10 4 4 4 4 | 38 38 30 30 76 76 12 12 | 60 20 60 20 60 20 60 20 |
Comodore-64 (ФРГ).
4-я серия экспериментов уточняла динамику поисковой инструментальной активности в различные периоды обучения при 100%-м режиме подкрепления, условным был световой сигнал. Животных разделили на 4 группы по 10 особей в каждой (табл. 4). До момента выявления связи между условным сигналом и подкреплением априорная вероятность случайного нажатия на педаль на фоне горения лампы в 1-й группе равнялась 3 с / (3 с + 57 с) = 0,05, во 2-й - 3 с / (3 с + 9 с) = 0,25 и т.д.
Таблица 4
Условия выработки инструментального оборонительного рефлекса у крыс 4-й серии (в скобках указано математическое ожидание варьируемых величин)
№ группы | ВСПР | Продолжительность, с | |
условного сигнала | интервалов между условными сигналами | ||
1-я 2-я 3-я 4-я | 0,05 0,25 0,05 0,25 | 3 3 1 - 3 (2) 1 - 19 (10) | 1 - 113 (57) 1 - 17 (9) 19 - 57 (38) 3 - 57 (30) |
Неосознаваемая ритмическая стимуляция испытуемых-добровольцев осуществлялась с помощью компьютера IBM PC/AT c дисплеем EGA. Первоначально в течение 5 мин навязывался высокоамплитудный -ритм ЭЭГ частотой 10 Гц с предъявлением неосознаваемого раздражителя в электронегативные фазы (всего 3000 сочетаний). Каждый 100-мс цикл эксперимента начинался с белой вспышки (длительностью 20 мс, яркостью 40 кд/м2) всего экрана дисплея. Через 35 мс в центре экрана с той же яркостью белыми буквами высвечивался неосознаваемый стимул (слово размером 1,8*0,5 см), содержащий информацию, облегчающую последующую когнитивную деятельность. На 65-й мс цикла неосознаваемый стимул устранялся, а его место "забивалось" символами "Х".
Через 3 мин после прекращения неосознаваемой стимуляции выполнялось тестовое задание, предполагающее когнитивную деятельность. В экспериментальную группу входило 12 чел. Проведены 2 контрольных исследования: в одном из них (10 чел.) в процессе неосознаваемой стимуляции не навязывался -ритм ЭЭГ; в другом (12 чел.) - отсутствовала неосознаваемая стимуляция перед выполнением "когнитивного" теста.
Компьютерную имитацию процесса выработки инструментального рефлекса в вероятностно организованной среде осуществляли на "Плюримат" (Франция). Для каждой комбинации изучаемых параметров проводили по 50 имитационных экспериментов, что позволяло вычислять среднее арифметическое числа необходимых для обучения поисковых инструментальных реакций, а также доверительный интервал. Всего выполнено около 32 000 имитационных экспериментов.
Статистическая обработка проводилась на основе непараметрических критериев: U (Манна-Уитни), χ2. Для наглядного представления экспериментальных данных подсчитывались средние арифметические величины и их 95%-е доверительные интервалы.
Результаты исследования и их обсуждение
1. Обоснование соответствия вероятностного прогнозирования концепции системообразующего фактора
Традиционное для ТФС игнорирование вероятностных оценок обусловлено определенной трактовкой системообразующего фактора, не имеющей универсального значения. Она предполагает незамедлительное упорядочивание межкомпонентных связей сразу после достижения полезного результата (полного или частичного удовлетворения потребности) и столь же быстрый их распад при внезапном его отсутствии (Анохин П.К., 1978; Судаков К.В., 1984, 2006). Такая трактовка акцентирует внимание на отдельно взятом (последнем) поведенческом акте, делая избыточной комплексную оценку совокупности поведенческих реакций (необходимую для выявления вероятности интересующего события). Указанный акцент подчеркивается даже названием известной модели (рис. 1) и затрудняет анализ ВНД в "случайных" средах.
Рис. 1. Модель поведенческого акта (Анохин П.К., 1970).
ПА - пусковая, ОА - обстановочная афферентация
Однако в рамках этой модели, на наш взгляд, все же можно допустить вероятностное прогнозирование на этапе афферентного синтеза (на основе комплексной оценки хранящихся в памяти параметров ранее полученных результатов). Еще большее значение имеет то, что представление о незамедлительном формировании и распаде функциональных систем не является единственно возможным для ТФС. На основе концепции системообразующего фактора К.В.Судаковым (1984, 1999, 2006) разработан принцип системного квантования поведения. Каждый квант включает в себя потребность (мотивацию), целенаправленное поведение, этапные и конечные результаты, их оценку на основе обратной афферентации (рис. 2). Известно, что отдельные промежуточные результаты могут способствовать, а другие - препятствовать удовлетворению
Рис. 2. Отдельный "квант" поведенческой активности (Судаков К.В., 1984). А, Б, В, Г, ...n - события внешнего мира; Р1-Р6 - промежуточные положительные (+) и отрицательные (-) результаты поведения
потребности. Из этого, на наш взгляд, следует возможность комплексной оценки совокупности промежуточных результатов в пределах отдельного кванта, т.е. выявление вероятности интересующего события (вероятностный прогноз параметров очередного результата). Таким образом, представление о вероятностном прогнозировании принципиально согласуется с концепцией универсального системообразующего фактора и может быть интегрировано с ТФС.
2. Интеграция ТФС и представления о вероятностном прогнозировании.
На рис. 3 представлена модель поведения, учитывающая вероятностно-статистические характеристики среды. В отличие от прототипа (рис. 1) она допускает вероятностное прогнозирование на каждом этапе поведенческой дея-
Рис. 3. Модель поведения в вероятностно организованной среде.
ПА - пусковая, ОА - обстановочная афферентация
тельности, начиная с афферентного синтеза. Также вводятся два новых компонента, отражающих вероятностные аспекты этапа реализации программы действий: аппарат принятия решения об изменении (сохранении) программы действий и "буфер памяти" (промежуточных результатов). Принятие решения осуществляется после каждого поведенческого акта на основе комплексного учета результатов не только последнего, но и всех предыдущих поведенческих актов, выполненных при реализации текущей программы (информация о них накапливается в "буфере памяти"). Такая трактовка позволяет избегать немедленной перестройки афферентного синтеза, принятия новой цели, формирования новой программы при каждом несоответствии результатов очередного поведенческого акта имеющимся ожиданиям. Это облегчает анализ механизма формирования оптимальной программы действий в вероятностно организованной среде и, в конечном счете, системной организации поведения (поскольку достижение конечного полезного результата является системообразующим фактором). Проведенная коррекция получила определенную поддержку: Нам весьма импонирует попытка... дополнить системную архитектонику поведенческих актов двумя новыми аспектами, отражающими вероятностные аспекты поведения (действий, скажем мы), - "буфер памяти" и аппарат вероятностных решений об изменении программ действия (Судаков К.В, 2003).
Дискретность (инерционность) изменений программы действий, в свою очередь, предполагает квантование процесса информационного взаимодействия индивидуума со средой. Каждому "информационному кванту" соответствует определенная программа действий (рис. 4). После принятия вероятностного решения о ее изменении информационный квант завершается и начинается новый (с новой программой действий, подлежащей реализации). В процессе удовлетворения потребности возможна последовательная смена несколько информационных квантов, если ранее использованные программы поведения оказались недостаточно удовлетворительными. Это представление конкретизирует вероятностный механизм поиска оптимальной программы действий при реализации описанного К.В.Судаковым (рис. 2) системного кванта поведенческой деятельности: Можно согласиться..., что "информационные кванты" в условиях вероятностного удовлетворения соответствующей потребности в окружающей среде динамически, иерархически перебираются и последовательно сменяют друг друга. Авторы справедливо полагают, что иногда до момента удовлетворения потребности могут смениться несколько "информационных квантов", результатом которых, по мнению авторов, является изменение программы действий (Судаков К.В., 1999).
Рис. 4. "Информационный квант" взаимодействия индивидуума со средой
Учет вероятностного прогнозирования в рамках ТФС позволяет сформулировать целостную концепцию, отражающую значение вероятностного прогнозирования в формировании информационной патологии ВНД на разных этапах поведения (афферентного синтеза, формирования цели и др.). Информационная патология возникает на фоне высоко мотивированного поведения в ситуации субъективной неопределенности, инициирующей вероятностное прогнозирование и психоэмоциональное напряжение. Субъективная неопределенность возникает при наличии взаимоисключающих мотиваций или путей удовлетворения одной и той же потребности (Симонов П.В., 1987, 1993), сложном характере обстановочной и пусковой афферентаций, конкуренции целей (моделей будущего результата) и во многих других случаях, наиболее полно раскрываемых в рамках ТФС.
3. Компьютерное моделирование условнорефлекторного обучения в вероятностно организованной среде
А. Алгоритм компьютерного моделирования.
Интеграция ТФС и представления о вероятностном прогнозировании позволяет воспроизводить (имитировать) на компьютере процесс выработки инструментального рефлекса в "случайной" среде. Предполагается, что на этапе афферентного синтеза ориентировочно-поисковые инструментальные реакции распределены равномерно относительно (1-й информационный квант). При этом вероятность р(а) случайного выполнения инструментальной реакции в сопряженные с предъявлением условного сигнала интервалы времени равна отношению длительности этих интервалов к длительности эксперимента. Ошибочная реализация вырабатываемого поведенческого акта, не сопряженная с предъявлением условного сигнала, равна 1 - р(а). Кроме того, в "случайной" среде вероятность р(к/а) получения подкрепления в связи с действием условного сигнала может быть меньше единицы, а вне времени его предъявления - р(к/b) - больше нуля. После выявления связи между условным сигналом и подкреплением вероятность выполнения инструментальных реакций в связи с условным сигналом резко повышается, т.е. начинается следующий, 2-й информационный квант (осуществляется новая программа действий на основе неизменной цели).
Предположим, вырабатывается рефлекс нажатия на рычаг во время действия условного раздражителя с использованием положительного (пищевого) подкрепления. Пусть совершено N ориентировочно-поисковых нажатий. Тогда математическое ожидание числа нажатий на рычаг, случайно пришедшихся на период действия условного сигнала, равно N p(a), а количества полученных при этом пищевых подкреплений - N p(a)р(к/a). Аналогично производится подсчет для других случаев, представленных в матрице возможных исходов (табл. 5); при этом отсутствие положительного подкрепления рассматривается как отрицательное подкрепление.
Компьютерное моделирование осуществлялось методом Монте-Карло: генератор случайных чисел "распределял" каждую имитируемую поисковую реакцию в одну из ячеек 4-польной таблицы (к ее содержимому прибавлялась единица) с учетом предварительно заданных параметров среды. После имитации инструментальной реакции по критерию χ2 для 4-польной таблицы производился выбор между двумя статистическими гипотезами: Н0 - связь между
Таблица 5
Математическое ожидание числа подкреплений различной модальности, получаемых в ходе обучения (обозначения в тексте)
Условный сигнал | Число подкреплений | |
положительных | отрицательных | |
Предъявлен Отсутствует | N p(a)р(к/a) N [1-p(a)]р(к/b) | N p(a)[1-р(к/a)] N [1-p(a)][1-р(к/b)] |
предъявлением условного сигнала и подкреплением отсутствует и Н1 - связь между предъявлением условного сигнала и подкреплением существует. В случае принятия нулевой гипотезы "генерировалась" очередная инструментальная реакция. Напротив, выбор альтернативной гипотезы означал прекращение имитации: считалось, что после этого вероятность правильного выполнения (в связи с условным сигналом) инструментальных реакций резко повышалась, т.е. начинался новый информационный квант с новой, более оптимальной программой действий.
Системообразующим фактором в процессе моделирования является полезный результат. Под программой действий понимается осуществление поисковых инструментальных реакций. Работа аппарата акцептора моделируется алгоритмом заполнения матрицы возможных исходов (табл. 5). Она накапливает поступающую к гипотетическому обучаемому информацию, что позволяет рассматривать ее как "буфер памяти" (рис. 3). Механизм принятия вероятностного решения об изменении (сохранении) программы действий имитируется статистическим критерием χ2; уровень значимости (ошибка 1-го рода) определяет "инерционность" работы механизма принятия вероятностных решений и задается как независимый параметр.
Описанная методика предполагает, что каждый имитируемый инструментальный акт с определенной вероятностью сопровождается соответствующим подкреплением. Указанное условие соблюдается не всегда, примером чего служат наши собственные исследования на животных (см. "Материал и методы"). В этом случае компьютерное моделирование усложняется необходимостью учета дополнительных параметров: среднего числа поисковых реакций, приходящихся на единицу времени; продолжительности условной стимуляции, длительности межстимульных интервалов.
Б. Результаты компьютерного моделирования.
Компьютерная имитация позволяет прогнозировать число поисковых инструментальных реакций, необходимых для обучения при вероятностном безусловном подкреплении. Создан атлас 3-мерных графиков (примеры на рис. 5, 6), показывающих скорость выработки рефлекса при различных комбинациях изучаемых параметров.
Компьютерная имитация демонстрирует большую или меньшую "инерционность" процесса обучения, в том числе в жестко детерминированных усло-
Рис. 5. Зависимость скорости обучения от параметров "случайной" среды при 100% вероятности подкрепления правильных реакций [p(k/a)=1]. По абсциссе - р(а) случайного выполнения правильной реакции; по ординате - p(k/b) положительного подкрепления неправильных реакций; по аппликате - число поисковых реакций, необходимых для установления связи между условным сигналом и подкреплением; α = 0,001 - величина ошибки 1-го рода, достижение которой в процессе имитации означает установление гипотетическим животным связи между условным сигналом и подкреплением.
виях (рис. 5). Это согласуется с экспериментами на животных и человеке: для формирования рефлекса обычно требуется не менее 5 сочетаний (Воронин Л.Г., 1977; Батуев А.С.; и мн.др.). Однако при относительно больших значениях параметра"альфа" (ошибки 1-го рода) имитируемый рефлекс "образуется" сразу после первого сочетания, т.е. практически без вероятностных оценок.
Наибольшая скорость обучения прогнозируется в "жестко детерминированных" условиях [p(k/a) = 1, p(k/b) = 0], что воспроизводит известный из литературы эффект (Меницкий Д.Н., Трубачев В.В., 1974; Bitterman M.E., 1979; Mazur J.E., 1997). При этом если значение p(k/b) близко к нулю, процесс выработки рефлекса существенно не меняется (рис. 5). Иная картина складывается, если вероятность положительного подкрепления в связи с действием условного раздражителя существенно ниже единицы (рис. 6). В этом случае даже незначительное изменение величины p(k/b) на всем интервале ее варьирования заметно влияет на скорость обучения и, соответственно, на формирование информационной патологии ВНД. Именно об этом свидетельствуют и экспериментальные данные (Grey D.A., 1978; McNamara J.M. e.a., 1983).
Компьютерное моделирование воспроизводит и другие известные эффекты: невозможность обучения при одинаковых вероятностях подкрепления реакций, выполненных в связи и вне связи с условным сигналом [p(a/k) = p(b/k)]; высокую устойчивость к угасанию рефлексов, выработанных в условиях вероятностного подкрепления (Меницкий Д.Н., 1986; Фейгенберг И.М., 2008; Kinlston J.F., 1987); замедление обучения после неоднократных предварительных предъявлений стимула, используемого в дальнейшем в качестве условного [Тверицкая И.Н., 1985; Larats D.B. e.a., 1988). Поскольку компьютерное моделирование не предполагает использования каких-либо эмпирических данных, соответствие полученных результатов уже известным закономерностям подтверждает адекватность интеграции ТФС и представления о вероятностном прогнозировании.
Рис. 6. Зависимость скорости обучения от параметров "случайной" среды при 55% вероятности подкрепления правильных реакций [p(k/a)=0,55; альфа = 0,001]. Обозначения такие же, как на рис. 5.
Представленные графики иллюстрируют также закономерности формирования 100%-но подкрепляемого рефлекса на околопороговый по интенсивности сигнал. Предположим, вырабатывается классический слюноотделительный рефлекс на слабый звуковой сигнал, правильно воспринимаемый индивидуумом с вероятностью 0,55. Тогда в ходе обучения 55% безусловных подкреплений будет ассоциироваться с условным стимулом, а 45% - с его отсутствием [р(а/к) = 0,55; р(b/к) = 0,45]. При этом расчетная величина N резко повышается (рис. 6), что согласуется с низкой скоростью обучения при околопороговой интенсивности условного сигнала (Clifton R.K., e.a., 1994; Commons M.L., 1991; Macmillan N.A., 2005) и возможностью формирования информационной патологии.
Таким образом, компьютерная имитация выявляет оптимальные и неблагоприятные для обучения комбинации параметров вероятностно организованной среды. Неблагоприятные условия характеризуются сложностью информационного взаимодействия индивидуума со средой и способствуют развитию информационной патологии ВНД, особенно на этапе афферентного синтеза.. При этом процесс обучения может существенно зависеть от величины р(а) - вероятности случайного выполнения правильной реакции (в дальнейшем - ВСПР). Между тем, при проведении экспериментальных исследований этот параметр традиционно не учитывается, не разработана и общепринятая методика его оценки.
4. Экспериментальная проверка некоторых закономерностей условнорефлекторного обучения, выявленных с помощью компьютерного моделирования.
А. Методика оценки инструментального рефлекса, учитывающая вероятность случайной правильной реакции (ВСПР)
Теоретическая оценка ВСПР основывается на предположении о том, что до выявления связи между условным сигналом и подкреплением инструментальные реакции животного равномерно распределены во времени относительно биологически индифферентного условного раздражителя (это предположение использовалось и при компьютерном моделировании). Например, при выработке рефлекса нажатия на педаль на фоне действия условного сигнала первоначальные (поисковые, пробные) нажатия следует считать равномерно распределенными во времени. В таком случае математическое ожидание ВСПР равно отношению длительности предъявления условного раздражителя к общей продолжительности эксперимента. При этом из расчетов следует исключить интервалы, в течение которых невозможно осуществление дополнительных поисковых реакций: время, затрачиваемое на реализацию собственно нажатий, а также периоды электрокожной стимуляции и последующего восстановления поисковой активности (прекращения хаотических перемещений).
Зная математическое ожидание ВСПР, а также количество выполненных обучаемым животным правильных и ошибочных инструментальных реакций, по критерию χ2 проводится выбор между статистическими гипотезами: Н0 - связь между инструментальными реакциями и предъявлением условного раздражителя отсутствует и Н1 - связь между инструментальными реакциями и предъявлением условного раздражителя существует. Принятие гипотезы Н1 (р < 0,05) свидетельствует о формировании у животного условного рефлекса. При этом критерий χ2 комплексно учитывает правильные и неправильные реализации инструментальных реакций, а также статистическую погрешность: она не превышает достигнутого уровня значимости. Последнее обстоятельство позволяет сравнивать экспериментальные результаты, полученные при разных значениях ВСПР.
Соответствие математического ожидания ВСПР реальным значениям проверялось экспериментально. Для графического изображения динамики частоты правильных реакций выделяли 5 периодов обучения (I-V). Для этого общее число инструментальных реакций, потребовавшееся каждому животному для формирования рефлекса, делили на 5 равных частей и определяли процент правильных реализаций в каждой из них. В дальнейшем вычисляли среднюю арифметическую и доверительный интервал для всех периодов обучения в соответствующей группе животных. Рис. 7 иллюстрирует такое представление данных (1-я серия экспериментов)
Из рисунка видно, что в начальный период обучения частота правильных реакций совпадала с теоретически предсказанными значениями ВСПР; результаты других экспериментов оказались аналогичными, что свидетельствует об адекватности теоретической оценки ВСПР.
Рис. 7. Динамика изменения частоты правильных реакций в зависимости от вероятности их безусловного подкрепления и величины ВСПР (1-я серия экспериментов)
1 - 1-я группа (ВСПР = 0,05, 100% подкрепление правильных реакций); 2 - 2-я группа (ВСПР = 0,25, 100%); 3 - 3-я группа (ВСПР = 0,05, 50%); 4 - 4-я группа (ВСПР = 0,25, 50%). По ординате - частота правильных реакций (% к общему числу реакций); по абсциссе - периоды обучения.
Б. Влияние величины ВСПР на скорость формирования инструментального рефлекса у крыс.
Изучалось влияние величины ВСПР на формирование рефлекса при разных режимах безусловного подкрепления. Сравнивались результаты только тех групп животных, условия обучения которых были идентичны по длительностям условной стимуляции и межстимульных интервалов.
1-я серия экспериментов (табл. 6). Сопоставление результатов I-й и III-й групп (ВСПР = 0,05) показало, что снижение частоты подкрепления со 100% до 50% достоверно, почти в 3 раза замедляет выработку рефлекса. При этом уже на этапе афферентного синтеза животные совершали частые хаотические перемещения, царапали клетку, пищали и демонстрировали другие признаки информационного стресса (Хананашвили М.М., 1983). Это согласуется с распро-
Таблица 6
Различия в числе инструментальных реакций, потребовавшихся для обучения крыс 1-й серии (в скобках указаны номера экспериментальных групп)
ВСПР | Число реакций | |
100%-е подкрепление | 50%-е подкрепление | |
0,05 0,25 | 76,7 ± 36,6 (I) 96,2 ±35,4 (II) | 202,1 ± 93,4 (III)* 88,9 ± 24,0 (IV) |
* - p < 0,05 (достоверность отличий)
страненным мнением о затруднении процесса обучения при вероятностном режиме подкрепления (Пигарева М.Л., Мац В.Н., 1984; Cohen S.L., 1981; McNamara J.M., 1983; и мн.др.).
Однако сопоставление результатов II-й и IV-й групп (ВСПР = 0,25) выявило иную закономерность: независимо от частоты подкрепления для формирования рефлекса требовалось примерно одинаковое число поисковых инструментальных реакций. Ранее некоторые авторы (Трубачев В.В., 1968; Хананашвили М.М., 1970, 1972; Ishida M., 1978) отмечали парадоксальную неизменность скорости обучения при 100%-м и 50%-м режимах подкрепления, объясняя это влиянием не учитываемых факторов. По-видимому, одним из таких факторов является ВСПР.
Аналогичные результаты получены во 2-й серии экспериментов, в которой использовались 100% и 25%-й режимы подкрепления, а также другие длительности условной стимуляции и межстимульных интервалов. Если ВСПР равнялась 0,125 или 0,25, варьирование частоты подкрепления в диапазоне 25-100% практически не влияло на скорость обучения (табл. 7). Это видно из попарного сравнения экспериментальных групп, обучавшихся при одинаковой длительности предъявления условного стимула и межстимульных интерва-
Таблица 7
Различия в числе инструментальных реакций, потребовавшихся для обучения крыс 2-й серии (в скобках - номера экспериментальных групп)
ВСПР | Число реакций | |
100%-е подкрепление | 25%-е подкрепление | |
0,5 0,25 0,125 0,05 | 429,3 ± 169,8 (I) 88,9 ± 72,0 (II) 88,6 ± 44,2 (III) 118,2 ± 117,8 (IV) | 210,5 ± 129,9 (V) * 100,4 ± 60,1 (VI) 96,1 ± 42,1 (VII) 385,8 ± 265,4 (VIII)* |
* - p < 0,05 (достоверность отличий)
ов: II-VI и III-VII. Очевидно, использованные при этом значения ВСПР оптимальны для обучения.
Напротив, при ВСПР=0,05 низкая частота подкрепления с самого начала способствовала развитию информационного стресса и достоверно замедляла формирование рефлекса (группы IV и VIII).
Особый интерес представляет сопоставление результатов I и V групп (ВСПР = 0,5): использование вероятностного режима подкрепления правильных реакций достоверно ускоряло формирование рефлекса. Это объясняется особенностями экспериментальной модели: в I-й группе электрокожное раздражение отменялось при выполнении хотя бы одного нажатия на педаль в период весьма продолжительного (в среднем 20 с) условной стимуляции. В этих условиях даже необученное животное с выраженной поисковой активностью избавлялось от большинства электрокожных раздражений, даже не включаясь в процесс обучения (нажатию на педаль на фоне условного стимула). Поэтому у животных I-й группы первоначально формировался "незапланированный" рефлекс частых нажатий на педаль без какого-либо учета условного сигнала (рис. 9а). Напротив, использованный в V-й группе 25%-й режим положительных подкреплений предполагал достаточно частую электрокожную стимуляцию, что, в конечном счете, ускоряло выработку рефлекса нажатия на педаль на фоне условного сигнала.
Сопоставление результатов I-й и V-й групп свидетельствует о том, что достижение полезного результата (как системообразующего фактора) может инициировать образование функциональных систем не только с адаптивным, но и амбивалентным значением. "Незапланированный" рефлекс имел адаптивное значение для животных в I-й группы и, в то же время, достоверно замедлял обучение в целом (образование более "экономного" рефлекса нажатия на педаль на фоне условной стимуляции, - животные V-й группы с 25%-м подкреплением формировали его достоверно быстрее). Иными словами, "незапланированный" рефлекс имел амбивалентное значение. Теоретический анализ свидетельствует, что этот пример не единичный. Напомним известный опыт с вживлением электродов в зоны гипоталамуса, раздражение которых вызывает положительные эмоции. Стимулируя указанные зоны нажатием на рычаг, животное достигает субъективно положительного результата, хотя длительное продолжение эксперимента обычно приводит к его истощению и даже гибели. При этом положительное подкрепление (как системообразующий фактор!) формирует условный рефлекс, неоднократное воспроизведение которого вызывает амбивалентные и даже заведомо дизадаптивные последствия. Аналогичные примеры демонстрирует клиническая медицина: некоторые варианты наркомании, алкоголизма, ожирения, близорукости и т.д. Их учет расширяет сферу применения ТФС, подчеркивая отсутствие четкой границы между адаптивными и дизадаптивными проявлениями (нормой и патологией).
Наиболее выраженные эмоциональные реакции наблюдались при 25% режиме подкрепления, особенно у животных V-й и VIII-й групп. У части животных развились признаки информационного невроза (Ханашашвили М.М., 1983, 2008) и, на его фоне, - приобретенной беспомощности (Seligman M.E., 1975; Kram M.L. e.a., 2000; Greenwood B.N., Fleshner M., 2008): от опыта к опыту снижалась поисковая активность, уменьшалась масса тела, выпадала шерсть, нарастало эмоциональное безразличие к предъявляемым стимулам (табл. 8). При этом поисковые реакции оставались равномерно распределенны-
Таблица 8
Зависимость формирования приобретенной беспомощности
от величины ВСПР во 2-й серии экспериментов
№ группы, ВСПР | Частота подкрепления правильных реакций, % | Число крыс с приобретенной беспомощностью | Число обучив-шихся крыс |
V, 0,5 VI, 0,25 VII, 0,125 VIII, 0,05 | 25 25 25 25 | 2 0 1 5 | 8 8 8 8 |
ми относительно условного сигнала, т.е. информационные расстройства ВНД возникали на этапе афферентного синтеза.
В 3-й серии экспериментов вероятностная организация среды определялась околопороговой интенсивностью условного раздражителя (табл. 9). Варьирование интенсивности условного стимула по-разному влияло на формирование рефлекса в зависимости от величины ВСПР. При ВСПР=0,05 (группы I и II) снижение интенсивности звукового сигнала существенно замедляло процесс обучения (р < 0,05). Аналогичный результат показали животные V-й и VI-й групп, обучение которых проводилось при других длительностях условной сти-
Таблица 9
Различия в числе инструментальных реакций, потребовавшихся для обучения крыс 3-й серии, от величины ВСПР и интенсивности условной
стимуляции (в скобках номера экспериментальных групп)
ВСПР | Число реакций | |
сильный условный сигнал (60дБ) | слабый условный сигнал (20дБ) | |
0,05 0,25 0,05 0,25 | 57,5 ± 11,7 (I) 123,3 ± 30,4 (III) 30,6 ± 6,9 (V) 105,2 ± 38,6 (VII) | 149,7 ± 39,6 (II)* 144,0 ± 31,1 (IV) 176,1 ± 30,1 (VI)** 72,7 ± 23,1 (VIII) |
* - p < 0,05, ** - p < 0,01 (достоверность отличий)
муляции и межстимульных интервалов. Выявленная закономерность согласуется с представлением о том, что недостаточно надежное восприятие условного сигнала затрудняет информационное взаимодействие со средой в процессе ориентировочно-поисковой деятельности (Костандов Э.А., 1983; Jakubowska E., 1976; Swan J.A., Pearce J.M., 1986). Вместе с тем, слабая интенсивность условного сигнала не замедляла формирование рефлекса при ВСПР=0,25 (группы III-IV, VII-VIII), которое, по-видимому, является оптимальным для обучения в рамках используемой экспериментальной модели.
Таким образом, выявлено существование оптимальных и пессимальных для процесса обучения величин ВСПР в рамках используемых экспериментальных моделей. Оптимальные значения ВСПР облегчают информационное взаимодействие организма со средой и способствуют формированию условнорефлекторных связей. При этом зависимость скорости обучения от "неблагоприятных" параметров (частичный характер подкрепления, околопороговая интенсивность условного сигнала) резко ослабевает. Напротив, при "пессимальных" значениях ВСПР информационное взаимодействие со средой затрудняется, особенно при наличии дополнительных осложняющих факторов (частичное подкрепление, околопороговый условный сигнал). Это способствует развитию информационной патологии ВНД преимущественно на этапе афферентного синтеза вплоть до формирования приобретенной беспомощности.
В. Влияние ВСПР на поисковую активность крыс в процессе инструментального обучения. В 4-й серии экспериментов уточнялась связь между величиной ВСПР и динамикой поисковой активности при 100%-м режиме подкрепления. Для этого выделяли 5 периодов обучения (I - V): общее число сочетаний, потребовавшееся каждому животному для формирования рефлекса, разбивали на 5 равных частей, после чего определяли число инструментальных реакций (правильных и неправильных) в соответствующие периоды обучения по отношению к их общему числу (в %).
Как видно из рис. 8, во 2-й и 4-й группах частота поисковых реакций достоверно повышалась уже со 2-го периода (ВСПР=0,25, р < 0,05). Напротив, при ВСПР=0,05 достоверного увеличения частоты нажатий на педаль относительно
Рис. 8. Динамика поисковых реакций в процессе обучения у крыс 4-й серии. 1 - 1-я группа, ВСПР = 0,05; 2 - 2-я группа, ВСПР = 0,25; 3 - 3-я группа, ВСПР = 0,05; 4 - 4-я группа, ВСПР = 0,25. По ординате - инструментальные реакции (% к общему числу) в соответствующие периоды обучения; по абсциссе - периоды обучения.
1-го периода либо не наблюдалось (3-я группа), либо возникало на последнем этапе обучения (1-я группа). В процессе поисковой деятельности величина ВСПР существенно влияет на число получаемых положительных и отрицательных подкреплений, т.е. на эффективность информационного взаимодействия со средой. Очевидно, при оптимальных для обучения значениях ВСПР (2-я и 4-я группы) эффективность поисковой инструментальной деятельности повышается, что стимулирует ее уже на ранних этапах обучения. Это может служить механизмом ранее описанного ускорения обучения при ВСПР=0,25.
По результатам 2-й серии экспериментов (см. выше) анализировалась динамика изменения абсолютных значений поисковой активности. Для этого общее число циклов, потребовавшихся каждому животному для формирования условного рефлекса, разбивали на 5 равных частей (I-V), после чего подсчитывали число инструментальных реакций, приходящихся на каждый цикл соответствующего периода. Проводили попарное сравнение только тех экспериментальных групп, которые обучались при одинаковой продолжительности условной стимуляции и межстимульных интервалов.
Изменение режима подкрепления по-разному влияло на поисковую активность в зависимости от ВСПР (рис. 9). При ВСПР = 0,5 (группы 1-я и 5-я, рис. 9а), 4-кратное уменьшение частоты подкрепления снижало поисковую активность в течение всех (кроме IV) периодов обучения, что особенно заметно в начальный период (р < 0,05). Аналогичный результат получен и при ВСПР = 0,05 (группы 4-я и 8-я; рис. 9в). Это соответствует мнению ряда авторов о прямой зависимости между частотой инструментальных реакций и вероятностью используемого подкрепления (Vaugham W., Miller H.L., 1984; Houston A., 1986; Davison M., 1987; и др.). По-видимому, сочетание неблагоприятного для обучения значения ВСПР (0,05 или 0,5) с 25%-м режимом подкрепления резко снижает информационную значимость поисковых инструментальных реакций,
Рис. 9. Динамика абсолютных значений поисковой активности у крыс 2-й серии. а - г - группы; а - 1-я и 5-я, б - 2-я и 6-я; в - 4-я и 8-я; г - 3-я и 7-я (расчетная величина ВСПР - соответственно 0,5; 0,25; 0,05 и 0,125). Пунктирные линии соответствуют 25%-му режиму подкреплению. По абсциссам - периоды обучения (I - V); по ординатам - количество инструментальных реакций, приходящихся в среднем на каждый цикл.
что означает для животного нецелесообразность их частого выполнения.
При оптимальных для обучения значениях ВСПР (0,25 и 0,125) наблюдалась качественно иная закономерность. Как видно из рис. 9б и 9г, 4-кратное уменьшение частоты подкрепления в целом усиливало поисковую активность, что особенно заметно при сопоставлении результатов 3-й и 7-й групп в начальный период обучения (р < 0,05). Усиление поисковой активности можно рассматривать как компенсаторную реакцию на низкую частоту положительного подкрепления (напомним, что оптимальные для обучения значения ВСПР повышают информационную значимость поисковых инструментальных реакций). При этом прямая зависимость между частотой поисковых реакций и вероятностью безусловного подкрепления нарушается.
Таким образом, поисковая активность при обучении в "случайных" средах модулируется величиной ВСПР. От нее зависит, какая часть инструментальных поисковых реакций окажется выполненной в связи с условным сигналом и будет соответствующим образом подкреплена. Это влияет на информационное взаимодействие со средой при любом режиме подкрепления (постоянном или частичном) и определяет характер поведения животного. При неблагоприятных для обучения значениях ВСПР уменьшение частоты подкрепления вызывает снижение поисковой активности из-за резкого ухудшения условий получения информации: оба рассматриваемых фактора (ВСПР и вероятностный характер подкрепления) обусловливают снижение информационной значимости поисковых реакций. Напротив, оптимальные для обучения значения ВСПР способствуют повышению информационной значимости каждой поисковой реакции, что приводит к снижению зависимости поисковой деятельности от вероятности безусловного подкрепления.
Интеграция ТФС с представлением о вероятном прогнозировании облегчает анализ информационной патологии на разных этапах поведенческой деятельности. На этапе афферентного синтеза может быть несколько потребностей, конкурирующих друг с другом за первоочередное удовлетворение, что снижает прогнозируемую вероятность удовлетворения каждой из них, инициируя психоэмоциональное напряжение вплоть до развития невротических расстройств. Считается, что "невроз не возникает, если выбор субъекта предопределен явным доминированием какой-либо потребности" (Симонов П.В., 1987). Однако наши исследования свидетельствуют о возможности формирования невроза в том числе на фоне явного доминирования одной потребности (избегания электрокожной стимуляции); - патология инициируется сложной обстановочной и пусковой афферентацией. Иными словами, ТФС позволяет изучать на этапе афферентного синтеза не только конкуренцию потребностей (мотиваций), но и другие варианты расстройств. Теоретический и экспериментальный анализ свидетельствует об использовании вероятностных оценок на других этапах поведенческой деятельности: формирования цели, программы действий, принятии решения об ее изменении (сохранении), оценке степени соответствия получаемых результатов параметрам акцептора. Неопределенность любого этапа поведения снижает прогнозируемую вероятность удовлетворения потребности и инициирует психоэмоциональное напряжение. Высокая мотивация поведения способствует его усилению и, в конечном счете, формированию информационного стресса или невроза.
Г. Влияние неосознаваемой ритмической стимуляции на когнитивную деятельность человека.
Вероятностный характер условнорефлекторного обучения может быть обусловлен околопороговой интенсивностью условного раздражителя. Его восприятие зависит от фазы волны ЭЭГ, на которую приходится раздражение - наиболее результативно предъявление стимула в электронегативную фазу (Шевелев И.А. и др., 1988; Jansen B.H., 1991).
Формировался условный рефлекс на неосознаваемый стимул, - он содержал информацию, облегчавшую когнитивную деятельность при выполнении последующего тестового задания. Испытуемым предъявляли интенсивные световые вспышки с частотой 10 Гц, навязывавшие устойчивый α-ритм и совпадавшие по времени с позитивными фазами ЭЭГ-волн. Неосознаваемый информационно значимый стимул предъявлялся с определенной задержкой (35 мс), благодаря чему момент его предъявления приходился на максимально негативное отклонение ЭЭГ-волны (рис. 10).
Установлено, что информационно значимая неосознаваемая ритмическая стимуляция достоверно облегчала когнитивную деятельность испытуемых при выполнении последующего тестового задания. Полученные результаты объясняются субсенсорными условными реакциями. В рамках ТФС они формируют-
Рис. 10. ЭЭГ испытуемого с навязанным световыми вспышками α-ритмом. Передний фронт низких прямоугольников Ц начало экранных фотовспышек, передний фронт высоких прямоугольников Ц начало предъявления неосознаваемого стимула.
ся в вероятностно организованной среде в процессе квантования информационного взаимодействия индивидуума со средой. Интенсивные световые вспышки частотой 10 Гц субъективно неприятны, что объясняет их совпадение с позитивными фазами ЭЭГ: мозг как саморегулирующаяся система настраивается на минимальное возбуждение при ритмическом воздействии эмоционально отрицательного внешнего стимула (врожденная программа действий в рамках 1-го информационного "кванта"). Это позволило использовать интенсивные вспышки в качестве безусловного отрицательного подкрепления, предъявляемого через фиксированный интервал времени после информационно значимого неосознаваемого (лусловного) стимула. Значительного количества сочетаний информационно значимого и подкрепляющего стимулов (3000 раз за 5 мин) оказалось достаточным для образования условнорефлекторных связей (в рамках 2-го информационного кванта), - в дальнейшем они облегчили когнитивную деятельность при выполнении тестового задания (3-й информационный квант).
ЗАКЛЮЧЕНИЕ
Концепция универсального системообразующего фактора, разработанная в рамках ТФС, рассматривает достижение полезного результата в качестве неотъемлемого и решающего компонента функциональной системы, упорядочивающего взаимодействия других ее компонентов. Это представление традиционно используется для обоснования строго адаптивного значения системной деятельности. Между тем, экспериментальный и теоретический анализ свидетельствует о том, что в отдельных случаях первоначально полезный результат может инициировать образование систем с амбивалентным и даже дизадаптивным значением: некоторые варианты условнорефлекторной деятельности, ожирения, наркомании, алкоголизма и т.д. Подобное представление расширяет применение концепции системообразующего фактора и ТФС в целом, подчеркивая отсутствие четкой грани между адаптивными и дизадаптивными проявлениями жизнедеятельности (нормой и патологией).
Концепция системообразующего фактора предполагает учет вероятностного прогнозирования при анализе ВНД в "случайных" средах (вероятностный характер безусловного подкрепления, околопороговая интенсивность условного сигнала и т.д.). В этих условиях устойчивое достижение полезного результата (как системообразующего фактора) невозможно без вероятностных оценок. Их вынужденное использование характерно в ситуации субъективной неопределенности для любого этапа поведенческой деятельности.
Концепция системообразующего фактора позволяет интегрировать классическую для ТФС модель поведенческого акта с представлением о вероятностном прогнозировании. Для этого следует допустить, что выделяемые в рамках модели этапы поведения формируются с учетом повышения прогнозируемой вероятности удовлетворения имеющейся у индивидуума потребности. Кроме того, целесообразно ввести понятие о вероятностном характере принятия решения об изменении программы действий; решение принимается на основе информации, хранящейся в "буфере памяти" (т.е. с учетом результатов всех поведенческих актов, выполненных при реализации данной программы). Вероятностный характер решения об изменении программы действий объясняет в рамках ТФС инерционность процесса формирования и угасания условных рефлексов в "случайной" среде, а также уточнить механизм дискретного изменения программы действий в рамках "системного кванта поведенческой деятельности" (от потребности к ее удовлетворению).
Информационная патология ВНД может возникать на любом этапе высоко мотивированного поведения в ситуации субъективной неопределенности, инициирующей психоэмоциональное напряжение (из-за снижения прогнозируемой вероятности удовлетворения потребности). Субъективная неопределенность возникает не только при наличии взаимоисключающих мотиваций или путей удовлетворения одной и той же потребности (Симонов П.В., 1987, 1993), но также при сложном характере обстановочной и пусковой афферентаций, конкуренции целей (моделей будущего результата) и в других случаях, комплексно раскрываемых только в рамках ТФС.
Учет вероятностных оценок повышает прогностическое значение ТФС при изучении информационной патологии ВНД. Появляется возможность компьютерного моделирования процесса выработки инструментальных рефлексов при различных комбинациях значений параметров вероятностно организованной среды, в том числе неблагоприятных для обучения (способствующих формированию информационной патологии). При этом какие-либо эмпирические данные оказываются избыточными - они требуются лишь для проверки получаемых результатов. Поэтому соответствие полученных результатов известным из литературы данным свидетельствует о том, что компьютерная имитация, во-первых, отражает существенные особенности реального формирования условного рефлекса в "случайных" средах и, во-вторых, имеет эвристическую ценность при планировании новых исследований на человеке и животных.
Компьютерное моделирование выявило влияние ранее не учитываемого параметра (вероятности случайной правильной реакции - ВСПР) на процесс формирования инструментальных рефлексов, - эксперименты на животных подтвердили это предсказание. Установлено, что ВСПР существенно модулирует эффективность ориентировочно-поисковых инструментальных реакций в условиях вероятностного режима безусловного подкрепления или околопороговой интенсивности условной стимуляции. Оптимальные для обучения значения этого параметра облегчают выработку рефлекса в вероятностно организованной среде, а неблагоприятные, напротив, затрудняют информационное взаимодействие со средой и способствуют развитию информационной патологии.
На основе положений ТФС изучалась возможность оптимизации субсенсорных условных реакций человека, модулирующих последующую когнитивную деятельность. Наиболее эффективным оказалось предъявление неосознаваемых стимулов в электроотрицательные фазы ЭЭГ-ритма, специально навязанного интенсивными световыми вспышками с частотой 10 Гц. Полученный результат объясняется в рамках представления об участии вероятностных оценок в изменении (сохранении) текущей программы действий в процессе "квантования" информационного взаимодействия индивидуума со средой.
ВЫВОДЫ
1. Достижение полезного результата (как универсального системообразующего фактора) не всегда инициирует образование систем с адаптивным значением. В зависимости от особенностей метаболизма, параметров внешней среды и других условий его неоднократное достижение может формировать системы с амбивалентным и даже преимущественно дизадаптивным значением: некоторые варианты условнорефлекторной деятельности, ожирения, наркомании, алкоголизма, патологии зрения и т.д. Это представление расширяет сферу применения ТФС, подчеркивая отсутствие четкой грани между адаптивными и дизадаптивными проявлениями жизнедеятельности (нормой и патологией).
2. Концепция системообразующего фактора согласуется с представлением о вероятностном прогнозировании и предполагает его использование при анализе ВНД в условиях нормы и патологии. Учет вероятностно-статистических параметров облегчает анализ процесса формирования оптимальной программы действий и, следовательно, достижения конечного полезного результата (как системообразующего фактора).
3. Интеграция ТФС с представлением о вероятностном прогнозировании возможна на основе модели поведенческого акта. Для этого требуется допустить возможность вероятностных оценок на любом из традиционно выделяемых этапов поведенческой деятельности. Дополнительно следует учесть возможность принятия вероятностного решения об изменении (сохранении) реализуемой программы действий, - решение принимается на основе комплексной оценки результатов всех поведенческих актов, выполненных при реализации данной программы (соответствующая информация хранится в "буфере памяти"). Подобный подход позволяет изучать в рамках ТФС условнорефлекторные и более сложные варианты целенаправленной деятельности, реализуемые в вероятностно организованной среде в условиях нормы и информационной патологии.
4. Информационная патология ВНД может возникать на любом этапе поведенческой деятельности в процессе сложного и неоднозначного для индивидуума информационного взаимодействия со средой. Неопределенность ситуации на любом этапе поведения снижает прогнозируемую вероятность удовлетворения доминирующей потребности и инициирует психоэмоциональное напряжение. Высокая значимость доминирующей потребности способствует его дополнительному усилению и формированию стрессорных и невротических расстройств информационного генеза.
5. Учет вероятностных оценок в рамках ТФС позволяет осуществлять компьютерное моделирование процесса выработки инструментального условного рефлекса при различных комбинациях значений параметров "случайной" среды. Моделирование не требует привлечения эмпирических данных, - они используются только для проверки (тестирования) полученных результатов. Поэтому выявленное соответствие с данными литературы и результатам собственных исследований подтверждает адекватность интеграции теории и представления о вероятностном прогнозировании. С другой стороны, это свидетельствует об эвристической ценности компьютерного моделирования и возможности его использования для планирования экспериментов по изучению информационной патологии ВНД.
6. С помощью компьютерного моделирования предсказано и экспериментальными исследованиями на животных подтверждено существование оптимальных и неблагоприятных для формирования инструментального рефлекса значений вероятности случайной правильной реакции (ВСПР). Оптимальные для обучения значения ВСПР облегчают выработку рефлекса при вероятностном режиме безусловного подкрепления или околопороговой интенсивности условной стимуляции. Напротив, в случае неблагоприятных для обучения значений ВСПР процесс формирования рефлекса затрудняется, что способствует развитию информационной патологии ВНД.
7. Величина ВСПР влияет на условнорефлекторную деятельность, модулируя информационное взаимодействие индивидуума со средой. От нее зависит, какая часть инструментальных поисковых реакций окажется выполненной в связи с условным сигналом и получит соответствующее подкрепление. Неблагоприятные для обучения значения ВСПР снижают информационную значимость поисковых реакций, что особенно негативно сказывается в вероятностно организованной среде (низкая частота подкрепления, околопороговая интенсивность условного сигнала). Неэффективность поисковых реакций способствует снижению их частоты, что дополнительно затрудняет обучение (инициирует информационную патологию ВНД). Напротив, оптимальные для обучения значения ВСПР повышают информационную значимость поисковых реакций, делая целесообразной их частую реализацию. Это компенсирует неблагоприятное влияние вероятностных параметров среды и предупреждает развитие информационной патологии ВНД.
8. Возможна оптимизация когнитивной деятельности человека на основе неосознаваемого восприятия информационно значимых стимулов, предъявляемых в электронегативную фазу ЭЭГ-ритма (специально навязываемого световыми мельканиями с частотой 10 Гц). Полученный результат объясняется в рамках ТФС субсенсорными условными реакциями, формирующимися в процессе квантования информационного взаимодействия индивидуума со средой с участием вероятностных оценок.
Список работ, опубликованных по теме диссертации
- Салтыков А.Б., Смирнов И.В., Старшов В.П. Характеристика процесса обучения в случайных средах // Сборник трудов международной конференции Эмоции и поведение: системный подход. - Москва, 1984. - С. 260-262.
- Салтыков А.Б., Смирнов И.В., Старшов В.П. Оценка процесса выработки инструментального рефлекса у животных // Журнал высшей нервной деятельности. - 1986. - Т. 36, № 5. - С. 987-989.
- Никитин Ю.М., Салтыков А.Б., Яковлева Н.В. Методика измерения абсолютного порога электрокожной чувствительности // Сборник трудов 9-й Всесоюзной конференции Измерения в медицине и их метрологическое обеспечение. - Москва, 1989. - С.15.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Влияние вероятности случайного выполнения вырабатываемой реакции на скорость формирования инструментального рефлекса // Журнал высшей нервной деятельности. - 1989. - Т. 39, № 4. - С. 654-659.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Связь вероятности случайного выполнения вырабатываемой условной реакции и возникновения невротического состояния // Механизмы нарушения регуляции и их коррекция // Материалы Всесоюзного съезда патофизиологов 3-6 октября 1989 г., Кишинев. - М., 1989. - С.55.
- Салтыков А.Б., Смирнов И.В., Старшов В.П. Стохастическая имитация инструментального рефлекса при вероятностном обучении // Журнал высшей нервной деятельности. - 1989. - Т. 39, № 5. - С. 974-981.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Зависимость скорости обучения от вероятности случайного выполнения вырабатываемой реакции при различных режимах аверсивного подкрепления у крыс // Журнал высшей нервной деятельности. - 1990. - Т. 40, № 3. - С. 467-474.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Зависимость поисковой активности от вероятности случайного выполнения вырабатываемой инструментальной реакции // Бюллетень экспериментальной биологии и медицины. - 1990. - Т. 110, № 10. - С.344-345.
- Saltykov A.B., Toloknov A.V., Khytrov N.K. Prognosis and prevention of neurotic reactions in rats during probable learning // Constituent Congress International Society for Pathophysiology. - Moscow. - May 28-June 1. 1991. Abstracts. - P. 45.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Поисковая активность при различных режимах подкрепления и процесс информационного взаимодействия со средой // Бюллетень экспериментальной биологии и медицины. - 1991. - Т. 112, № 11. - С.451-453.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Развитие приобретенной беспомощности и исходная вероятность выполнения вырабатываемой реакции // Патологическая физиология и экспериментальная терапия. - 1992. - № 5-6. - С. 5-6.
- Салтыков А.Б., Ильин В.И., Дронов А.А. Влияние неосознаваемой ритмической стимуляции на когнитивную деятельность // Психологический журнал. - 1993. - Т. 14, № 5. - С. 42-47.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Оптимизация процесса вероятностного обучения при малой интенсивности условного стимула // Бюллетень экспериментальной биологии и медицины. - 1993. - Т. 116, № 7. - С. 73-75.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Предупреждение приобретенной беспомощности при действии условного стимула малой интенсивности // Успехи физиологических наук. - 1994. - Т. 25, № 4. - С. 50.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Системный анализ поведения в условиях неопределенности окружающей среды // Вестник РАМН. - 1995. - № 10. - С. 59-67.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Поведенческая деятельность в условиях неопределенности среды (методические особенности экспериментального изучения) // Успехи физиологических наук. - 1996. - Т. 27, № 1. - С. 100-108.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Поведение и неопределенность среды (механизмы и клиническое значение): Монография. - М.: Медицина, 1996. - 144 с.
- Салтыков А.Б., Толокнов А.В. Системная организация поведения и неопределенность среды // Тезисы 1 Российского конгресса по патофизиологии. - Москва, 1996. - С. 26.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Закономерности поведенческой деятельности в условиях неопределенности среды // Успехи физиологических наук. - 1998. - Т. 29, № 1. - С. 24-36.
- Салтыков А.Б., Толокнов А.В., Хитров Н.К. Оптимизация поисковой инструментальной деятельности при малой интенсивности условного стимула // Бюллетень экспериментальной биологии и медицины. - 1998. - Т. 126, № 9. - С. 283-285.
- Салтыков А.Б. Высшие психические функции и системный анализ поведения в условиях неопределенности // Успехи физиологических наук. - 1999. - Т. 30, № 4. - С. 39-49.
- Салтыков А.Б., Хитров Н.К. Субъективная неопределенность, целенаправленное поведение и теория функциональных систем // Бюллетень экспериментальной биологии и медицины. - 2000. - Т. 130, № 10. - С. 364-369.
- Салтыков А.Б., Хитров Н.К. Теория функциональных систем и целенаправленное поведение // Журнал высшей нервной деятельности. - 2001. - Т. 52, № 1. - С. 119-126.
- Салтыков А.Б., Хитров Н.К. Оценка роли приспособительного результата в теории функциональных систем // Журнал высшей нервной деятельности. - 2002. - Т. 52, № 1. - С. 119-126.
- Салтыков А.Б., Хитров Н.К. Природа системообразующего фактора в теории функциональных систем // Успехи современной биологии. - 2002. - Т. 122, № 2. - С. 148-155.
- Хитров Н.К., Салтыков А.Б. Болезни цивилизации и нозологический принцип медицины с позиций общей патологии // Клиническая медицина. - 2003. - № 1. - С. 3-16.
- Салтыков А.Б., Хитров Н.К. Теория функциональных систем и патология целенаправленной деятельности // Клиническая патофизиология. - 2003. - № 1. - С. 3-16.
- Хитров Н.К., Салтыков А.Б. Теория функциональных систем и общая патология человека // Бюллетень экспериментальной биологии и медицины. - 2003. - Т. 136, № 7. - С. 4-10.
- Салтыков А.Б. Морфологические аспекты процесса образования функциональных систем // Успехи современной биологии. - 2005. - Т. 125, № 2. - С. 167 - 178.
- Салтыков А.Б. Биологическая теория эмоций П.К.Анохина и вероятностное прогнозирование // Успехи современной биологии. - 2005. - Т. 125, № 6. - С. 531-543.
- Салтыков А.Б. Разные трактовки понятия функциональная система // Успехи современной биологии. - 2007. - Т.127, № 5. - С. 435Ц444.
- Салтыков А.Б. Теория функциональных систем и клиническая медицина // Клиническая медицина. - 2008. - № 1. - С. 4-9.
- Салтыков А.Б. Самоорганизация физиологических, патологических и амбивалентных функциональных систем. - Патологическая физиология и экспериментальная терапия. - 2009. - № 2. - С. 8-13.