Корзинкин Владимир Анатольевич Москва 2009 литература
Вид материала | Литература |
- Веткин Владимир Анатольевич, кандидат физико-математических наук, доцент Винтайкина, 3941.49kb.
- Тэк сегодня среда, 25 февраля 2009 г. Часть 2 содержание, 828.56kb.
- Владимир Анатольевич Беляев (Помощник председателя), Муромский историко-художественный, 44.04kb.
- Маталасов владимир анатольевич, 1108.96kb.
- Хохлова Галина Ивановна. "Возможности разработки идеологии научного сообщества"., 12.17kb.
- Зеленский Владимир Анатольевич, начальник отдела консолидированной отчет, 598.05kb.
- Название дисциплины, 587.61kb.
- Фисинин Владимир Иванович Доктора наук Габитов Ильдар Исмагилович Зыкин Владимир Александрович, 2780.59kb.
- Маяковский Владимир Владимирович. Маяковский Владимир Владимирович (1893, с. Багдади, 59.82kb.
- Князья Владимир Святославич, Ярослав Мудрый, Владимир Мономах. 11. Культура Древней, 24.41kb.
ТЕМА 7. Структура и принципы бионической ИС. §1. Совокупность основных принципов. 1.а. Разновидности обратных связей. Внешняя среда способствует не гибели, а развитию (в том числе интеллектуальному) системы, если возмущения среды можно разделить на 2 класса:
В смысле общей теории систем эталонная по интеллекту система – это замкнутая система во всех средах, т.е. как бы не изменялась среда, система достигает своих целей дополнением (замыканием себя) недостающими объектами. Моделью такой системы считаются человек. Основные свойства интеллектуальной системы таковы:
Структурная схема информационных потоков в интеллектуальных системах. Адаптация делится на:
Частое изменение среды небольшой интенсивности отрабатывается в составе взаимодействия А с внешней средой – первичная ОС. А редкие большой интенсивности – вторичная ОС. 1.б. Интеллектуальность модальностей. Интеллектуальная часть ЕНС человека условно делится на подсети:
За счет такого устройства:
а) увеличение достоверности информации от частного сенсора; б) выработка стратегии замыкания при нарушении одной из подсистем восприятия.
1.в. Структурно-функциональная организация мозга человека. Мозг у всех живых развивался путем наслаивания новых структур на более древние и управлением новой структуры над более древней. Схематически нервная система: мозг (рис.7.2). Каждый уровень обладает своей памятью и память B и C ассоциативна. 1.г. Функциональная система. Самостоятельно организм принимает решения (в основном неосознанно об образе, о действии и т.д.) на основе опережающего результат формировании модели результата. Так как результат должен быть полезен, то принятие решения является одновременно выработкой цели, так как есть много способов получить тот же результат. Эти представления уточнены в концепции функциональной системы (академик Анохин). Она такова: любая система организма активизирует минимальное число степеней свободы компонентов для достижения результата в соответствии с постоянно меняющимися функциональными требованиями. Важно положение: все системы организма независимо от уровня их организации и числа компонентов имеют ту же функциональную архитектуру. Согласно ей принятию решения предшествует его подготовка (блок «афферентный синтез») – это перебор разномодальных информационных моделей объектов и результатов взаимодействия системы с ними в прошлом и сопоставление их с потребностями данного момента, принятие решения означает и выбор программы действий, и формирование модели (образа) ожидаемого результата. Эта модель (в блоке «акцептор действия») сравнивается с результатом, полученным в ходе выполнения выбранной программы действий. Отклонение полученного от ожидаемого ведет к: 1) корректировке программы; 2) построению модели объектов, вызвавших отклонения; 3) построению модели полученных результатов. §2. Объединение бионических принципов. На рис. 7.3. показана структура координации сигналов In x и In y двух модальностей x и y с помощью анализаторов Ax и Ay и интегрирующего анализатора Axy. Каждый анализатор охватывает один или два уровня организации мозга человека и состоит из блоков предварительного анализа (Пр. А) и последующего анализа (Посл. А) сигнала данной модальности. Если эти уровни рефлекторный и образный, то Пр. А обеспечивает фильтрацию сигналов этой модальности и формирует рефлекторные связи между ними. Блок Посл. А обеспечивает операции над образами данной модальности. «Принцип работы». Рассмотрим Ax. «а» – отфильтрованный сигнал модальности x поступает из Пр. Аx в Посл. Аx. В блоке Посл. Аx на основе информации в его обменной памяти с некоторым опережением представляются образы объектов, дающих сигнал x. «б» – сигналы, перестраивающие структуру связей блока Пр. Аx и адаптирующий его к восприятию ожидаемых сигналов от объектов среды. Нижний блок вместе с блоками Пр. А служит для формирования сигналов управления исполнительными органами. Связь между Аx и Аy на рефлекторном уровне выполняют анализаторно-координационные механизмы А-КМ (например, мозжечок или таламус), а на образном – блок последующего анализа многомодальных образов (Посл. Аxy). Вместе они образуют интегральный анализатор (Инт. А). Он:
Посл. Аxy регулирует тонкие чувства. Блок лог.А руководит блоками Посл. Аxy, но лог.А руководствуется не чувствами, а смыслом, то есть он оперирует разномодальными образами одного объекта, как одним целым объектом. Нарушение целостности воспринимается, как несоответствие между внешней и внутренней средой и переживается эмоционально, Инт. Axy побуждает к действию по устранению нарушения. В блоке лог.А оценивается истинность сформулированных объектов внешней среды и истинность последовательности искусственных образов – знаков (символов) объекта. Тут действуют законы четкой и нечеткой логики для формирования правильных высказываний (знаний). У нас будет детерминационный анализ (2я часть). Настройка блока лог.A происходит в ходе длительного обучения в человеческом обществе, и тогда он доминирует над Посл. Аxy. §3. Вопросы реализации бионических принципов на ИНС.. Вопрос об эффекторах не обсуждаем. Блоки Пр. А близки к оптимальному фильтру Колмогорова-Винера. Рефлекторная память реализуема на сети Хопфильда. Образная память и блоки Посл. А могут быть выполнены на отдельно связных ИНС. Блок А-КМ выполняет функции решающего блока. Самые сложные модели биосистем на ИНС называются: Когнитрон, Неокогнитрон (К. Фунушима). Они одномодальны, работают со зрительными образами на самых мощных машинах, обучаются без учителя на наборе входных образов, которые нужно распознать как объекты. Каждый нейрон первого слоя распознает линии и углы определенной ориентации. В последующих слоях уровень абстракции растет, распознаются образы все более сложные, и они все меньше зависят от их положения, размера, ориентации и искажения. ТЕМА 8.Система распознавания образов. Системы ЕЯ общения. §1. Принцип действия и технология распознавателей лиц. Распознавание лиц производится сравнением с шаблонами в БД. Входом устройства является набор лиц, а выходом – метка класса. Для работы могут использоваться разные принципы, основанные на формулах Байеса, или на методе ближайших соседей, или на ИНС-технологии. Наиболее эффективны сейчас ИНС-технологии, которые распознают лицо на стандартных ПК. Схема использования многослойных ИНС (система узнавания лиц). Выходной нейрон номер 1 с максимальной активностью, он указывает на принадлежность к распознаваемому классу. Из K примерно одному. Результат работы распознавателя лиц. В США в 2002 году проверялись различные алгоритмы распознавания лиц в задачах:
Наилучшие результаты по верификации для лиц внутри помещения составляет 90% верного, 1% ложного; вне помещений – 50% верного, 1% ложного при размере базы 120000. При видеомониторинге и при распознавании лица среди группы лиц результат примерно такие же, как и при распознавании пользователя. Есть системы двухступенчатого распознавания на базе ИНС-технологии:
Результаты: в первой ступени 90-99% верных, но и ложных 65%. Доступ к системам. С 1993 года есть коммерческие разработки с БД на тысячи лиц.Inspector+ (module face control). §2.Диалоговые системы общения текстовыми и речевыми ЕЯ сигналами. Общая структура диалоговых систем. Интеллектуальные диалоговые системы содержат:
Структура текстовой диалоговой системы с традиционной технологией (система «ПОЭТ», 1982г.).
В этой системе знания о языке разделяются на лингвистические и проблемные. Первые хранятся в зонах словаря АБВ. Вторые – в семантической сети Г. Г делится на абстрактную (общие понятия и категории) и конкретную (конкретные сущности в Д). При семантическом анализе (3,4) синтаксическая структура запроса преобразовывается в семантический граф. При интерпретации (4) семантический граф запроса сравнивается с семантической сетью (Г). При этом выясняется контекст запроса. Семантический граф ответа вырабатывается на базе графа запроса с внесением в него смысловой информации, получаемой на этапе интерпретации. Системы анализа и синтеза речи и преобразование текст→речь. Текст характеризуется большой изменчивостью в реализации звуковых единиц (фонем) даже у одного говорящего. Это приводит к необходимости параллельной обработки для общения в масштабе реального времени. ЕЕ желательно выполнять с помощью ИНС. Есть традиционные распознаватели слитной речи, больших словарей и изолированных слов. Рассмотрим структуру системы «Речь-текст». A – модели слов (эталоны и их последовательности векторов признаков). 0 этап – микрофон (рис.8.5). Отрезок сигнала длительностью T1 дискретизируется, и к отсчетам применяется преобразование типа дискретного преобразования Фурье. Получается конечный дискретный спектр ki(f) – это вектор признаков для речевого отрезка T1. I этап – вычленение последовательностей векторов признаков на ряде отрезков длительностью T1, T2... II этап – сравнение последовательности векторов с последовательностью векторов эталонных слов («вычисление локальных метрик»). III этап – временное выравнивание и вычисление мер соответствия признаков слов. IV этап – тоже, что и III, но для предложений. V этап – классификация последовательности векторов признаков. Этап II может быть выполнен на ИНС: однослойной или многослойной иерархической. В последнем случае первый слой выделяет класс (например, слово), а последние слои классифицируют это слово внутри класса. Синтез речи. У нас есть уже упоминавшаяся система «Мышь» (чтение произвольного текста на русском языке голосом из группы голосов). В Белоруссии создан сайт с подобной коммерческой системой. В Японии создан мобильный телефон, который в реальном масштабе времени произносит текст абонента одним из пятидесяти записанных голосов, ранее общавшихся по этому аппарату людей. Есть ИНС система университета Хопкинса из трех слоев (всего примерно 330 нейронов): входной слой состоит из семи групп по 29 нейронов, внутренний – 80 нейронов, выходной – 26 нейронов. Система выдает коды для синтеза фонем, коды согласовываются с синтезатором речи DEC Talk. Одновременно с данной буквой синтезируются 3 предыдущих и 3 последующих буквы для учета контекста. В начале обучения на выходе звучит один тон, а в конце обучения вполне членораздельная речь, с коэффициентом распознания речи 95%. Примеры диалоговых систем.
Kiberry основана ИНС-технологии проектирования интеллектуальных систем. §3. Несамостоятельность. Проблема внутренней речи и скрытие know-how. В современных ЕЯ-системах существует проблема самостоятельности. Обычно активен пользователь, а система ему «отвечает». А надо стремиться к равенству согласно определению интеллектуального агента. А согласно определению РА, кроме этого равенства необходимо использование в диалоге индивидуальных черт общающихся личностей. К этому примыкает проблема внутренней речи, то есть интерпретация сигналов на основе моделей пользователей. У человека во времени происходит так (рис.8.6): Внутренняя речь образна по форме и предикативна по функциям. Предикат – сказуемое высказывание, то есть качество субъекта или отношение между субъектами. Как моделировать внутреннюю речь? В лучших современных системах (например, Loren) похоже эта проблема как-то решена, но это know-how скрывают. Результат. Охватывая различные составляющие МАС-РА видим, что есть технологии изготовления большинства из них. Поэтому МАС-РА может появиться в рамках той или иной технологии. Скорее всего в рамках гибридной технологии. А в последних версиях доля ИНС-технологии с бионическими принципами будет расти. Детерминационный анализ Детерминационный анализ, производится на коммерческих компьютерных программах. Многомерный статистический анализ для принятия решения в произвольной области. Этот метод отличается максимально большой степенью общности и, дополненный структурным анализом, выходит на создание аппарата и картины мира для информационных систем будущего (может быть полезен на любой работе). Введение: Во второй части курса ставится вопрос о том, какой общей логической основой и каким общим мировоззрением надо снабдить "мозги" искусственных организмов, называемых РА. Эта задача разрешима, если потребовать, чтобы для этого использовались наиболее общие компьютерно-конструктивные предложения из имеющихся. Задачу будем решать в рамках прагматического (традиционного) направления ИИ. При этом в целом для РА мы не выходим за рамки гибридной технологии. Общая логическая основа состоит из двух составляющих: 1). Детерминационный анализ и детерминационная силлогистика (ДА и ДС) 2).Структурный анализ (СА) Тема 9. Детерминационный анализ. Практические вопросы и их свойства. Соотношение несущественности. §1. Практические вопросы и их свойства. Практические вопросы: 1). Предсказание (прогноз) результата, исходя из существующего положения, как предпосылок, 2). Поиск путей, приводящий к нужным результатам, 3). Выработка понятий наиболее адекватных для описания предпосылок (для изменения уровня решения), 4). Выработка понятий наиболее адекватных возможным результатам (для изменения уровня решения), 5). Объяснение некоторого положения в настоящем или прошлом, 6). В какой мере верно решать, что из предпосылки "а" следует результат "с", если знаем, с какой точностью из "а" следует "b", и с какой точностью из "b" следует "с"? Свойства вопросов: 1). Они практичные или "деловые". В основном они стоят перед любым организмом и изучались в Теме 7, но сейчас они сформулированы для решения на логическом уровне. 2). Они выражают следствие от предпосылок к результатам. Желательно чтобы это следование было статистическим. 3). Они используют ЕЯ, т.е. и предпосылки и результаты имеют в основном качественный, а не количественный характер. 4). В них используются конкретные формулировки, а именно значения предпосылок и результатов. 5). Требуется обоснованность ответов. §2 Пример статистического следования. Ошибочность традиционной интерпретации соотношения несущественности. Пусть нас (точнее РА) интересует история болезни умерших людей, чтобы найти зависимость между образом жизни этих людей и причиной их смерти. Умерший человек - это объект, признак x - причина смерти. У признака х два значения (значение x=а - смерть от рака легких, x=а - смерть не от рака легких). Признак у - отношение к курению. У признака у два значения (y=b - курил, y=b- не курил). Возможны 2 следования, которые обозначим так: a=>b (1) b=>а. (2) В (1) а - предпосылка, b – результат: “если человек умер от рака легких, то он курил”. В (2) b - предпосылка, а – результат: “если человек курил, то умер от рака легких”. Величины (силы) следования в (1) и (2) разные), в (1) величина силы следования больше, чем в (2). Отметим, что в этом примере и вообще в статистическом следовании речь идет о двух значениях разных признаков объектов. Как измерить силу связи в общем случае? Долгое время казалось, что для характеристики статистического следования давно существует понятие - это основное понятие теории вероятности и математической статистики. Пусть c и d- события или явления, тогда Р(с), P(d) - вероятности событий с и d, P(cd) - вероятность совместного наступления событий c и d Р (d/c), P(c/d) - условные вероятности P(d/c) = P(cd)/P(c) (3) Пусть имеет место равенство: Р (d/c) - P(d) = 0 (4) P(d) - безусловная вероятность. Тогда если Р(с)≠0, при выполнении (4), мы получаем P(cd) = P(c)*P(d) (*) А если (4) не выполняется, тогда P(cd) ≠ P(c)*P(d) (*') Уравнение (*) – будем называть соотношением несущественности, в выражение (*') - соотношением существенности. Вроде бы получаем, что из с не следует d c≠>d (5) или сила связи = 0. Из формулы (*') - получаем, что из c следует d c=>d. (6) За величину силы следования из c в d можно принять такую величину: R(c=>d) = P(cd) - P(c)*P(d). (7). Внимательное рассмотрение выражений (3,4,*,*') Колмогоровым и Чебышевым показала, что в формулах (*) и (*') речь не идет о связи одного события с другим событием (значением), как это считалось в традиционной интерпретации, а речь идет о связи вероятности одного события с наступлением и ненаступлением другого события. По Чебышеву: “Если наступление или ненаступление события не оказывает влияние на вероятность другого, то вероятность случиться им вместе определяется через произведение их вероятностей.” Поэтому для характеристики связи одного события (значения) с другим событием (значением) нужна не характеристика (7), или другие, так называемые "меры статистической связи", также основанные на неверной интерпретации соотношений со * и со *', а совсем другая характеристика. |