А. В. Бернштейн, заведующий лабораторией
Вид материала | Доклад |
- С. Н. Собрание сочинений. М.: 1952 Т. С. 105-106. Бернштейн С. Н. Собрание сочинений., 8.17kb.
- Ефимов Валерий Сергеевич, доцент, заведующий лабораторией конструктивной педагогики, 68.64kb.
- Виленский Андрей Витальевич заведующий лабораторией номенклатуры и классификации медицинских, 77.88kb.
- Проблема бессмертия человека: альтернативные подходы и решения, 302.95kb.
- Ахременко Андрей Сергеевич, доктор политических наук, заведующий лабораторией математических, 26.79kb.
- Модели эффекта Харста, 215.49kb.
- Рассеянный склероз, 2056.64kb.
- Рабочая программа обсуждена и утверждена на заседании кафедры теории и методологии, 330.65kb.
- Геннадий Моткин, профессор, заведующий лабораторией Института проблем рынка, 140.82kb.
- Концепция федерального закона «О предотвращении загрязнения моря нефтью» Заведующий, 1020.25kb.
Когнитивные технологии в компьютерных системах проектирования и анализе данных
А.В. Бернштейн, заведующий лабораторией
Института системного анализа РАН, профессор
базовой кафедры МФТИ, a.bernstein@irias.ru
А.П. Кулешов, директор Института проблем
передачи информации им. А.А. Харкевича РАН,
член-корреспондент РАН, заведующий
базовой кафедрой МФТИ, kuleshov@iitp.ru
Доклад содержит обзор методов, алгоритмов и программ, моделирующих познавательные способности человеческого мозга для решения конкретных прикладных задач в компьютерных системах проектирования и анализа данных в условиях нечетких входных данных и взаимосвязей, основанных на синергии математических методов, информационных технологий и знаний из предметной области, объединенных общим понятием «когнитивные технологии». Возрастающая востребованность когнитивных технологий в компьютерных системах проектирования и анализа данных ставит новые задачи при подготовке специалистов в области прикладной математики, информатики и информационных технологий.
Введение
Когнитивные технологии в информатике в современном понимании этого слова – это совокупность методов, алгоритмов и программ, моделирующих познавательные способности человеческого мозга для решения конкретных прикладных задач – распознавания образов (речи, сигналов, изображений, сцен и т.д.), выявления и идентификации закономерностей в массивах данных, решения задач компьютерного проектирования сложных систем, систем поддержки принятия решений в условиях нечетких входных данных и взаимосвязей и т.д. Еще 50 лет назад отцами кибернетики Винером и фон Нейманом была сформулирована задача соединения вычислительных возможностей компьютера с когнитивными способностями человеческого мозга. Эта идея и лежит в основе современных когнитивных технологий.
Компьютерные системы проектирования (Computer Aided Design, CAD) при своем зарождении использовались для автоматизации труда инженера-проектировщика при реализации принятых инженерных решений (разработке чертежей, изготовлении конструкторской документации, автоматической проверке корректности входных данных и результатов проектирования, и т.п.). Современные CAD-системы позволяют осуществлять «безбумажное» проектирование сложных объектов, представляя спроектированный объект в электронном виде.
Для сокращения времени проектирования и числа дорогостоящих (в материальном и временном смыслах) натурных экспериментов, улучшения качества проектирования создаются компьютерные системы проектирования для поддержки принятия инженерных решений (Knowledge Based Engineering, Computer Aided Engineering). Такие системы, являющиеся, по существу, специализированными системами моделирования и поддержки принятия решений, позволяют исследовать большое количество вариантов построения объекта (конфигурации, параметров и др.), предсказывать ожидаемые характеристики и находить наилучшие (рациональные) решения.
В докладе будут описаны модели, для создания и исследования которых необходимы когнитивные технологии, а также используемые для этого методы и алгоритмы. Будут также обсуждены проблемы подготовки специалистов, работающих в области когнитивных технологий.
Модели в компьютерных системах проектирования
В процессе проектирования и создания сложного технического объекта рассматриваются и сравниваются различные технические решения, касающиеся структуры объекта, механизмов его функционирования, выбора параметров и других элементов объекта. Значительный прогресс в области математического моделирования и возможностей вычислительной техники позволяет провести широкий спектр исследований без проведения натурных экспериментов, и делают математическое моделирование (вычислительные эксперименты для исследования аналитических моделей создаваемого объекта и окружающей его среды) одним из самых распространенных методов анализа и оптимизации структуры технических объектов.
Традиционно в моделировании используются математические модели, основанные на «физике процессов» и описывающие физические процессы и явления, происходящие при функционировании объекта, сложными дифференциальными уравнениями в частных производных с граничными условиями (например, краевые задачи для усредненного по Рейнольдсу уравнения Навье-Стокса в аэродинамике). Для таких уравнений зачастую неизвестны ни теоремы о существовании и единственности решения, ни характер зависимости решения от параметров и граничных условий. Программные пакеты для анализа таких моделей реализуют различные численные методы решения соответствующих уравнений (например, методы вычислительной аэрогидродинамики - Computational Fluid Dynamics, CFD).
Используемые численные методы имеют значительную вычислительную трудоемкость как самих расчетов, так и подготовки исходных данных, описывающих вариант построения объекта, и расчетных сеток. Это существенно сокращает возможности использования моделей, основанных на «физике процессов», особенно на стадии предварительного (концептуального) проектирования, на которой рассматривается очень большое количество вариантов решений и высока цена неправильно выбранного решения.
В последние годы стали развиваться математические модели, основанные на данных. Такие модели строятся на основе данных - результатов натурных и/или вычислительных экспериментов, проведенных с различными объектами рассматриваемого класса, с минимальным привлечением знаний из предметной области (физики процессов). Другими словами, модели «обучаются» по множеству прототипов входных и выходных данных.
Модели, построенные «по данным», фактически имитируют (заменяют) как источники получения данных, основанные на некоторой исходной модели, так и сами модели, созданные на основе изучения физики процессов. Поэтому, таким образом построенные адаптивные модели иногда называют также суррогатными моделями (Surrogate Models). Обе модели (исходная и суррогатная) должны иметь один и тот же набор входных и выходных данных, а результаты обоих моделей (для одних и тех же входных данных) должны быть близкими.
Технология построения суррогатных моделей и используемые методы основаны на синергии методов предметной области и когнитивных технологий, базирующихся на достижениях общенаучных дисциплин (математики, искусственного интеллекта и анализа данных, информационных технологий), и в значительной степени инвариантны по отношению к предметной области [1, 2].
Задачи и методы когнитивных технологий
При проектировании объектов с использованием компьютерной поддержки принимаемых решений решаются три базовые проблемы:
- целенаправленная автоматическая генерация вариантов цифровых описаний объектов,
- построение функций отклика – вычисление характеристик объекта по заданным цифровому описанию объекта, параметрам управления и параметрам среды функционирования,
- оптимизация - построение объекта с наилучшими свойствами при наличии ограничений.
Сложности решения этих проблем обусловлены, прежде всего, высокой размерностью цифровых описаний объектов (например, 3D-описаний поверхностей), что существенно затрудняет построение функций отклика, зависящих от векторов высокой размерности, и оптимизация в пространстве таких векторов. Множество цифровых описаний рассматриваемого класса объектов лежат, как правило, вблизи многообразий существенно меньшей размерности, и необходимо «оставаться» вблизи этих многообразий при генерации новых объектов (в частности, в процессе оптимизации).
Перечислим некоторые базовые процедуры анализа и обработки данных, используемые в процессе построения суррогатных моделей [3 - 5]:
- определение внутренней размерности множества данных и построение процедур снижения размерности (построение аппроксимирующих многообразий меньшей размерности [6]);
- построение многомерных нелинейных непараметрических регрессионных (аппроксимирующих) зависимостей;
- кластеризация и классификация данных;
- предсказание значений ошибок процедур;
- генерация (имитационное моделирование) многомерных данных, лежащих вблизи нелинейных многообразий меньшей размерности, и др.
По сравнению с классическими постановками этих математических задач, их постановки имеют ряд особенностей при использовании в когнитивных технологиях, вызванных как спецификой предметных областей, так и необходимостью их взаимосвязанного решения, когда выходные данные одной частной задачи являются входными данными для другой задачи, и целевые функции для частных задач нельзя определить независимо.
Например, в задаче снижения размерности требуется обеспечить близость не только между данными и их восстановленными (в результате последовательного применения процедур сжатия и восстановления) значениями, но и значениями различных функционалов от них [6] (например, в задаче снижения размерности геометрического описания аэродинамических профилей крыла в качестве такого функционала выступает распределение давления на поверхности профиля при заданном набегающем потоке). Кроме того, содержательная постановка проблемы формулирует задачу снижения размерности в евклидовом пространстве в равномерной взвешенной метрике, в то время как подавляющая часть теоретических работ использует среднеквадратическую метрику, и необходимо, как минимум, аппроксимировать равномерную метрику подходящей взвешенной среднеквадратической метрикой [7]. Другим примером является возможность использования в задаче снижения размерности имеющейся дополнительной информации об условиях, при которых данные были получены [8].
Автоматизация построения процедур
Модели, основанные на данных (прототипах), по своей сути могут гарантированно использоваться только для входных данных, которые подобны входным данным прототипов, с помощью которых была построена модель. Тем самым, для нового множества прототипов модель должна быть либо перестроена (путем решения статистической задачи предсказания значений одной модели для некоторых входных данных по значениям другой модели для тех же входных данных), либо построена заново. Поэтому имеется настоятельная необходимость создания программных средств автоматического (автоматизированного) создания моделей, основанных на данных.
Как было сказано выше, такие модели создаются путем взаимосвязанного последовательного решения ряда частных задач анализа данных. Поэтому программные средства для поддержки создания моделей имеют два уровня:
- Автоматические генераторы процедур,
- Интеграторы программных модулей.
Автоматические генераторы процедур создают программные модули, реализующие базовые процедуры анализа и обработки данных (например, процедуру снижения размерности, построенную по заданному множеству данных).
Рассмотрим более подробно алгоритм работы автоматического генератора на примере автоматического построения процедуры снижения размерности. Не существует универсальной наилучшей процедуры снижения размерности для любой структуры данных, и многие процедуры, являющиеся наилучшими для одной структуры (например, метод главных компонент в случае линейной структуры данных), оказываются неэффективными для данных другой структуры. Возможно также, что в данной предметной области существуют предметно-ориентированные процедуры снижения размерности, построенные с учетом «физики» данных (так называемые частные параметрические модели [9]).
Математик, знакомый с различными математическими методами снижения размерности и понимающий, как влияет структура данных на качество той или иной процедуры снижения размерности, может «вручную» выбрать или построить достаточно эффективную процедуру снижения размерности путем анализа структуры данных и проведения сравнительных вычислительных экспериментов.
Однако инженерные проектные команды не предполагают наличия в них математиков, а возможность оперативного привлечения «внешнего» математика затруднительна, а иногда и просто невозможна (например, в силу конфиденциального характера данных). Поэтому автоматический генератор процедур снижения размерности должен позволять работать с ним инженеру, не имеющему углубленных знаний в области математики. При работе с генератором процедур, пользователь (инженер-проектировщик) должен наряду с данными задать только ряд пользовательских требований к окончательной процедуре, например:
- уровень ошибки, включая метрику, в которой должна вычисляться ошибка (равномерная, среднеквадратическая, взвешенная с заданными весами и т.п.),
- дополнительные ограничения на значения некоторых функционалов на множестве решений (в том числе, иметь возможность подключать пользовательские программные модули, вычисляющие значения таких функционалов), и т.п.
Тем самым, генератор процедур должен в процессе своей работы имитировать работу математика, проводя целенаправленно вычислительные эксперименты с различными встроенными процедурами снижения размерности и синтезируя наиболее эффективную процедуру работы с заданным множеством данных (используя, например, так называемые каскадные процедуры снижения размерности [10]). Другими словами, автоматические генераторы строятся на основе когнитивных технологий работы с данными.
Интегратор программных модулей должен позволять эффективно проводить вычислительные эксперименты с целью построения эффективной «сквозной» процедуры обработки данных, выбирая последовательность выполнения и параметры настройки частных программных модулей. Интегратор должен включать в свой состав (или позволять их подключение):
- программные модули, реализующие базовые процедуры анализа и обработки данных (имеющиеся или созданные Автоматическим генератором процедур);
- пользовательские программные модули, реализующие, например, исходный код, для которого строится суррогатная модель, или код, реализующий некоторые пользовательские расчетные процедуры;
- модули, реализующие стандартные процедуры работы с данными (процедуры описательной статистики, процедуры селекции или упорядочивания данных по разным параметрам, и т.п.).
Например, Интегратор вначале создает начальное множество данных путем проведения экспериментов с исходным пользовательским кодом для сгенерированных входных данных. С использованием базового модуля аппроксимации, строится первый вариант суррогатной модели, качество которой исследуется с использованием базового модуля оценивания точности моделей. Определяется множество входных данных, для которых модель не удовлетворяет требуемым требованиям по точности, и в окрестности этих входных данных с помощью исходного кода генерируются новые данные, которые включаются в обучающую выборку, и процесс построения суррогатной модели повторяется.
Результатом работы Интегратора является построенная по данным полностью специфицированная предметно-ориентированная модель, реализованная в виде автономного программного модуля.
Квалификационные требования к специалисту в области когнитивных технологий
Специалист в области когнитивных технологий может получить базовую подготовку в области направлений «Прикладная математика и информатика» и «Фундаментальная информатика и информационные технологии». Для эффективной работы, он должен, прежде всего, иметь широкие знания в области теоретической и прикладной математики, в частности, углубленные знания по теоретической и прикладной математической статистике и анализу данных.
Кроме того, специалист должен иметь базовые знания в области построения и анализа вычислительных алгоритмов и планирования и проведения вычислительных экспериментов (в частности, иметь навыки активной работы с основными математическими пакетами).
Специалист должен знать технологии программирования и проектирования программных продуктов и комплексов и желательно владеть хотя бы одним языком программирования.
Литература
1. Кулешов А.П. Технология быстрого вычисления характеристик сложных технических объектов/ Информационные технологии, прил. № 3, М., 2006, с. 4 - 11.
2. Кулешов А.П. Когнитивные технологии в адаптивных моделях сложных объектов/ Информационные технологии и вычислительные системы, в. 1, 2008, с. 18 – 29.
3. Бернштейн А.В., Кулешов А.П. Математические методы в когнитивных инженерных технологиях/ Обозрение прикладной и промышленной математики, сер. «Вероятность и статистика». 2008, т. 15, № 3, с. 451 – 452
4. Кулешов А.П. Задачи многомерного статистического анализа в системах компьютерного проектирования/ Труды VII Международной школы-семинара «Многомерный статистический анализ и эконометрика» (Армения, Цахкадзор, 2008), М., 2008, 60 – 61.
5. Бернштейн А.В., Бурнаев Е.В., Дорофеев Е.А., Свириденко Ю.Н., Чернова С.С. О решении некоторых задач анализа данных, возникающих при построении адаптивных суррогатных моделей сложных объектов/ Научно-теоретический международный журнал «Искусственный интеллект», Донецк, 2008, вып. 4, с. 40-48.
6. Бернштейн А.В., Кулешов А.П. Когнитивные технологии в проблеме снижения размерности описания геометрических объектов/ Информационные технологии и вычислительные системы. 2008, №2, с. 6 – 19.
7. Бурнаев Е.В., Чернова С.С. Об итеративном алгоритме подсчета взвешенных главных компонент/ Информационные процессы (электронный научный журнал u/Contents.htm), 2008, т. 8, № 2, с. 99 – 107.
8. Бернштейн А.В., Кулешов А.П. Снижение размерности при наличии предикатов/ Информационные процессы (электронный научный журнал u/Contents.htm), 2008, т. 8, № 1, с. 47-57.
9. Иванова Е.П., Чернова С.С. Снижение размерности сложных геометрических объектов при наличии частных параметрических моделей/ Информационные технологии и вычислительные системы, 2008, №4.
10. Бернштейн А.В., Бурнаев Е.В., Дорофеев Е.А., Свириденко Ю.Н., Чернова С.С. Каскадные процедуры снижения размерности/ Труды Одиннадцатой национальной конференции по искусственному интеллекту с международным участием (Дубна, 2008), т. 1, с. 241 – 250.