Работа выполнена в АНО Научный центр ГДТ Софтвер Гроуп
На правах рукописи
Научный руководитель доктор физико-математических наук
, Зибаров Алексей Владимирович Карпов Андрей Николаевич
Официальные оппоненты: доктор технических наук, профессор Галушкин Александр Иванович кандидат технических наук Максимов Федор Александрович
Ведущая организация: Московский Физико-Технический Институт ОБРАБОТКА ДАННЫХ НА ПАРАЛЛЕЛЬНЫХ (МФТИ) ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСАХ
Защита состоится 14 декабря 2006 г. в 14-00 часов на заседании диссертационного совета № 002.058.01 при институте математического моделирования Российской 05.13.18 - Математическое моделирование, численные методы и комплексы академии наук по адресу: 125047, Миусская пл. 4а.
программ
АВТОРЕФЕРАТ
С диссертацией можно ознакомиться в библиотеке ИММ РАН диссертации на соискание степени кандидата физико-математических наук
Автореферат разослан л 9 ноября 2006г.
Ученый секретарь диссертационного совета Н. Г. Прончева кандидат физико-математических наук Тула 2006 3 4 Х обеспечение совместимости с наиболее распространенными операционными
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
системами и графическими форматами;
Х создание параллельной системы визуализации результатов расчётов и Актуальность темы. Несмотря на огромную вычислительную мощность графического интерфейса пользователя;
современных компьютеров, существуют задачи, решение которых на обычных ЭВМ Х создание системы сохранения и восстановления данных расчёта и конфигурации занимает неприемлемо долгое время (недели и месяцы). К таким задачам относятся, проекта, способной функционировать на вычислительных комплексах с например, численное моделирование гидродинамических процессов, задачи распределённой памятью;
распознавания образов, оптимизационные задачи с большим числом параметров и т.д.
Время решения подобных задач можно существенно сократить, если Х создание системы, реализующей динамическое управление расчётом;
использовать для расчётов многопроцессорные ЭВМ. Для того, чтобы в полной мере Х тестирование разработанных алгоритмов при работе на многопроцессорных использовать преимущества, предоставляемые такими ЭВМ, необходимо вычислительных системах с большими объемами памяти и передаваемой переработать алгоритмы решения задач с учётом возможности параллельной информации;
обработки данных несколькими процессорами одновременно. Не менее важно Х демонстрация численного моделирования задач прикладного характера в распределить вычисления таким образом, чтобы каждый процессор использовался широком диапазоне начальных и граничных условий при помощи разработанной наиболее полно, а суммарное время решения задачи стремилось к минимуму.
параллельной версии пакета прикладных программ, а также анализа полученных Другой немаловажной задачей при распределенной обработке данных графических изображений и видеороликов.
является достижение хорошей масштабируемости (scalability). Вопросы, возникающие Личное участие автора в получении результатов, изложенных в при разработке наращиваемых систем, отвечающих заданным характеристикам, часто диссертации, заключается в разработке методик по декомпозиции процесса выходят на передний план и требуют глубокого изучения и исследований.
разработки параллельного программного обеспечения, реализация алгоритмов Проблемы распараллеливания и распределения вычислений сегодня динамической балансировки и on-the-fly визуализации на многопроцессорных являются одним из основных и крайне важных аспектов при построении программных вычислительных комплексах.
комплексов. В последние годы, в связи с развитием многопроцессорных персональных Практическая значимость. Разработанные параллельные версии пакетов вычислительных систем, задача распараллеливания вычислений получила еще численного моделирования и система визуализации позволяют существенно большую значимость.
упростить и ускорить проведение научных и инженерных исследований. Подход, Актуальность выбранной темы является следствием быстрого развития основанный на численном моделировании, наиболее информативен, доступен для научных работ, построенных на математическом моделировании процессов с использования большими коллективами и отдельными инженерами и учеными, использованием вычислительной техники, а также с анализом данных различной позволяет получить прямой экономический эффект при разработке, испытаниях и природы, представленных в виде баз данных.
производстве самой разнообразной продукции. Разработанная система визуализации Цель работы. Целью настоящей диссертационной работы является сверхбольшого объема данных дает возможность целиком наблюдать всю картину разработка и реализация параллельных алгоритмов для различных задач обработки процесса, моделируемую на компьютере, не ограничиваясь отдельными датчиками сверхбольшого (более 100 гигабайт) объема данных, обладающих высокой или срезами. Система позволяет наблюдать развитие процесса в динамике, что очень производительностью и хорошей масштабируемостью. В соответствии с поставленной важно на многих этапах исследования. Пакеты могут быть применены в различных целью работы предполагается решение следующих задач:
отраслях науки, техники и производства (авиа-космическая техника, системы вооружений, экология, анализ чрезвычайных ситуаций, оборонное и гражданское Х разработка параллельных архитектур пакетов, позволяющих создавать применение взрывов, реактивные двигатели и двигатели внутреннего сгорания и т.д.) исполняемый код, наиболее эффективный по быстродействию и работе с ресурсами памяти;
Положения, выносимые на защиту:
Х реализация алгоритмов сбора данных с узлов вычислительного комплекса, их Х геометрические методы разбиения счетных областей, динамическая балансировка преобразования, синхронного сбора, отображения и т.д.;
загрузки процессоров и выборка распределенных данных;
5 Х теоретические методы адаптации программ к архитектуре параллельных Х Государственное образовательное учреждение высшего профессионального вычислительных систем. образования ТуГУ;
Х Московский государственный технический университет им. Н.Э. Баумана;
Х методы сбора и визуализации сверхбольшого объема данных на многопроцессорных вычислительных комплексах; Х Конструкторское бюро приборостроения;
Научная новизна работы заключается в: Х ФГУП ЦНИИ "Буревестник";
Х создании механизма динамической балансировки нагрузки на вычислительные Х Балтийский государственный технический университет Военмех им.
узлы, основанного на перераспределении объема обрабатываемых данных; Д.Ф. Устинова;
Х создании системы сбора и визуализации сверхбольшого объема данных на Х ФГУП ГНПП Сплав;
выделенном узле;
Х Институт автоматизации проектирования РАН;
Х построении архитектуры пакета, поддерживающего отображение сверхбольшого Х Sandia National Laboratories (США);
объема данных в реальном времени (on-the-fly визуализация);
Х Rheinmetall GmbH (Германия);
Х разработке и реализации системы динамического сценария расчётов в пакетах Х DSO National Laboratories (Сингапур).
численного моделирования.
Достоверность результатов подтверждена комплексным тестированием на Структура и объем работы. Диссертационная работа состоит из введения, многопроцессорных вычислительных комплексах с различной архитектурой под четырех глав, заключения и списка литературы. Объем диссертации составляет операционными системами Windows, Linux, Solaris. Замеры производительности страниц и содержит 77 рисунков и 1 таблицу. Список литературы включает показали хорошую масштабируемость разработанных алгоритмов на наименования.
многопроцессорных вычислительных комплексах.
Апробация работы. Основные результаты работы докладывались на ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
конференциях:
Во введении говорится об актуальности обработки данных на параллельных 1. XII Международная конференция по вычислительной механике и современным вычислительных комплексах. Перечислены основные потребители алгоритмов и прикладным программным системам (ВМСППС'2003) 30 июня - 5 июля 2003 г., аппаратных решений, которым требуется обработка сверхбольших объемов данных.
Владимир, Россия.
Отмечено, что современная наука, ориентируясь на численный эксперимент, 2. Международная конференция Четвертые Окуневские чтения, 22-25 июня претерпевает качественное изменение в формах и объемах экспериментальной базы.
2004 г., Санкт-Петербург, Россия.
Так же отмечено, что развитие многопроцессорной вычислительной техники 3. 15-я Международная конференция ГРАФИКОН, 20Ц24 июня 2005 г., неразрывно связано с разработкой технологий параллельного программирования - как Новосибирск, Россия.
универсальных, так и под конкретную архитектуру суперЭВМ. Использование многопроцессорных систем требует новых подходов к процессу программирования 4. 4 Pacific Symposium on Flow Visualization and Image Processing, 3-5 June 2003, исследовательских комплексов.
Chamonix, France.
Подчеркнуто, что в работе освещены лишь некоторые направления, ориентированные на разрешение проблем в подходах к разработке параллельного Использование результатов. Разработанные технологии внедрены в программного обеспечения. Основное внимание будет сосредоточено на проблемах научных и промышленных организациях, конструкторских бюро и высших учебных создания параллельных алгоритмов численного моделирования (эксперимента) и заведениях. Среди них:
системах параллельной визуализации.
Х НИИ механики МГУ им. М.В. Ломоносова;
Х Московский физико-технический институт;
7 Говорится о научной визуализации данных, являющейся неотъемлемой В конце главы затронуты вопросы научной визуализации параллельных частью современного анализа явлений практически в любой отрасли естественных вычислений. Приведена краткая история развития визуализации, перечислены наук. проблемы визуализации в параллельных вычислениях, а также сложности образного представления абстрактных данных. Обращено внимание на направление Первая глава диссертации посвящена анализу современного состояния исследований, связанных с реализацией средств, обеспечивающих on-the-fly исследуемых вопросов и постановке задачи исследования. Анализ производился по визуализацию параллельных вычислений.
научным, техническим и патентным источникам информации. Рассмотрен вопрос развития параллельной обработки данных и архитектурных изменений аппаратной Во второй главе описываются подходы создания параллельных алгоритмов базы с целью повышения быстродействия. Дается определение понятиям и систем визуализации.
УсуперкомпьютерФ и Укластерные системыФ.
В начале главы говорится о моделировании объектов распараллеливания.
Упомянуты методы использования многопроцессорных систем, виды Моделирование есть методология работы, эффективность которой раскрывается лишь параллелизма в задачах численного моделирования. Рассмотрена статическая и при высокой квалификации специалистов и при их свободном владении динамическая балансировка. При решении широкого круга задач математической современными средствами формализации - логикой и математикой. Отмечено, что физики на многопроцессорных системах с помощью сеточных методов, широко специалисты по теории разработки программного обеспечения при описании процесса используются два подхода для построения параллельных программ. Первый получил его создания весьма редко уделяют внимание моделированию. Принимая во внимание, название метода геометрического параллелизма, второй - метод коллективного что разработка параллельного программного обеспечения (объекта решения. Подавляющее большинство решаемых в настоящее время с помощью распараллеливания) на сегодняшний день представляется достаточно сложной, методов конечных разностей или конечных элементов задач газовой динамики, проблема создания теоретических основ его проектирования стоит еще более остро. В микроэлектроники, экологии, и многих других эффективно решаются именно методом рамках моделирования объектов распараллеливания рассмотрены уровни геометрического параллелизма. Методом коллективного решения целесообразно декомпозиции объектов распараллеливания. А затем возможность распараллеливания пользоваться при построении параллельных алгоритмов решения задач методами объектов в алгоритмах численного моделирования.
Монте-Карло, при проведении серий однотипных расчетов и в ряде других случаев.
В работе предложено реализовывать параллельные варианты численных Отмечается, что метод геометрического параллелизма является методом методов на основе геометрического параллелизма. Метод геометрического статической балансировки загрузки, заранее определяя обрабатываемую каждым параллелизма (domain decomposition) является широко известным, и часто процессором часть сетки. Статическая балансировка эффективна при условии, что используется, что связано как с его простотой и наглядностью, так и с возможностью априорной информации достаточно для предварительного распределения общей использования значительного опыта, накопленного в его применении. В основе вычислительной нагрузки поровну между процессорными узлами. Метод многих физических задач лежит регулярная геометрическая структура с коллективного решения является методом динамической балансировки загрузки. В его пространственно ограниченным взаимодействием (например, задачи газовой рамках перед началом вычислений не известно, какие именно узлы сетки будут динамики, гидродинамики, теории поля). Благодаря этой однородности данные могут обработаны тем или иным процессором. Процессоры получают задания динамически, быть единообразно распределены по сети процессоров таким образом, что каждый из по мере выполнения уже поступивших, что обеспечивает равномерную загрузку процессоров будет отвечать за определенную область пространства (рис. 1).
процессорных узлов при наличии большого набора независимых заданий.
Не оставлены без внимания проблемы распараллеливания, связанные с решением сложных задач численного моделирования на примере задач горения.
Pages: || Авторефераты по всем темам >> Авторефераты по разным специальностям