Принципы работы системы управления параллельными процессами в локальных сетях компьютеров

Контрольная работа - Компьютеры, программирование

Другие контрольные работы по предмету Компьютеры, программирование

Ульяновский Государственный Университет

1999

ЗАПИСКА ПО КУРСОВОЙ РАБОТЕ

Студент группы ПМ-42 Никифоров Ю.В.

Далее описаны принципы работы системы управления параллельными процессами в локальных сетях компьютеров.

1999

1. Умножение матриц. (гипотетический пример)

A * B =: C

Где А (m*s), B (s*n), C(m*n)

Алгоритм:

For i := 1 to s do

Граф зависимостей по данным (Data Flow Graph)

A[1]C[1]

A[2]C[2]

A, BC

A[k]C[k]

Д диспетчер. Коммутирует каналы связи и распределяет строки A[i] по процессорам.

П приёмник (вполне может быть тем же диспетчером), формирует матрицу С из полученных строк.

K число процессоров минус 2 (или 1), которые выполняют умножение строки на матрицу.

Если k m. Тогда каждый процессор один раз выполняет перемножение A[i]*B и передаёт результат процессору П . Далее процесс П формирует матрицу С и выдаёт результат пользователю.

Если k m, то вначале просчитываются первые k строк.

Когда вычисления закончится на одной из k процессоров, то ей передаётся следующая строка т.е. A[k+1].

И так далее, в освободившиеся процессоры передаются строки

A[k + i], i = 1 & m-k.

Достоинства данной схемы.

Однократеая загрузка матрицы B в процессоры-вычислители, и дальнейшая загрузка только векторов-строк A[i] (минимизация потока данных).

Автоматически учитывается производительность процессоров. Если процессор работает быстро, то он загружается дополнительно (случай при k < m).

2. Цели оптимизации параллельных вычислений.

Минимизация потока данных в DFG.
Учёт производительности процессоров. Включая случай зависимости её от времени (динамика).
Учёт скорости обмена по каналам связи между процессорами. Включая случай зависимости её от времени (динамика).
Коррекция DFG в реальном времени (пояняется на следующем примере итерационных методов).

далее на следующей странице&

3. Итерационные алгоритмы.

Общий случай графа потоков данных.

циклическая связь k

процессоров

Каждый процессор (P1..Pk) или группа процессоров выполняет свою задачу (интегрирование, умножение, дифференцирование, минимизация, решение СЛУ и т.п.).

Диспетчер Д обеспечивает запуск итерационного процесса путём передачи исходных данных (нелевой итерации) в циклическую цепь.

Перегрузка цепи

Предположим что процессор Р1 обрабатывает поток данных быстрее по сравнению с Р2, а также обеспечивается его эффективаная загруженность (на вход Р1 быстро поступают данные). Медленная обработка данных может быть вызвана низкой скоростью передачи данных по каналу P1-P2, низкой вычислительной мощностью процессора Р2 или сложностью задачи выполняющейся на Р2.

Следовательно, в результате работы итерационного алгоритма на выходе Р1 и на входе Р2 скапливаются данные, которые ожидают дальнейшей обработки.

Далее, если Р2 работает медленнее, чем Р3 (или Р2 вообще один из самых медленных процессоров), то простаивают все P(i), i 3 и Р1 (или работают с малой загруженностью).

В таком случае эффективность работы данной параллельной схемы резко снижается.

Действия.

Причиной снижения скорости вычислений является узкое место в цепочке процессоров, а именно медленный поцессор Р2.

Одним из способов устранения данного недостатка является динамическое изменение графа потоков данных.

Параллельно Р2 включается в работу дополнительный процессор Р2, выполняющий ту же задачу (рабочую функцию), что и Р2.

циклическая связь k

процессоров

Таким образом в 2 раза повышается скорость обработки на дуге 1-2.

4. Принципы реализации.

Система реализована для ОС Windows 95 (NT), в виде исполняемой программы и дополнительной библиотеки динамической компоновки (DLL). Программа должна быть запущена на всех машинах локалной сети, участвующих в вычислениях. Дополнительная библиотека может использоваться программами, осуществ?/p>