М. В. Ломоносова Факультет вычислительной математики и кибернетики В. Г. Баула Введение в архитектуру ЭВМ и системы программирования Москва 2003 Предисловие Данная книга

Вид материалаКнига

Содержание


10.4. Схема работы динамического загрузчика.
Подобный материал:
1   ...   24   25   26   27   28   29   30   31   ...   37

10.4. Схема работы динамического загрузчика.


Суть работы динамического загрузчика состоит в следующем. Сначала он размещает в памяти не всю программу целиком, как статический загрузчик, а только её основную часть (головной модуль программы). Все остальные модули загружаются в оперативную память по мере необходимости, когда к ним будет реальное обращение из головного модуля или других (уже загруженных) модулей программы. Иногда это называется загрузкой по требованию. Отметим здесь важную особенность такой загрузки по требованию. После размещения головного модуля в оперативной памяти динамический загрузчик не проверяет, что все другие модули, которые он может вызывать в процессе своей работы, на самом деле существуют (на это остаётся только надеятся изо всех сил ☺).1 Естественно, что, если какой-нибудь модуль не будет найден, когда понадобится его вызвать, то будет зафиксирована ошибка времени выполнения программы.

Надо отметить, что динамические загрузчики современных ЭВМ достаточно сложны, поэтому мы рассмотрим только упрощённую схему работы такого загрузчика. Эта схема будет очень похожа на схему работы динамических загрузчиков в ЭВМ второго поколения средины прошлого века.

Сначала разберёмся с редактированием внешних связей при динамической загрузке модулей (это и называется динамическим связыванием модулей). Работу динамического загрузчика будем рассматривать на примере программы, головной модуль которой вызывает три внешних процедуры с именами A,Beta и C12. Ниже приведён фрагмент сегмента кода этого головного модуля на Ассемблере:


Code segment

assume cs:Code,ds:Data,ss:Stack

Start:mov ax,Data

mov ds,ax

. . .

extrn A:far

call A

. . .

extrn Beta:far

call Beta

. . .

extrn C12:far

call C12

. . .

finish

Code ends

end Start; головной модуль


Пусть внешние процедуры с именами A,Beta и C12 расположены каждая в своём отдельном модуле, где эти имена, естественно, объявлены общедоступными (public). При своём вызове динамический загрузчик получает в качестве параметра имя головного объектного модуля, по существу это первый параметр редактора внешних связей (загрузочного модуля у нас нет, и не будет). Сначала динамический загрузчик размещает в оперативной памяти все сегменты головного модуля и начинает настройку его внешних адресов. Для этих целей он строит в оперативной памяти две вспомогательные таблицы: таблицу внешних имён (ТВИ) и таблицу внешних адресов (ТВА), каждая из этих таблиц располагается в своём сегменте памяти.

В таблицу внешних имён заносятся все внешние имена программы (в начале работы это имена внешних процедур головного модуля A,Beta и C12). Каждое имя будем представлять в виде текстовой строки, заканчивающейся, как это часто делается, символом с номером ноль в алфавите (будем обозначать этот символ \0, как это принято в языке С). Ссылка на имя – это смещение начала этого имени от начала ТВИ. В заголовке (в первых двух байтах) ТВИ хранится ссылка на начало свободного места в этой таблице (номер первого свободного байта). На рис. 10.3 приведён вид ТВИ после обработки головного модуля (в каждой строке таблицы, кроме заголовка, мы разместили по четыре символа).

ТВИ segment




0

Free=13










2

'A'

\0

'B'

'e'




6

't'

'a'

\0

'C'




10

'1'

'2'

\0













Рис. 10.3. Вид таблицы внешних имён после загрузки головного модуля.

Другая таблица динамического загрузчика, таблица внешних адресов, состоит из строк, каждая строка содержит четыре поля. Первое поле имеет длину четыре байта, в нём находится команда близкого абсолютного перехода jmp LoadGo . Это переход на начало некоторой служебной процедуры динамического загрузчика Мы назвали эту служебную процедуру именем LoadGo, что будет хорошо отражать её назначение – загрузить внешнюю процедуру и перейти на её выполнение. Процедура LoadGo загружается вместе с головным модулем и статически связана с ним.

Во втором поле Offset длиной 2 байта находится адрес (смещение) внешней процедуры на специальном рабочем поле, о котором мы расскажем немного ниже. До первого обращения к внешней процедуре в это поле динамический загрузчик записывает константу 0FFFFh, что является признаком отсутствия данной процедуры на рабочем поле. В третьем поле длиной в два байта расположена ссылка на имя этой внешней процедуры в таблице внешних имён. И, наконей, четвёртое поле, тоже длиной в 2 байта, содержит различную служебную информацию (флаги режимов работы) для динамического загрузчика, о чём мы также немного поговорим далее. Таким образом, каждая строка таблицы внешних имён описывает одну внешнюю процедуру и имеет длину 10 байт. В заголовке (первых двух байтах) ТВА содержится ссылку на начало свободного места в этой таблице. Таким образом, перед началом счёта ТВА будет иметь вид, показанный на рис. 10.4.

Каждая команда вызова внешней процедуры в головном модуле заменяется динамическим загрузчиком на команду перехода с возвратом на соответствующую строку ТВА. Например, команда  call Beta  заменяется на команду call ТВА:12 , а команда в головном модуле  call C12  заменяется на команду call ТВА:22 .

ТВА segment







Free=32
















2

jmp LoadGo

0FFFFh

2 ('A')

flags




12

jmp LoadGo

0FFFFh

4 ('Beta')

flags




22

jmp LoadGo

0FFFFh

9 ('C12')

flags




32






















Рис. 10.4. Вид таблицы внешних адресов после загрузки головного модуля.

Проследим работу нашей программы. Пусть головная программа в начале своего выполнения вызывает внешнюю процедуру с именем Beta. Естественно, что при первой попытке основной программы вызвать процедуру Beta, управление получает служебная процедура LoadGo динамического загрузчика. Получив управление, процедура LoadGo последовательно выполняет следующие действия.
  1. Сначала вычисляется величина TBA_proc, равная адресу строки вызываемой процедуры Beta в таблице TBA. Для случая вызова процедуры Beta величина TBA_proc=12.
  2. Затем анализируется поле Offset в строке TBA_proc. Если Offset=-1, то это означает, что нужной внешней процедуры с именем Beta в оперативной памяти ещё нет. В этом случае процедура LoadGo производит поиск объектного модуля, содержащего требуемую процедуру (в паспорте этого модуля указана входная точка с именем Beta с типом дальней метки far). Если такой объектный модуль не найден, то фиксируется фатальная ошибка времени выполнения и наша программа завершается, иначе требуемая внешняя процедура Beta загружается служебной процедурой LoadGo в оперативную память и динамически связывается с основной программой. Для загрузки процедур в памяти выделяется специальная область, она часто называется рабочим полем процедур. Мы отведём под рабочее поле сегмент с именем Work, занимающий, например, 50000 байт:

Work segment

db 50000 dup (?)

Work ends

Рабочее поле размещается в оперативной памяти одновременно с сегментами головного модуля, ТВИ и ТВА. После загрузки Beta поле Offset в строке TBA_proc принимает значение адреса начала процедуры на рабочем поле. В нашем случае процедура Beta загружается с начала рабочего поля, так как оно пока не содержит других внешних процедур, так что поле Offset принимает значение 00000h.
  1. Анализируется адрес дальнего возврата, расположенный на вершине стека (по этому адресу процедура Beta волжна возвратиться после окончания своей работы). Целью такого анализа является определение того, производится ли вызов процедуры Beta из головного модуля программы (как в нашем примере), или же из некоторой внешней процедуры, уже расположенной на рабочем поле (что, конечно, тоже возможно). Ясно, что такой анализ легко провести по значению сегмента в адресе возврата (обязательно поймите, как это сделать).
  • Если вызов внешней процедуры производится из головного модуля, то наша служебная процедура LoadGo производит дальний абсолютный переход на начало требуемой внешней процедуры, расположенной на рабочем поле, по команде вида jmp Work:Offset . Ясно, что в этом случае возврат из внешней процедуры будет производиться в головной модуль нашей программы (адрес возврата, как обычно, на вершине стека).
  • Если вызов производится из процедуры, расположенной на рабочем поле, то процедура LoadGo производит следующие действия, при выполнении которых используется ещё один служебный сегмент динамического загрузчика, описанный, например, так:

My_Stack segment

Free dw 0

dw 15000 dup (?)

My_Stack ends

Этот сегмент используется как вспомогательный программый (не аппаратный) стек динамического загрузчика. Наш стек My_Stack в отличие от машинного стека, будет "расти" сверху-вниз, при этом переменная Free выполняет роль указателя вершины программного стека – регистра SP. Сначала LoadGo извлекает из аппаратного стека (на него, как обычно, указывает регистровая пара ) адрес возврата (два слова) и записывает этот адрес в программный стек My_Stack. Затем туда же записывается значение TBA_proc, таким образом запоминается, из какой процедуры произошёл вызов. И, наконец, LoadGo производит вызов необходимой внешней процедуры, расположенной на рабочем поле, командой вида  call Work:Offset . Очевидно, что возврат из внешней процедуры в этом случае будет производиться в нашу служебную процедуру LoadGo.
  1. После возврата из внешней процедуры в LoadGo, она производит следующие действия (напомним, что уже известно о том, что вызов внешней прохедуры был осуществлён из некоторой процедуры, расположенной на рабочем поле).
  • Сначала из вспомогательного стека My_Stack извлекается значение TBA_proc той процедуры, в которую необходимо вернуться (это значение на вершине нашего программного стека по адресу My_Stack[Free]).
  • Затем анализируется значение поля Offset в строке TBA_proc. Если величина Offset=-1 , то это означает, что наша процедура была удалена с рабочего поля. В этом случае производится повторная загрузка процедуры на рабочее поле (вообще говоря, начиная с другого свободного места этого поля). Адрес нового положения процедуры на рабочем поле записывается в поле Offset в строке TBA_proc.
  • Из вспомогательного стека My_Stack извлекается адрес дальнего возврата, в котором слово, содержащее значение сегмента возврата, заменяется величиной Offset из строки TBA_proc. И, наконец, производится дальний безусловный переход по так скорректированному адресу возврата.

На этом LoadGo завершает обработку вызова внешней процедуры. Как видим, эта процедура играет роль своеобразного буфера, располагаясь между вызывающей программой и вызываемой внешней процедурой. Как следует из описания алгоритма работы LoadGo, она может контролировать наличие требуемой процедуры на рабочем поле и, при необходимости, загружать вызываемую процедуру на свободной место рабочего поля. Обратите внимание, что контроль наличия процедуры на рабочем поле производится как при вызове этой процедуры, так и при возврате в неё.

Упражнение. Объясните, каким образом служебная процедура LoadGo, получив управление по команде jmp LoadGo , вычислит величину TBA_proc, то есть определит, что надо загружать именно процедуру с именем Beta, а не какую-нибудь другую внешнюю процедуру.

Продолжим анализ работы динамического загрузчика на нашем примере. Пусть загруженная процедура Beta имеет длину, например, 30000 байт и, в свою очередь, содержит вызов некоторой внешней процедуры с именем Delta:

Beta proc far

. . .

extrn Delta:far

call Delta

. . .

ret

Beta endp

Теперь, после динамической загрузки процедуры Beta на рабочее поле и связывание внешних адресов с помощью ТВА, вызов процедуры Beta будет производиться с помощью служебной процедуры LoadGo. Правда, необходимо заметить, что вызов стал длиннее, чем при статическом связывании, за счёт дополнительных команд, выполняемых процедурой LoadGo. Кроме того, как мы вскоре выясним, внешние процедуры могут неоднократно загружаться на рабочее поле и удаляться с него, что, конечно, может вызвать существенное замедление выполнения программы пользователя. Это, однако, неизбежная плата за преимущества динамической загрузки модулей. По существу, здесь опять работает уже упоминавшееся нами правило рычага: выигрывая в объёме памяти, необходимом для счёта модульной программы, мы неизбежно сколько-то проигрываем в скорости работы нашей программы. Важно чтобы выигрыш, с точки зрения конкретного пользователя, был больше проигрыша.

На рис. 10.5 показан вид ТВИ, ТВА и рабочего поля после загрузки процедуры Beta.

ТВИ segment




0

Free=19










2

'A'

\0

'B'

'e'




6

't'

'a'

\0

'C'




10

'1'

'2'

\0

'D'




14

'e'

'l'

't'

'a'




18

\0



















ТВА segment




Free=42













2

jmp LoadGo

0FFFFh

2 ('A')

flags

12

jmp LoadGo

00000h

4 ('Beta')

flags

22

jmp LoadGo

0FFFFh

9 ('C12')

flags

32

jmp LoadGo

0FFFFh

13 ('Delta')

flags

42
















Work segment

00000


Процедура Beta




30000














Рис. 10.5. Вид ТВИ, ТВА и рабочего поля после загрузки процедуры Beta.

Продолжим изучение выполнения нашей модульной программы. Предположим далее, что, проработав некоторое время, процедура Beta вызовет внешнюю процедуру с именем Delta, которая имеет длину 15000 байт. Так как команда call Delta в процедуре Beta при загрузке этой процедуры на рабочее поле заменена динамическим загрузчиком на команду call ТВА:32 , то управление опять получает служебная процедура LoadGo. Она находит процедуру Delta 1 и размещает её на свободном месте рабочего поля (в нашем примере с адреса 30000), затем настраивает внешние адреса в этой процедуре (если они есть) и соответствующие строки в ТВА.

На рис. 10.6 показан вид ТВА и рабочего поля после загрузки и связывания процедуры Delta.

Продолжим наше исследование работы динамического загрузчика. Предположим теперь, что произошёл возврат из процедур Delta и Beta в основную программы, которая после этого вызвала процедуру A длиной в 25000 байт. Процедуры A нет на рабочем поле, поэтому её надо загрузить, однако вызванная процедура LoadGo определяет, что на рабочем поле нет достаточного места для размещения процедуры A. Выход здесь только один – удалить с рабочего поля одну или несколько процедур, чтобы освободить достаточно место для загрузки процедуры A. В нашем случае достаточно, например, удалить с рабочего поля процедуру Beta.

ТВА segment







Free=42
















2

jmp LoadGo

0FFFFh

2 ('A')

flags




12

jmp LoadGo

00000

4 ('Beta')

flags




22

jmp LoadGo

0FFFFh

9 ('C12')

flags




32

jmp LoadGo

30000

13 ('Delta')

flags




42






















Work segment




00000


Процедура Beta




30000

Процедура Delta




45000










Рис. 10.6. Вид ТВА и рабочего поля после загрузки процедуры Delta.

Итак, служебная процедура LoadGo удаляет с рабочего поля процедуру Beta, загружает на освободившееся место процедуру A и корректирует соответствующим образом строки ТВА. На рис. 10.7 показан вид ТВА и рабочего поля после загрузки процедуры A.

ТВА segment







Free
















2

jmp LoadGo

00000

2 ('A')

flags




12

jmp LoadGo

0FFFFh

4 ('Beta')

flags




22

jmp LoadGo

0FFFFh

9 ('C12')

flags




32

jmp LoadGo

30000

13 ('Delta')

flags




42






















Work segment




00000


Процедура A




25000







30000

Процедура Delta




45000










Рис. 10.7. Вид ТВА и рабочего поля после загрузки процедуры A.

Как следует из описания работы динамического загрузчика, на рабочем поле всегда находятся последние из выполняемых процедур, а программа пользователя не должна ни о чём заботиться и работает, как и при статической загрузке модулей, просто обычным образом вызывая необходимые ей внешние процедуры. Часто говорят, что действия динамического загрузчика прозрачны (т.е. невидимы) для программы пользователя.

Иногда, однако, программа пользователя нуждается в некотором управлении динамической загрузкой модулей на рабочее поле. Например, пусть программист знает, что некоторая процедура X будет вызываться часто (в цикле). В этом случае программист может потребовать у динамического загрузчика, чтобы эта процедура X по возможности не удалялась с рабочего поля. Другими словами, динамический загрузчик при нехватке памяти на рабочем поле должен сначала стараться удалить с него другие процедуры, а лишь в последнюю очередь процедуру X. Говорят, что процедура X фиксируется на рабочем поле.

Для фиксации процедуры на рабочем поле в состав динамического загрузчика входит служебная процедура с именем Lock. Программа пользователя должна вызвать эту процедуру с параметром – именем фиксируемой процедуры. На Ассемблере необходимо определить способ передачи этого строкового параметра в служебную процедуру, а на языке Паскаль это можно записать, например, так

Lock('X');

Процедура Lock находит в ТВА строку, соответствующую указанной процедуре, и ставит в этой строке признак о том, что она зафиксирована на рабочем поле. Когда необходимость в фиксации процедуры X на рабочем поле отпадёт, программист может расфиксировать эту процедуру, вызвав служебную процедуру динамического загрузчика с именем UnLock. На Паскале это, например, можно сделать так:

UnLock('X');

Разумеется, в строке ТВА в поле флагов теперь надо предусмотреть битовый признак Lock/UnLock. Обратите также внимание, что служебные процедуры LoadGo,Lock и UnLock статически связаны с программой пользователя, т.е. расположены в её сегменте кода. Об этом должен позаботиться динамический загрузчик при размещении в оперативной памяти головного модуля программы.

Рассмотрим теперь главные недостатки схемы счёта с динамической загрузкой и связыванием модулей. Во-первых, следует отметить дополнительные вычислительные затраты на выполнение служебных процедур (LoadGo,Lock,UnLock и других) во время счёта программы пользователя. Во-вторых, может достаточно существенно замедлиться выполнения всей программы, так как теперь во время счёта может понадобиться периодически загружать модули на рабочее поле, т.е. использовать относительно медленную внешнюю память. В том случае, если такие затраты допустимы, то схеме счёта с динамической загрузкой следует отдать предпочтение.1

В современных ЭВМ наборы динамически загружаемых модулей одной тематики обычно объединяют в один файл – библиотеку динамически загружаемых модулей (по-английски Dynamic Link Library – DLL).

На этом мы завершим наше краткое знакомство со схемами выполнения модульных программ.