М. В. Ломоносова Факультет вычислительной математики и кибернетики В. Г. Баула Введение в архитектуру ЭВМ и системы программирования Москва 2003 Предисловие Данная книга

Вид материала

Книга

Содержание

6.7. Структура команд
Формат регистр–память (и память-регистр).

Подобный материал:

1 ... 10 11 12 13 14 15 16 17 ... 37

6.7. Структура команд

Теперь рассмотрим структуру машинных команд самых распространённых форматов регистр-регистр и регистр-память.

Формат регистр–регистр.

6 бит	1 бит	1 бит	1 бит	1 бит	3 бита	3 бита
КОП	d	w	1	1	R1	R2

Команды этого формата занимают 2 байта. Первая часть команды – код операции – занимает в команде 6 бит, за ним следуют однобитные поля d и w, где d – бит направления, а w – бит размера аргумента, последующие два бита для этого формата равны 1, а последние две части по 3 бита каждая указывают на регистры – операнды.

Стоит подробнее рассмотреть назначение битов d и w. Бит d задаёт направление выполнения команды, а именно:

:=  при d = 0

:=  при d = 1.

Бит w задаёт размер регистров-операндов, имена которых можно определить по следующей схеме:

R_1,2	w = 1	w = 0
000	AX	AL
001	CX	CL
010	DX	DL
011	BX	BL
100	SP	AH
101	BP	CH
110	SI	DH
111	DI	BH

В младших моделях ЭВМ нашего семейства в таком формате возможна работа лишь с упомянутыми в таблице регистрами. В последующих же моделях возможности этого формата были расширены, но за счёт увеличения длины команды. Мы будем пользоваться и другими видами формата регистр-регистр, например, командой mov ds,ax, но выписывать их внутреннее представление не будем.

Как видно из таблицы, архитектурой не предусмотрены операции формата r8–r16, т.е. операции над регистрами разной длины запрещены, например, команды типа add AL,BX являются некорректными. Поэтому появляется необходимость преобразования типов из короткого целого в длинное, и из длинного в сверхдлинное. Такое преобразование зависит от трактовки числа – знаковое или беззнаковое. В первом случае число всегда расширяется слева нулями, а во втором – размножается знаковый бит (для знаковых чисел незначащими двоичными цифрами будут 0 для неотрицательных и 1 для отрицательных значений). Для этого в языке машины предусмотрены безадресные команды, имеющие а Ассемблере такую мнемонику:

cbw (convert byte to word)

и

cwd (convert word to double),

которые производят знаковое расширение соответственно регистра AL до AX и AX до пары регистров , которые в этом случае рассматриваются как один длинный 32 битный регистр.

Преобразование целого значения из более длинного формата в более короткий (усечение) производится путём отбрасывания соответствующего числа левых битов целого числа. Усечённое число получится правильным, если будут отброшены только незначащие биты. Для беззнаковых чисел это всегда нулевые биты, а для знаковых – биты, совпадающие со знаковым битом усечённого числа.

Формат регистр–память (и память-регистр).

КОП

Операнд A2 может иметь один из приведённых ниже трёх видов:

A2 = A,
A2 = A[M1],
A2 = A[M1][M2].

Здесь A – задаваемое в команде смещение длиной 1 или 2 байта (заметим, что нулевой смещение может и не занимать места в команде), M1 и M2 – так называемые регистры-модификаторы. Как мы сейчас увидим, значение адреса второго операнда A2 будет вычисляться по определённым правилам, поэтому этот адрес часто называют исполнительным адресом.

Стоит отметить один факт. До сих пор адресом мы называли физический номер ячейки в памяти машины. В языке Ассемблера адресом принято называть смещение ячейки относительно начала того сегмента, в котором она находится. Для обозначения полного адреса будем употреблять термин физический адрес.

Рассмотрим подробнее каждый их трёх возможных видов операнда A2. При A2 = A физический адрес вычисляется центральным процессором по формуле:

A_физ := (B*16 + A)_mod₂²⁰,

где B, как обычно, обозначает значение одного из сегментных регистров. Запись A2 = A[M1] означает использование регистра-модификатора, которым может быть любой из следующих регистров: BP, BX, SI, DI. В этом случае физический адрес вычисляется по формуле

A_физ := (B*16 + (A + )_mod₂¹⁶)_mod₂²⁰,

где вместо подставляется содержимое регистра-модификатора (одного из четырёх указанных). Запись A2 = A[M1][M2] ^¹ обозначает вычисление физического адреса по формуле:

A_физ := (B*16 + (A + + )_mod₂¹⁶)_mod₂²⁰,

где используются сразу два регистра-модификатора. На месте M1 можно указывать любой из регистров BX или BP, а на месте M2 – любой из регистров SI или DI. Использование, например, регистров BX и BP (как и SI и DI) одновременно в качестве модификаторов запрещено. В старших моделях почти все ограничения на использование регистров модификаторов также было снято (за счёт увеличения длины команды).

В качестве примера вычислим физический адрес второго операнда команды сложения формата RX, на языке Ассемблера эту команду можно записать в виде add ax,6[bx][di]. Пусть регистры имеют следующие значения (в шестнадцатеричном виде перед числом записывается ноль, если оно начинается с цифр A–F):

bx = 0FA00h, di = 0880h, ds = 2000h

Тогда

A_физ := (2000h*16 + (6 + 0FA00h + 0880h)_mod₂¹⁶)_mod₂²⁰ =

(20000h + 0286)_mod₂²⁰ = 20286h

Если, например, в байте с адресом 20286h хранится число 56h, а в байте с адресом 20287h – число 32h, то наша команда реализует операцию сложения ax:=ax+3256h.

Рассмотрим теперь внутреннее представление формата команды регистр–память. Длина этой команды 2, 3 или 4 байт:

8 бит			2 бита	3 бита	3 бита	8 бит	8 бит
КОП	d	W	Mod	R1	Mem	a8	a8->a16

где mod – двух битовое поле модификатора, mem – трёх битовое поле способа адресации, a8 и a16 – это обозначения для одно- или двухбайтного смещение. Биты d и w знакомы нам из предыдущего формата регистр-регистр. Все возможные комбинации mod и mem приведены в таблице 6.1.

Таблица 6.1. Значения полей mod и mem в формате регистр-память.

	Mem \ mod	00	01	10	11
		0 доп. Байт.	1 доп. байт	2 доп. байта	Формат RR
	000	[BX+SI]	[BX+SI]+a8	[BX+SI]+a16
	001	[BX+DI]	[BX+DI]+a8	[BX+DI]+a16
	010	[BP+SI]	[BP+SI]+a8	[BP+SI]+a16
	011	[BP+DI]	[BP+DI]+a8	[BP+DI]+a16
	100	[SI]	[SI]+a8	[SI]+a16
	101	[DI]	[DI]+a8	[DI]+a16
	110	a16	[BP]+a8	[BP]+a16
	111	[BX]	[BX]+a8	[BX]+a16

Данная таблица показывает, как зависит способ адресации от полей mem и mod. Как видим, она полностью объясняет ограничения на выбор регистров-модификаторов, которые мы сформулировали ранее. Мы не будем рассматривать машинный вид остальных форматов команд, будем изучать их только на языке Ассемблера. Напомним, что это такие форматы команд:

RR – (регистр – регистр);
RX – (регистр – память, память – регистр);
RI – (регистр – непосредственный операнд в команде);
SI – (память – непосредственный операнд в команде);
SS – (память – память, т.е. оба операнда в основной памяти).