М. В. Ломоносова Факультет вычислительной математики и кибернетики В. Г. Баула Введение в архитектуру ЭВМ и системы программирования Москва 2003 Предисловие Данная книга

Вид материалаКнига

Содержание


6.7. Структура команд
Формат регистр–память (и память-регистр).
Подобный материал:
1   ...   10   11   12   13   14   15   16   17   ...   37

6.7. Структура команд


Теперь рассмотрим структуру машинных команд самых распространённых форматов регистр-регистр и регистр-память.
  • Формат регистр–регистр.

6 бит

1 бит

1 бит

1 бит

1 бит

3 бита

3 бита

КОП

d

w

1

1

R1

R2

Команды этого формата занимают 2 байта. Первая часть команды – код операции – занимает в команде 6 бит, за ним следуют однобитные поля d и w, где d – бит направления, а w – бит размера аргумента, последующие два бита для этого формата равны 1, а последние две части по 3 бита каждая указывают на регистры – операнды.

Стоит подробнее рассмотреть назначение битов d и w. Бит d задаёт направление выполнения команды, а именно:

:= при d = 0

:= при d = 1.

Бит w задаёт размер регистров-операндов, имена которых можно определить по следующей схеме:

R1,2

w = 1

w = 0

000

AX

AL

001

CX

CL

010

DX

DL

011

BX

BL

100

SP

AH

101

BP

CH

110

SI

DH

111

DI

BH

В младших моделях ЭВМ нашего семейства в таком формате возможна работа лишь с упомянутыми в таблице регистрами. В последующих же моделях возможности этого формата были расширены, но за счёт увеличения длины команды. Мы будем пользоваться и другими видами формата регистр-регистр, например, командой mov ds,ax, но выписывать их внутреннее представление не будем.

Как видно из таблицы, архитектурой не предусмотрены операции формата r8–r16, т.е. операции над регистрами разной длины запрещены, например, команды типа add AL,BX являются некорректными. Поэтому появляется необходимость преобразования типов из короткого целого в длинное, и из длинного в сверхдлинное. Такое преобразование зависит от трактовки числа – знаковое или беззнаковое. В первом случае число всегда расширяется слева нулями, а во втором – размножается знаковый бит (для знаковых чисел незначащими двоичными цифрами будут 0 для неотрицательных и 1 для отрицательных значений). Для этого в языке машины предусмотрены безадресные команды, имеющие а Ассемблере такую мнемонику:

cbw (convert byte to word)

и

cwd (convert word to double),

которые производят знаковое расширение соответственно регистра AL до AX и AX до пары регистров , которые в этом случае рассматриваются как один длинный 32 битный регистр.

Преобразование целого значения из более длинного формата в более короткий (усечение) производится путём отбрасывания соответствующего числа левых битов целого числа. Усечённое число получится правильным, если будут отброшены только незначащие биты. Для беззнаковых чисел это всегда нулевые биты, а для знаковых – биты, совпадающие со знаковым битом усечённого числа.
  • Формат регистр–память (и память-регистр).

КОП

R1

A2

Операнд A2 может иметь один из приведённых ниже трёх видов:
  1. A2 = A,
  2. A2 = A[M1],
  3. A2 = A[M1][M2].

Здесь A – задаваемое в команде смещение длиной 1 или 2 байта (заметим, что нулевой смещение может и не занимать места в команде), M1 и M2 – так называемые регистры-модификаторы. Как мы сейчас увидим, значение адреса второго операнда A2 будет вычисляться по определённым правилам, поэтому этот адрес часто называют исполнительным адресом.

Стоит отметить один факт. До сих пор адресом мы называли физический номер ячейки в памяти машины. В языке Ассемблера адресом принято называть смещение ячейки относительно начала того сегмента, в котором она находится. Для обозначения полного адреса будем употреблять термин физический адрес.

Рассмотрим подробнее каждый их трёх возможных видов операнда A2. При A2 = A физический адрес вычисляется центральным процессором по формуле:

Aфиз := (B*16 + A)mod 220,

где B, как обычно, обозначает значение одного из сегментных регистров. Запись A2 = A[M1] означает использование регистра-модификатора, которым может быть любой из следующих регистров: BP, BX, SI, DI. В этом случае физический адрес вычисляется по формуле

Aфиз := (B*16 + (A + )mod 216)mod 220,

где вместо подставляется содержимое регистра-модификатора (одного из четырёх указанных). Запись A2 = A[M1][M2] 1 обозначает вычисление физического адреса по формуле:

Aфиз := (B*16 + (A + + )mod 216)mod 220,

где используются сразу два регистра-модификатора. На месте M1 можно указывать любой из регистров BX или BP, а на месте M2 – любой из регистров SI или DI. Использование, например, регистров BX и BP (как и SI и DI) одновременно в качестве модификаторов запрещено. В старших моделях почти все ограничения на использование регистров модификаторов также было снято (за счёт увеличения длины команды).

В качестве примера вычислим физический адрес второго операнда команды сложения формата RX, на языке Ассемблера эту команду можно записать в виде add ax,6[bx][di]. Пусть регистры имеют следующие значения (в шестнадцатеричном виде перед числом записывается ноль, если оно начинается с цифр A–F):

bx = 0FA00h, di = 0880h, ds = 2000h

Тогда

Aфиз := (2000h*16 + (6 + 0FA00h + 0880h)mod 216)mod 220 =

(20000h + 0286)mod 220 = 20286h

Если, например, в байте с адресом 20286h хранится число 56h, а в байте с адресом 20287h – число 32h, то наша команда реализует операцию сложения ax:=ax+3256h.

Рассмотрим теперь внутреннее представление формата команды регистр–память. Длина этой команды 2, 3 или 4 байт:

8 бит

2 бита

3 бита

3 бита

8 бит

8 бит

КОП

d

W

Mod

R1

Mem

a8

a8->a16

где mod – двух битовое поле модификатора, mem – трёх битовое поле способа адресации, a8 и a16 – это обозначения для одно- или двухбайтного смещение. Биты d и w знакомы нам из предыдущего формата регистр-регистр. Все возможные комбинации mod и mem приведены в таблице 6.1.

Таблица 6.1. Значения полей mod и mem в формате регистр-память.







Mem \ mod

00

01

10

11










0 доп. Байт.

1 доп. байт

2 доп. байта

Формат RR







000

[BX+SI]

[BX+SI]+a8

[BX+SI]+a16







001

[BX+DI]

[BX+DI]+a8

[BX+DI]+a16







010

[BP+SI]

[BP+SI]+a8

[BP+SI]+a16







011

[BP+DI]

[BP+DI]+a8

[BP+DI]+a16







100

[SI]

[SI]+a8

[SI]+a16







101

[DI]

[DI]+a8

[DI]+a16







110

a16

[BP]+a8

[BP]+a16







111

[BX]

[BX]+a8

[BX]+a16




Данная таблица показывает, как зависит способ адресации от полей mem и mod. Как видим, она полностью объясняет ограничения на выбор регистров-модификаторов, которые мы сформулировали ранее. Мы не будем рассматривать машинный вид остальных форматов команд, будем изучать их только на языке Ассемблера. Напомним, что это такие форматы команд:
  • RR – (регистр – регистр);
  • RX – (регистр – память, память – регистр);
  • RI – (регистр – непосредственный операнд в команде);
  • SI – (память – непосредственный операнд в команде);
  • SS – (память – память, т.е. оба операнда в основной памяти).