АБЗАЦ: Ассемблер и программирование для IBM PC / Абель Питер / Учеба / 2 страница

Жанр: Учеба

Ассемблер и программирование для IBM PC

страница №2

... вычитаемого
и складываются два числа. Вычтем, например, 42 из 65. Двоичное
представление для 42 есть 00101010, и его двоичное дополнение: - 11010110:

65 01000001
+(-42) 11010110
----- --------
23 (1) 00010111

Результат 23 является корректным. В рассмотренном примере произошел
перенос в знаковый разряд и из разрядной сетки.
Если справедливость двоичного дополнения не сразу понятна, рассмотрим
следующие задачи: Какое значение необходимо прибавить к двоичному числу
00000001, чтобы получить число 00000000? В терминах десятичного исчисления
ответом будет -1. Для двоичного рассмотрим 11111111:

00000001

11111111

--------
Результат: (1) 00000000

Игнорируя перенос (1), можно видеть, что двоичное число 11111111
эквивалентно десятичному -1 и соответственно:

0 00000000
-(+1) -00000001
---- --------
-1 11111111

Можно видеть также каким образом двоичными числами представлены
уменьшающиеся числа:

+3 00000011
+2 00000010
+1 00000001
0 00000000
-1 11111111
-2 11111110
-3 11111101

Фактически нулевые биты в отрицательном двоичном числе определяют его
величину: рассмотрите позиционные значения нулевых битов как если это были
единичные биты, сложите эти значения и прибавьте единицу.
Данный материал по двоичной арифметике и отрицательным числам будет
особенно полезен при изучении гл.12 и 13.

ШЕСТНАДЦАТИРИЧНОЕ ПРЕДСТАВЛЕНИЕ
________________________________________________________________

Представим, что необходимо просмотреть содержимое некоторых байт в
памяти (это встретится в следующей главе). Требуется определить содержимое
четырех последовательных байт (двух слов), которые имеют двоичные
значения. Так как четыре байта включают в себя 32 бита, то специалисты
разработали "стенографический" метод представления двоичных данных. По
этому методу каждый байт делится пополам и каждые полбайта выражаются
соответствующим значением. Рассмотрим следующие четыре байта:

Двоичное: 0101 1001 0011 0101 1011 1001 1100 1110
Десятичное: 5 9 3 5 11 9 12 14

Так как здесь для некоторых чисел требуется две цифры, расширим
систему счисления так, чтобы 10=A, 11=B, 12=C, 13=D, 14=E, 15=F. таким
образом получим более сокращенную форму, которая представляет содержимое
вышеуказанных байт:

59 35 B9 CE

Такая система счисления включает "цифры" от 0 до F, и так как таких
цифр 16, она называется шестнадцатиричным представлением. В табл.1.1.
приведены двоичные, десятичные и шестнадцатиричные значения чисел от 0 до
15.

__________________________________________________________________________

Двоич. Дес. Шест. Двоич. Дес. Шест.

0000 0 0 1000 8 8
0001 1 1 1001 9 9
0010 2 2 1010 10 A
0011 3 3 1011 11 B
0100 4 4 1100 12 C
0101 5 5 1101 13 D
0110 6 6 1110 14 E
0111 7 7 1111 15 F
__________________________________________________________________________

Табл.1.1. Двоичное, десятичное и шестнадцатиричное представления.

Шестнадцатиричный формат нашел большое применение в языке ассемблера.
В листингах ассемблирования программ в шестнадцатеричном формате показаны
все адреса, машинные коды команд и содержимое констант. Также для отладки
при использовании программы DOS DEBUG адреса и содержимое байтов выдается
в шестнадцатиричном формате.
Если немного поработать с шестнадцатиричным форматом, то можно быстро
привыкнуть к нему. рассмотрим несколько простых примеров шестнадцатиричной
арифметики. Следует помнить, что после шестнадцатиричного числа F следует
шестнадцатиричное 10, что равно десятичному числу 16.

6 5 F F 10 FF
4 8 1 F 10 1
- - — -- — ---
A D 10 1E 20 100

Заметьте также, что шест.20 эквивалентно десятичному 32, шест.100 -
десятичному 256 и шест.100 - десятичному 4096.
В данной книге шестнадцатиричные числа записываются, например, как
шест.4B, двоичные числа как дв.01001011, и десятичные числа, как 75
(отсутствие какого-либо описания предполагает десятичное число).
Исключения возможны, когда база числа очевидна из контекста. Для индикации
шест. числа в ассемблерной программе непосредственно после числа ставится
символ "H", например, 25H (десятичное значение 37). Шест. число всегда
начинается с десятичной цифры 0-9, таким образом, B8H записывается как
0B8H.
В прил.2 показано как преобразовывать шестнадцатиричные значения в
десятичные и обратно. Теперь рассмотрим некоторые характеристики
процессора PC, которые необxодимо понять для перехода к гл.2.

СЕГМЕНТЫ
________________________________________________________________

Сегментом называется область, которая начинается на границе
параграфа, т.е. по любому адресу, который делится на 16 без остатка. Хотя
сегмент может располагаться в любом месте памяти и иметь размер до 64
Кбайт, он требует столько памяти, сколько необходимо для выполнения
программы. Имеется три главных сегмента:

1. С е г м е н т к о д о в. Сегмент кодов содержит машинные
команды, которые будут выполняться. Обычно первая выполняемая команда
находится в начале этого сегмента и операционная система передает
управление по адресу данного сегмента для выполнения программы.
Регистр сегмента кодов (CS) адресует данный сегмент.
2. С е г м е н т д а н н ы х. Сегмент данных содержит
определенные данные, константы и рабочие области, необходимые
программе. Регистр сегмента данных (DS) адресует данный сегмент.
3. С е г м е н т с т е к а. Стек содержит адреса возврата как
для программы для возврата в операционную систему, так и для вызовов
подпрограмм для возврата в главную программу. Регистр сегмента стека
(SS) адресует данный сегмент.

Еще один сегментный регистр, регистр дополнительного сегмента (ES),
предназначен для специального использования. На рис.1.2 графически
представлены регистры SS, DS и CS. Последовательность регистров и
сегментов на практике может быть иной. Три сегментных регистра содержат
начальные адреса соответствующих сегментов и каждый сегмент начинается на
границе параграфа.

__________________________________________________________________________

г================¬
¦ D O S ¦
--------¬ ¦- - - - - - - - ¦ ¬
SS ¦ Адрес +-"¦ Сегмент стека ¦ ¦
+ - - - + ¦- - - - - - - - ¦ ¦ Перемещаемые
DS ¦ Адрес +-"¦ Сегмент данных ¦ ¦
+ - - - + ¦- - - - - - - - ¦ ¦ в памяти
CS ¦ Адрес +-"¦ Сегмент кода ¦ ¦
L-------- ¦- - - - - - - - ¦ -
Сегментные ¦ ¦
регистры ¦ ¦
L================-
Память
__________________________________________________________________________

Рис.1.2. Сегменты и регистры.

Внутри программы все адреса памяти относительны к началу сегмента.
Такие адреса называются смещением от начала сегмента. Двухбайтовое
смещение (16-бит) может быть в пределах от шест.0000 до шест.FFFF или от 0
до 65535. Для обращения к любому адресу в программе, компьютер складывает
адрес в регистре сегмента и смещение. Например, первый байт в сегменте
кодов имеет смещение 0, второй байт - 01 и так далее до смещения 65535.
В качестве примера адресации, допустим, что регистр сегмента данных
содержит шест.045F и некоторая команда обращается к ячейке памяти внутри
сегмента данных со смещением 0032. Несмотря на то, что регистр сегмента
данных содержит 045F, он указывает на адрес 045F0, т.е. на границе
параграфа. Действительный адрес памяти поэтому будет следующий:

Адрес в DS: 045F0
Смещение: 0032
-----
Реальный адрес: 04622

Каким образом процессоры 8086/8088 адресуют память в один миллион
байт? В регистре содержится 16 бит. Так как адрес сегмента всегда на
границе параграфа, младшие четыре бита адреса равны нулю. Шест.FFF0
позволяет адресовать до 65520 (плюс смещение) байт. Но специалисты решили,
что нет смысла иметь место для битов, которые всегда равны нулю. Поэтому
адрес хранится в сегментном регистре как шест. nnnn, а компьютер полагает,
что имеются еще четыре нулевых младших бита (одна шест. цифра), т.е. шест.
nnnn0. Таким образом, шест.FFFF0 позволяет адресовать до 1048560 байт.
Если вы сомневаетесь, то декодируйте каждое шест.F как двоичное 1111,
учтите нулевые биты и сложите значения для единичных бит.
Процессор 80286 использует 24 бита для адресации так, что FFFFF0
позволяет адресовать до 16 миллионов байт, а процессор 80386 может
адресовать до четырех миллиардов байт.

РЕГИСТРЫ
________________________________________________________________

Процессоры 8086/8088 имеют 14 регистров, используемых для управления
выполняющейся программой, для адресации памяти и для обеспечения
арифметических вычислений. Каждый регистр имеет длину в одно слово (16
бит) и адресуется по имени. Биты регистра принято нумеровать слева
направо:
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

Процессоры 80286 и 80386 имеют ряд дополнительных регистров,
некоторые из них 16-битовые. Эти регистры здесь не рассматриваются.

Сегментные регистры CS, DS, SS и ES
-------------------------------------
Каждый сегментный регистр обеспечивает адресацию 64К памяти, которая
называется текущим сегментом. Как показано ранее, сегмент выравнен на
границу параграфа и его адрес в сегментном регистре предполагает наличие
справа четырех нулевых битов.

1. Р е г и с т р CS. Регистр сегмента кода содержит начальный
адрес сегмента кода. Этот адрес плюс величина смещения в командном
указателе (IP) определяет адрес команды, которая должна быть выбрана
для выполнения. Для обычных программ нет необходимости делать ссылки
на регистр CS.
2. Р е г и с т р DS. Регистр сегмента данных содержит начальный
адрес сегмента данных. Этот адрес плюс величина смещения,
определенная в команде, указывают на конкретную ячейку в сегменте
данных.
3. Р е г и с т р SS. Регистр сегмента стека содержит начальный
адрес в сегменте стека.
4. Р е г и с т р ES. Некоторые операции над строками используют
дополнительный сегментный регистр для управления адресацией памяти. В
данном контексте регистр ES связан с индексным регистром DI. Если
необходимо использовать регистр ES, ассемблерная программа должна его
инициализировать.

Регистры общего назначения: AX, BX, CX и DX
---------------------------------------------
При программировании на ассемблере регистры общего назначения
являются "рабочими лошадками". Особенность этих регистров состоит в том,
что возможна адресация их как одного целого слова или как однобайтовой
части. Левый байт является старшей частью (high), a правый - младшей
частью (low). Например, двухбайтовый регистр CX состоит из двух
однобайтовых: CH и CL, и ссылки на регистр возможны по любому из этих трех
имен. Следующие три ассемблерные команды засылают нули в регистры CX, CH и
CL, соответственно:

MOV CX,00
MOV CH,00
MOV CL,00

1. Р е г и с т р AX. Регистр AX является основным сумматором и
применяется для всех операций ввода-вывода, некоторых операций над
строками и некоторых арифметических операций. Например, команды
умножения, деления и сдвига предполагают использование регистра AX.
Некоторые команды генерируют более эффективный код, если они имеют
ссылки на регистр AX.

AX: | AH | AL |

2. Р е г и с т р BX. Регистр BX является базовым регистром. Это
единственный регистр общего назначения, который может использоваться
в качестве "индекса" для расширенной адресации. Другое общее
применение его - вычисления.

BX: | BH | BL |

3. Р е г и с т р CX. Регистр CX является счетчиком. Он необходим
для управления числом повторений циклов и для операций сдвига влево
или вправо. Регистр CX используется также для вычислений.

CX: | CH | CL |

4. Р е г и с т р DX. Регистр DX является регистром данных. Он
применяется для некоторых операций ввода/вывода и тех операций
умножения и деления над большими числами, которые используют
регистровую пару DX и AX.

DX: | DH | DL |

Любые регистры общего назначения могут использоваться для сложения и
вычитания как 8-ми, так и 16-ти битовых значений.

Регистровые указатели: SP и BP
--------------------------------
Регистровые указатели SP и BP обеспечивают системе доступ к данным в
сегменте стека. Реже они используются для операций сложения и вычитания.

1. Р е г и с т р SP. Указатель стека обеспечивает использование
стека в памяти, позволяет временно хранить адреса и иногда данные.
Этот регистр связан с регистром SS для адресации стека.
2. Р е г и с т р BP. Указатель базы облегчает доступ к
параметрам: данным и адресам переданным через стек.

Индексные регистры: SI и DI
-----------------------------
Оба индексных регистра возможны для расширенной адресации и для
использования в операциях сложения и вычитания.

1. Р е г и с т р SI. Этот регистр является индексом источника и
применяется для некоторых операций над строками. В данном контексте
регистр SI связан с регистром DS.
2. Р е г и с т р DI. Этот регистр является индексом назначения и
применяется также для строковых операций. В данном контексте регистр
DI связан с регистром ES.

Регистр командного указателя: IP
----------------------------------
Регистр IP содержит смещение на команду, которая должна быть
выполнена. Обычно этот регистр в программе не используется, но он может
изменять свое значение при использовании отладчика DOS DEBUG для
тестирования программы.

Флаговый регистр
------------------
Девять из 16 битов флагового регистра являются активными и определяют
текущее состояние машины и результатов выполнения. Многие арифметические
команды и команды сравнения изменяют состояние флагов. Назначение флаговых
битов:

Флаг Назначение

O (Переполнение) Указывает на переполнение старшего бита при
арифметических командах.
D (Направление) Обозначает левое или правое направление пересылки
или сравнения строковых данных (данных в памяти
превышающих длину одного слова).
I (Прерывание) Указывает на возможность внешних прерываний.
T (Пошаговый режим) Обеспечивает возможность работы процессора в
пошаговом режиме. Например, программа DOS DEBUG
устанавливает данный флаг так, что возможно
пошаговое выполнение каждой команды для проверки
изменения содержимого регистров и памяти.
S (Знак) Содержит результирующий знак после арифметических
операций (0 - плюс, 1 - минус).
Z (Ноль) Показывает результат арифметических операций и
операций сравнения (0 - ненулевой, 1 - нулевой
результат).
A (Внешний перенос) Содержит перенос из 3-го бита для 8-битных данных
используется для специальных арифметических
операций.
P (Контроль четности) Показывает четность младших 8-битовых данных (1 -
четное и 0 - нечетное число).
C (Перенос) Содержит перенос из старшего бита, после
арифметических операций, а также последний бит
при сдвигах или циклических сдвигах.

При программировании на ассемблере наиболее часто используются флаги
O, S, Z, и C для арифметических операций и операций сравнения, а флаг D
для обозначения направления в операциях над строками. В последующих главах
содержится более подробная информация о флаговом регистре.

АРХИТЕКТУРА PC
________________________________________________________________

Основными элементами аппаратных средств компьютера являются:
системный блок, клавиатура, устройство отображения, дисководы, печатающее
устройство (принтер) и различные средства для асинхронной коммуникации и
управления игровыми программами. Системный блок состоит из системной
платы, блока питания и ячейки расширения для дополнительных плат. На
системной плате размещены:

- микропроцессор (Intel);
- постоянная память (ROM 40Кбайт);
- оперативная память (RAM до 512К в зависимости от модели);
- расширенная версия бейсик-интерпретатора.

Ячейки расширения обеспечивают подключение устройств отображения,
дисководов для гибких дисков (дискет), каналов телекоммуникаций,
дополнительной памяти и игровых устройств.
Клавиатура содержит собственный микропроцессор, который обеспечивает
тестирование при включении памяти, сканирование клавиатуры, подавление
"дребезга" клавишей и буферизацию до 20 символов.
"Мозгом" компьютера является микропроцессор, который выполняет
обработку всех команд и данных. Процессор 8088 использует 16-битовые
регистры, которые могут обрабатывать два байта одновременно. Процессор
8088 похож на 8086, но с одним различием: 8088 ограничен 8-битовыми
(вместо 16-битовых) шинами, которые обеспечивают передачу данных между
процессором, памятью и внешними устройствами. Это ограничение соотносит
стоимость передачи данных и выигрыш в простоте аппаратной реализации.
Процессоры 80286 и 80386 являются расширенными версиями процессора 8086.
Как показано на рис.1.3 процессор разделен на две части: операционное
устройство (ОУ) и шинный интерфейс (ШИ). Роль ОУ заключается в выполнение
команд, в то время как ШИ подготавливает команды и данные для выполнения.
Операционное устройство содержит арифметико-логическое устройство (АЛУ),
устройство управления (УУ) и десять регистров. Эти устройства обеспечивают
выполнение команд, арифметические вычисления и логические операции
(сравнение на больше, меньше или равно).

__________________________________________________________________________

ОУ: Операционное | ШИ: Шинный интерфейс
устройство |
---------T--------¬ |
¦ AH ¦ AL ¦ |
+--------+--------+ |
¦ BH ¦ BL ¦ |
+--------+--------+ |
¦ CH ¦ CL ¦ |
+--------+--------+ | Управление
¦ DH ¦ DL ¦ | программами
+--------+--------+ | -----------------¬
¦ SP ¦ | ¦ CS ¦
+-----------------+ | +----------------+
¦ BP ¦ | ¦ DS ¦
+-----------------+ | +----------------+
¦ SI ¦ | ¦ SS ¦
+-----------------+ | +----------------+
¦ DI ¦ | ¦ ES ¦
L----------------- | L-------T---------
¦ | ¦ --------¬
| ¦ Управ-¦ Шина
=====================+=============="¦ ление ¦"==" 8088
| ¦ шиной ¦
¦ | ¦ L--------
-----------------¬ | ----+---¬
¦ АЛУ: Арифметико-¦ | ----+ 1 ¦
¦ логическое ¦ | ¦ +-------+
¦ устройство ¦ | ¦ ¦ 2 ¦ Очередь команд
-"+ - - - - - - - - + | ¦ +-------+
¦ ¦ УУ: Устройство ¦ | ¦ ¦ 3 ¦ (четыре байта)
¦ ¦ управления ¦ | ¦ +-------+
¦ + - - - - - - - - + | ¦ ¦ 4 ¦
¦ ¦ Флаговый регистр¦ | ¦ L--------
¦ L------------------ | ¦
¦ ------------------¬ | ¦
L-+ Командный ¦"-+---
¦ указатель ¦ |
L------------------ |
__________________________________________________________________________

Рис.1.3. Операционное устройство и шинный интерфейс.

Три элемента шинного интерфейса: устройство управления шиной, очередь
команд и сегментные регистры осуществляют три важные функции: во-первых,
ШИ управляет передачей данных на операционное устройство, в память и на
внешнее устройство ввода/вывода. Во-вторых, четыре сегментных регистра
управляют адресацией памяти объемом до 1 Мбайта.
Третья функция ШИ это выборка команд. Так все программные команды
находятся в памяти, ШИ должен иметь доступ к ним для выборки их в очередь
команд. Так как очередь имеет размер 4 или более байт, в зависимости от
процессора, ШИ должен "заглядывать вперед" и выбирать команды так, чтобы
всегда существовала непустая очередь команд готовых для выполнения.
Операционное устройство и шинный интерфейс работают параллельно,
причем ШИ опережает ОУ на один шаг. Операционное устройство сообщает
шинному интерфейсу о необходимости доступа к данным в памяти или на
устройство ввода/вывода. Кроме того ОУ запрашивает машинные команды из
очереди команд. Пока ОУ занято выполнением первой в очереди команды, ШИ
выбирает следующую команду из памяти. Эта выборка происходит во время
выполнения, что повышает скорость обработки.

Память
--------
Обычно микрокомпьютер имеет два типа внутренней памяти. первый тип
это постоянная память (ПЗУ) или ROM (read-only memory). ROM представляет
собой специальную микросхему, из которой (как это следует из названия)
возможно только чтение. Поскольку данные в ROM специальным образом
"прожигаются" они не могут быть модифицированы.
Основным назначением ROM является поддержка процедур начальной
загрузки: при включении питания компьютера ROM выполняет различные
проверки и загружает в оперативную память (RAM) данные из системной
дискеты (например, DOS). Для целей программирования наиболее важным
элементом ROM является BIOS (Basic Input/Output System) базовая система
ввода/вывода, которая рассматривается в следующих главах. (Basic - здесь
обычное слово, а не язык программирования). ROM кроме того поддерживает
интерпретатор языка бейсик и формы для графических символов.
Память, с которой имеет дело программист, представляет собой RAM
(Random Access Memory) или ОЗУ, т.е. оперативная памяти, доступная как для
чтения, так и для записи. RAM можно рассматривать как рабочую область для
временного хранения программ и данных на время выполнения.
Так как содержимое RAM теряется при отключении питания компьютера,
необходима внешняя память для сохранения программ и данных. Если
установлена дискета с операционной системой или имеется жесткий диск типа
винчестер, то при включении питания ROM загружает программы DOS в RAM.
(Загружается только основная часть DOS, а не полный набор программ DOS).
Затем необходимо ответить на приглашение DOS для установки даты и можно
вводить запросы DOS для выполнения конкретных действий. Одним из таких
действий может быть загрузка программ с диска в RAM. Поскольку DOS не
занимает всю память, то в ней имеется (обычно) место для пользовательских
программ. Пользовательская программа выполняется в RAM и обычно
осуществляет вывод на экран, принтер или диск. По окончании можно
загрузить другую программу в RAM. Предыдущая программа хранится на диске и
новая программа при загрузке может наложиться (затереть) предыдущую
программу в RAM.

В ы д е л е н и е п а м я т и. Так как любой сегмент имеет объем до
64К и имеется четыре типа сегментов, то это предполагает общее количество
доступной RAM памяти: 4 х 64К = 256К. Но возможно любое количество
сегментов. Для того, чтобы адресовать другой сегмент, необходимо всего
лишь изменить адрес сегментного регистра.
RAM включает в себя первые три четверти памяти, а ROM - последнюю
четверть. В соответствии с картой физической памяти микрокомпьютера,
приведенной на рис.1.4, первые 256К RAM памяти находятся на системной
плате. Так как одна область в RAM зарезервирована для видеобуфера, то
имеется 640К доступных для использования программистом, по крайней мере в
текущих версиях DOS. ROM начинается по адресу 768К и обеспечивает
поддержку операций ввода/вывода на такие устройства как контролер жесткого
диска. ROM, начинающийся по адресу 960К управляет базовыми функциями
компьютера, такими как тест при включении питания, точечные образы
графических символов и автозагрузчик с дискет.

__________________________________________________________________________

...

Ассемблер и программирование для IBM PC

страница №2

00000001

11111111

Список страниц

Закладка в соц.сетях

Представление

Литература

Периодика

Чтиво

Изучение

Ассемблер и программирование для IBM PC

страница №2

00000001

11111111

Список страниц

Закладка в соц.сетях