0 前言

你是否因为汇编指令繁杂的规则而苦恼呢？作者本人也很烦，因为往往教材中只告诉我们规则，却不告诉我们为什么，没有原因就直接记忆，负担太大，后期灵活运用也增添阻力，因此，我经过自己的思考去为你解释为什么有些规则是内样的，本文并不是深入硬件原理，只在汇编语言层级，从逻辑上说明原因。

x86指令集的核心原则：操作数最多只能有一个是内存单元，另外的可以是立即数或者寄存器

1 寄存器的分类

我先从其他博客为你找来了8086CPU的全部寄存器及其功能
原文链接在此

通用寄存器：
ax——accumulate register——累加器
bx——based register——基地址寄存器
cx——count register——计数器
dx——data registered——数据寄存器

段寄存器：
cs——code segment——代码段
ds——data segment——数据段
ss——stack segment——栈段寄存器
es——extra segment——附加段寄存器

特殊功能寄存器：
ip——instructor point——指令指针寄存器
sp——stack point——堆栈指针寄存器
bp——base point——基础指针
si——source index——源变址寄存器
di——destination index——目的变址寄存器
psw——program state word——程序状态字

Psw的常用标志：
OF（11位-overflow flag-溢出标志位）——OV（overflow-溢出）——NV（not overflow-没溢出）
DF（10位-direction flag-方向标志位）——DN（down-下方）——UP（up-上方）
IF（9位-interrupt flag-中断标志位）——EI（enable interrupt-允许中断）——DI（disabled interrupt-不允许中断）
TF（8位-trap flag-陷阱标志位）
SF（7位-sign flag-负号标志位）——NG（negative-负）——PL（plus-正）
ZF（6位-zero flag-零值标志位）——ZR（zero-为零）——NZ（not zero-不为0）
AF（4位-auxiliary carray flag-辅助进位标志位）——AC（auxiliary carry-有辅助进位）NA（not auxiliary carry-没有辅助进位）
PF（2位-parity flag-奇偶标志位）——PE（parity even-偶）——PO（parity odd-奇）
CF（0位-carry flag-进位标志位）——CY（carried-有进位）——NC（not carried-没进位）

不过我想说的是，这些内容看看就好，平时做对应内容学习的时候，作为参考资料就可以。

我根据汇编指令的规则，将其重新进行了分类。

1.1 烦人的汇编指令规则

我们知道，通用寄存器，用于存放一般的数据。

那么：

一般的数据到底是什么？
通用寄存器到底用来存什么数据的？
它能够存放来自哪些地方的数据？
它存放的数据又能够流向那些地方？

不知道你有没有想过这些问题，不知道你有没有因为8086CPU基本指令的一些规则而烦恼，例如

mov 段寄存器,通用寄存器允许：mov ds,ax允许，但是mov cs,ax又不允许了
mov 段寄存器,通用寄存器允许，但是add 段寄存器,寄存器又不允许了
mov 通用寄存器,立即数允许，但是mov 段寄存器,立即数又不允许了
IP不能作为操作数，而jmp指令又可以修改CS:IP的值
……

不知道你烦不烦，反正我是烦了，这与高级语言不同，因为他们都是寄存器啊，凭什么有的行，有的就不行了？

但是仔细想想，高级语言，其实是将不同操作的内容，明确分类了！，并且将一些容易出错的操作，直接封装了。

顺着这个思路，我们是不是也可以将寄存器，按照其指令规则进行分类呢？我们可以做出尝试！

其实这些规则，主要是因为硬件不允许，没有建立数据通路，又或者是因为逻辑不合理而禁止某些规则。

逻辑不允许我们还能理解，但是硬件数据通路的建立，这个伤脑筋了，我们力求，通过逻辑理解规则，从而掌握规则。

1.2 通用寄存器

什么叫通用！！就是它能够干好多事情，它受到的制约比较小！

有些其他寄存器不能直接与内存交流的，它可以来帮忙传信。

它自己也有功能的划分，但是不是很明显，但是我仍然建议你编辑汇编语言的时候，按照其功能使用，除非不够用，其他的也可以来帮忙。

AX：累加寄存器，可以用了存储由运算器得到的数据
BX：基地址寄存器，可以用来存放基地址
CX：计数器，载入程序的时候存放机器码的大小，它也可以干别的事
DX：数据寄存器，用来存放数据

他们的区别不明显，允许相互混用，通常，通用寄存器，存储的是数据，可以代表数值或者符号。

数值：1，2，3……
符号：中文，韩文……

1.3 段寄存器

段寄存器，就是用来存放段地址的，因此不能随意改变，根据不同的功能，权限也不一样。

这里补充一个概念

1.3.1 段寄存器数据的含义

段寄存器中的数据含义：
它是数据，它代表的是某个段的段地址，它并不是代表某一个数值或者符号，因此它不能与通用寄存器进行数值运算

因此你就理解，为什么add sub指令的操作数不能是段寄存器。

而对于mov指令，并不是全部的段寄存器都不能作为操作数，因为mov做的是数据传送工作，并不是运算工作，因此部分操作允许数据传送到段寄存器中，以完成某个段的段地址的指定。

我们接下来以CS和DS为例，带你理解一些指令的规则，更加细节的规则，可以根据本文的思路自行完成。

1.3.2 CS（code segment 代码段寄存器）

CS是非常重要的，程序的指令执行依靠CS:IP指向的位置，因此CS和IP不能随意更改。

IP不能作为任何指令的操作数，它通常是CPU自动修改的，jmp指令是专门修改CS:IP的指令，以实现指令的跳转 （jmp指令的用法请自行查阅资料）
CS的要求相对放宽一点，在mov指令中，它可以作为源操作数，也就是可以把它的数据传出去，但是，不能作为目标操作数，除了专用的jmp等一类转移指令（先不用管，知道他们可以修改CS和IP就可以了），别的指令不能修改CS和IP的值。

下面的指令是不允许的

mov cs,ax

下面的指令是允许的

mov ax,cs

想要修改CS:IP需要以下指令

jmp 2000H:0

jmp，全称jump，有跳转的意思，也就是指令的跳转，执行之后：CS = 2000H,IP = 0

总结一下

cs不能做运算，add sub运算等指令中，所有段寄存器都不能作为操作数
cs可以mov到其他寄存器mov ax,cs，也可以mov到内存单元mov [0],cs，此时，把CS中的内容，当成一般数据，传到别的地方。
jmp等转移指令，可以修改CS:IP的值，实现指令的跳转

1.3.3 DS（date segment 数据段寄存器）

DS用来存储数据段的段地址。

我们知道，在内存单元中找到数据，需要DS:EA指向它，因此，涉及到存储器寻址的指令，都需要修改DS的值，并且将EA（有效地址，又叫偏移地址）告诉指令。

下面用debug模式中的指令举例（而不是以标号代替地址的汇编源程序指令）

; 修改DS的值
mov ax,1000H
mov ds,ax
; 指定EA
mov bx,[0]

以上程序，DS:EA = 1000:0，bx将会被赋予这个地址指向的内存单元的字型数据。

对于DS，你应该已经很清楚它的功能的，它是帮助CPU，在存储器中找到数据段内的数据的。

既然它是擅长找东西的，那么修改它的数据也就自然合理，以下mov指令都是允许的

mov ds,通用寄存器
mov ds,内存单元
mov 内存单元,ds （ds当作一般性数据）

举例如下

mov ds,ax
mov ds,[0]
mov [0],ds

这里，ax可以是其他的通用寄存器，[0]可以是存储器寻址方式中的其他类型

重点强调，如果想要用立即数修改DS，指令mov ds,1234H是不允许的，这与8086CPU的硬件实现有关，你可以理解为，没有相关数据通路能够立即数直接进入DS中。

需要使用两条指令来完成mov ds,1234H想要做的事情

mov ax,1234H
mov ds,ax

这两条指令会非常常见，就相当于是：直走走不通，只能绕路而行。

其他的内容，以后会逐步更新

姜海天—计算机科学与技术专业

发布了26 篇原创文章 · 获赞 7 · 访问量 5417

私信关注

【汇编语言】理解8086CPU中，不同类型的寄存器和汇编指令规则的联系（会继续更新）