0 前言
你是否因为汇编指令繁杂的规则而苦恼呢?作者本人也很烦,因为往往教材中只告诉我们规则,却不告诉我们为什么,没有原因就直接记忆,负担太大,后期灵活运用也增添阻力,因此,我经过自己的思考去为你解释为什么有些规则是内样的,本文并不是深入硬件原理,只在汇编语言层级,从逻辑上说明原因。
x86指令集的核心原则:操作数最多只能有一个是内存单元,另外的可以是立即数或者寄存器
1 寄存器的分类
我先从其他博客为你找来了8086CPU的全部寄存器及其功能
原文链接在此
通用寄存器:
ax——accumulate register——累加器
bx——based register——基地址寄存器
cx——count register——计数器
dx——data registered——数据寄存器
段寄存器:
cs——code segment——代码段
ds——data segment——数据段
ss——stack segment——栈段寄存器
es——extra segment——附加段寄存器
特殊功能寄存器:
ip——instructor point——指令指针寄存器
sp——stack point——堆栈指针寄存器
bp——base point——基础指针
si——source index——源变址寄存器
di——destination index——目的变址寄存器
psw——program state word——程序状态字
Psw的常用标志:
OF(11位-overflow flag-溢出标志位)——OV(overflow-溢出)——NV(not overflow-没溢出)
DF(10位-direction flag-方向标志位)——DN(down-下方)——UP(up-上方)
IF(9位-interrupt flag-中断标志位)——EI(enable interrupt-允许中断)——DI(disabled interrupt-不允许中断)
TF(8位-trap flag-陷阱标志位)
SF(7位-sign flag-负号标志位)——NG(negative-负)——PL(plus-正)
ZF(6位-zero flag-零值标志位)——ZR(zero-为零)——NZ(not zero-不为0)
AF(4位-auxiliary carray flag-辅助进位标志位)——AC(auxiliary carry-有辅助进位)NA(not auxiliary carry-没有辅助进位)
PF(2位-parity flag-奇偶标志位)——PE(parity even-偶)——PO(parity odd-奇)
CF(0位-carry flag-进位标志位)——CY(carried-有进位)——NC(not carried-没进位)
不过我想说的是,这些内容看看就好,平时做对应内容学习的时候,作为参考资料就可以。
我根据汇编指令的规则,将其重新进行了分类。
1.1 烦人的汇编指令规则
我们知道,通用寄存器,用于存放一般的数据。
那么:
- 一般的数据到底是什么?
- 通用寄存器到底用来存什么数据的?
- 它能够存放来自哪些地方的数据?
- 它存放的数据又能够流向那些地方?
不知道你有没有想过这些问题,不知道你有没有因为8086CPU基本指令的一些规则而烦恼,例如
mov 段寄存器,通用寄存器
允许:mov ds,ax
允许,但是mov cs,ax
又不允许了mov 段寄存器,通用寄存器
允许,但是add 段寄存器,寄存器
又不允许了mov 通用寄存器,立即数
允许,但是mov 段寄存器,立即数
又不允许了- IP不能作为操作数,而
jmp
指令又可以修改CS:IP的值 - ……
不知道你烦不烦,反正我是烦了,这与高级语言不同,因为他们都是寄存器啊,凭什么有的行,有的就不行了?
但是仔细想想,高级语言,其实是将不同操作的内容,明确分类了!,并且将一些容易出错的操作,直接封装了。
顺着这个思路,我们是不是也可以将寄存器,按照其指令规则进行分类呢?我们可以做出尝试!
其实这些规则,主要是因为硬件不允许,没有建立数据通路,又或者是因为逻辑不合理而禁止某些规则。
逻辑不允许我们还能理解,但是硬件数据通路的建立,这个伤脑筋了,我们力求,通过逻辑理解规则,从而掌握规则。
1.2 通用寄存器
什么叫通用!!就是它能够干好多事情,它受到的制约比较小!
有些其他寄存器不能直接与内存交流的,它可以来帮忙传信。
它自己也有功能的划分,但是不是很明显,但是我仍然建议你编辑汇编语言的时候,按照其功能使用,除非不够用,其他的也可以来帮忙。
- AX:累加寄存器,可以用了存储由运算器得到的数据
- BX:基地址寄存器,可以用来存放基地址
- CX:计数器,载入程序的时候存放机器码的大小,它也可以干别的事
- DX:数据寄存器,用来存放数据
他们的区别不明显,允许相互混用,通常,通用寄存器,存储的是数据,可以代表数值或者符号。
- 数值:1,2,3……
- 符号:中文,韩文……
1.3 段寄存器
段寄存器,就是用来存放段地址的,因此不能随意改变,根据不同的功能,权限也不一样。
这里补充一个概念
1.3.1 段寄存器数据的含义
段寄存器中的数据含义:
它是数据,它代表的是某个段的段地址,它并不是代表某一个数值或者符号,因此它不能与通用寄存器进行数值运算
因此你就理解,为什么add sub
指令的操作数不能是段寄存器。
而对于mov
指令,并不是全部的段寄存器都不能作为操作数,因为mov
做的是数据传送工作,并不是运算工作,因此部分操作允许数据传送到段寄存器中,以完成某个段的段地址的指定。
我们接下来以CS和DS为例,带你理解一些指令的规则,更加细节的规则,可以根据本文的思路自行完成。
1.3.2 CS(code segment 代码段寄存器)
CS是非常重要的,程序的指令执行依靠CS:IP指向的位置,因此CS和IP不能随意更改。
- IP不能作为任何指令的操作数,它通常是CPU自动修改的,
jmp
指令是专门修改CS:IP的指令,以实现指令的跳转 (jmp指令的用法请自行查阅资料) - CS的要求相对放宽一点,在
mov
指令中,它可以作为源操作数,也就是可以把它的数据传出去,但是,不能作为目标操作数,除了专用的jmp
等一类转移指令(先不用管,知道他们可以修改CS和IP就可以了),别的指令不能修改CS和IP的值。
下面的指令是不允许的
mov cs,ax
下面的指令是允许的
mov ax,cs
想要修改CS:IP需要以下指令
jmp 2000H:0
jmp,全称jump,有跳转的意思,也就是指令的跳转,执行之后:CS = 2000H,IP = 0
总结一下
- cs不能做运算,
add sub
运算等指令中,所有段寄存器都不能作为操作数 - cs可以mov到其他寄存器
mov ax,cs
,也可以mov到内存单元mov [0],cs
,此时,把CS中的内容,当成一般数据,传到别的地方。 jmp
等转移指令,可以修改CS:IP
的值,实现指令的跳转
1.3.3 DS(date segment 数据段寄存器)
DS用来存储数据段的段地址。
我们知道,在内存单元中找到数据,需要DS:EA
指向它,因此,涉及到存储器寻址的指令,都需要修改DS的值,并且将EA(有效地址,又叫偏移地址)告诉指令。
下面用debug模式中的指令举例(而不是以标号代替地址的汇编源程序指令)
; 修改DS的值
mov ax,1000H
mov ds,ax
; 指定EA
mov bx,[0]
以上程序,DS:EA = 1000:0
,bx将会被赋予这个地址指向的内存单元的字型数据。
对于DS,你应该已经很清楚它的功能的,它是帮助CPU,在存储器中找到数据段内的数据的。
既然它是擅长找东西的,那么修改它的数据也就自然合理,以下mov指令都是允许的
- mov ds,通用寄存器
- mov ds,内存单元
- mov 内存单元,ds (ds当作一般性数据)
举例如下
mov ds,ax
mov ds,[0]
mov [0],ds
这里,ax可以是其他的通用寄存器,[0]可以是存储器寻址方式中的其他类型
重点强调,如果想要用立即数修改DS,指令mov ds,1234H
是不允许的,这与8086CPU的硬件实现有关,你可以理解为,没有相关数据通路能够立即数直接进入DS中。
需要使用两条指令来完成mov ds,1234H
想要做的事情
mov ax,1234H
mov ds,ax
这两条指令会非常常见,就相当于是:直走走不通,只能绕路而行。
其他的内容,以后会逐步更新