u-boot代码中对寄存器的读取是根据不同CPU架构调用readl,readb,readw的函数实现的。这几个函数实现很巧妙,利用栈实现了静默返回。这里我想以readl为例,使用反汇编手段了解一下该函数实现机理。readl的原代码如下如示:
#define dmb() __asm__ __volatile__ ("" : : : "memory")
#define __iormb() dmb()
#define __iowmb() dmb()
#define __arch_getl(a) (*(volatile unsigned int *)(a))
#define readl(c) ({ u32 __v = __arch_getl(c); __iormb(); __v; })
以上实现涉及到了下面几方面知识:
1、内存屏障。
2、反汇编
3、x86栈的调用与返回
简单说一下下面几个寄存器的定义,有助于理解反汇编代码:
- ax(accumulator): 可用于存放函数返回值
- bp(base pointer): 用于存放执行中的函数对应的栈帧的栈底地址
- sp(stack poinger): 用于存放执行中的函数对应的栈帧的栈顶地址
- ip(instruction pointer): 指向当前执行指令的下一条指令
为使用问题简化,我们先使用如下代码,研究代码段返回值原理:
#include "stdio.h"
typedef unsigned int u32;
int main()
{
u32 rd =0;
rd =({ u32 __v = 8;u32 __v1 = 9;__v++;__v1;});
printf("rd=%d\n",rd);
return 0;
}
typedef unsigned int u32;
int main()
{
u32 rd =0;
rd =({ u32 __v = 8;u32 __v1 = 9;__v++;__v1;});
printf("rd=%d\n",rd);
return 0;
}
我们使用反汇编指令后,查看主要代码区如下所示:
#include "stdio.h"
typedef unsigned int u32;
int main()
{
40156f: 90 nop
0000000000401570 <main>:
401570: 55 push %rbp
401571: 48 89 e5 mov %rsp,%rbp
401574: 48 83 ec 30 sub $0x30,%rsp
401578: e8 d3 01 00 00 callq 401750 <__main>
u32 rd =0;
40157d: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp) //rd放在栈的bp-4位置。
rd =({ u32 __v = 8;u32 __v1 = 9;__v++;__v1;});
401584: c7 45 f8 08 00 00 00 movl $0x8,-0x8(%rbp) //__v放在bp-8位置,值为8
40158b: c7 45 f4 09 00 00 00 movl $0x9,-0xc(%rbp )//__v1放在bp-c位置,值为9
401592: 83 45 f8 01 addl $0x1,-0x8(%rbp)
401596: 8b 45 f4 mov -0xc(%rbp),%eax //对__v1进行自增操作,并将结果存回。
401599: 89 45 fc mov %eax,-0x4(%rbp) //使用ax存放处返回值给rd。bp-4位置为rd
printf("rd=%d\n",rd);
40159c: 8b 45 fc mov -0x4(%rbp),%eax
40159f: 89 c2 mov %eax,%edx
4015a1: 48 8d 0d 58 2a 00 00 lea 0x2a58(%rip),%rcx # 404000 <.rdata>
4015a8: e8 c3 15 00 00 callq 402b70 <printf>
return 0;
4015ad: b8 00 00 00 00 mov $0x0,%eax
}
typedef unsigned int u32;
int main()
{
40156f: 90 nop
0000000000401570 <main>:
401570: 55 push %rbp
401571: 48 89 e5 mov %rsp,%rbp
401574: 48 83 ec 30 sub $0x30,%rsp
401578: e8 d3 01 00 00 callq 401750 <__main>
u32 rd =0;
40157d: c7 45 fc 00 00 00 00 movl $0x0,-0x4(%rbp) //rd放在栈的bp-4位置。
rd =({ u32 __v = 8;u32 __v1 = 9;__v++;__v1;});
401584: c7 45 f8 08 00 00 00 movl $0x8,-0x8(%rbp) //__v放在bp-8位置,值为8
40158b: c7 45 f4 09 00 00 00 movl $0x9,-0xc(%rbp )//__v1放在bp-c位置,值为9
401592: 83 45 f8 01 addl $0x1,-0x8(%rbp)
401596: 8b 45 f4 mov -0xc(%rbp),%eax //对__v1进行自增操作,并将结果存回。
401599: 89 45 fc mov %eax,-0x4(%rbp) //使用ax存放处返回值给rd。bp-4位置为rd
printf("rd=%d\n",rd);
40159c: 8b 45 fc mov -0x4(%rbp),%eax
40159f: 89 c2 mov %eax,%edx
4015a1: 48 8d 0d 58 2a 00 00 lea 0x2a58(%rip),%rcx # 404000 <.rdata>
4015a8: e8 c3 15 00 00 callq 402b70 <printf>
return 0;
4015ad: b8 00 00 00 00 mov $0x0,%eax
}
对于寄存器操作,使用内存屏障,告诉CPU重新从寄存器取值,而不是使用缓存值。
这种实现可以在C语言中实现类似c++中内联函数的效果。