一个数组越界引起内存引用错误的经典bug,例程如下
#include <stdio.h>
#include <stdlib.h>
typedef struct {
int a[2];
double d;
} struct_t;
double fun(int i) {
volatile struct_t s;
s.d = 3.14;
s.a[i] = 1073741824; /* Possibly out of bounds */
return s.d; /* Should be 3.14 */
}
int main(int argc, char *argv[]) {
int i = 0;
if (argc >= 2)
i = atoi(argv[1]);
double d = fun(i);
printf("fun(%d) --> %.10f\n", i, d);
return 0;
}
/*
gec@ubuntu:/mnt/hgfs/share/csapp_code$ ./a.out 0
fun(0) --> 3.1400000000
gec@ubuntu:/mnt/hgfs/share/csapp_code$ ./a.out 1
fun(1) --> 3.1400000000
gec@ubuntu:/mnt/hgfs/share/csapp_code$ ./a.out 2
fun(2) --> 3.1399998665
gec@ubuntu:/mnt/hgfs/share/csapp_code$ ./a.out 3
fun(3) --> 2.0000006104
gec@ubuntu:/mnt/hgfs/share/csapp_code$ ./a.out 4
fun(4) --> 3.1400000000
段错误 (核心已转储)
程序并不难懂,匪夷所思的是结果。在i为0和1时正常,超过2值错误,而超过4程序直接报错。要理解这个结果,首先要清楚局部变量是在栈中储存的,对于这个程序,储存方式如下。
我们可以看到,i为1和0当然没事,但i为2时a[i]实际上是会覆盖到存储在数组上面的的d的值,从而我们输出的d和我们想象中的不一样了。当i过大时,才会通过gcc的栈溢出检测机制检测出来,出现如上错误:段错误 (核心已转储),但数组越界是不会检测的哦!每个机器出现错误的i听说各不相同,大家可以自己试试。博主的机器在i=6时发生错误。
解决措施
如果程序这么写,我们是没有办法百分百完美地避免这个错误的,因为这是c/c++语言本身不做任何内存保护的缘故。但并不是说这个错误无法解决,我们可以通过使用其他语言如java来避免.
我们也可以改变结构体的声明顺序,将数组最后声明,这样虽然仍然会数组越界,但至少可以保证不会影响到其他的值。当然最重要地是了解这种错误的原因,帮助我们能快速找出这个错误。
关于这个bug解决方法还有很多,博主还是学生能力有限,大家可以在网上搜索。