目录
特别声明:
1. 本文共分为上下两部完成,1 ~ 4 章为上半部分,5 ~ 9 为下半部分;
2. 本节内容为下半部分,上半部分内容请阅读:让你不再害怕指针(上部)。
五、数组和指针的关系
数组的数组名其实可以看作一个指针。看下例:
例九:
变量声明 | int array[10] = {0,1,2,3,4,5,6,7,8,9}, value; |
value = array[0]; | 表达式也可写成:value = *array; |
value = array[3]; | 表达式也可写成:value = *(array + 3); |
value = array[4]; | 表达式也可写成:value = *(array + 4); |
上例中,一般而言数组名 array 代表数组本身,类型是 int [10],但如果把 array 看做指针的话,它指向数组的第 0 个单元,类型是 int *,所指向的类型是数组单元的类型即 int。因此 *array 等于 0 就一点也不奇怪了。同理,array+3 是一个指向数组第 3 个单元的指针,所以 *(array+3) 等于 3。其它依此类推。
例十:
char *str[3] = {
"Hello,thisisasample!",
"Hi,goodmorning.",
"Helloworld"
};
变量声明 | char s[80]; |
strcpy(s, str[0]); | 表达式也可写成:strcpy(s, *str); |
strcpy(s, str[1]); | 表达式也可写成:strcpy(s, *(str+1)); |
strcpy(s, str[2]); | 表达式也可写成:strcpy(s, *(str+2)); |
如上图所示,str 是一个三单元的数组,该数组的每个单元都是一个指针,这些指针各指向一个字符串。把指针数组名 str 当作一个指针的话,它指向数组的第 0 号单元,它的类型是 char **,它指向的类型是 char *。
*str 也是一个指针,它的类型是 char *,它所指向的类型是 char,它指向的地址是字符串 "Hello,thisisasample!" 的第一个字符的地址,即 'H' 的地址。注意: 字符串相当于是一个数组,在内存中以数组的形式储存,只不过字符串是一个数组常量,内容不可改变,且只能是右值。如果看成指针的话,他即是常量指针,也是指针常量。
str+1 也是一个指针,它指向数组的第 1 号单元,它的类型是 char **,它指向的类型是 char *。*(str+1) 也是一个指针,它的类型是 char *,它所指向的类型是 char,它指向 "Hi,goodmorning." 的第一个字符 'H'。
下面总结数组的数组名(数组中储存的也是数组)的问题:
声明了一个数组 TYPE array[n], 则数组名称 array 就有了两重含义:
第一,它代表整个数组,它的类型是 TYPE[n];第二,它是一个常量指针, 该指针的类型是 TYPE *,该指针指向的类型是 TYPE,也就是数组单元的类型,该指针指向的内存区就是数组第 0 号单元,该指针自己占有单独的内存区 注意它和数组第 0 号单元占据的内存区是不同的。该指针的值是不能修改的,即类似 array++ 的表达式是错误的。
在不同的表达式中数组名 array 可以扮演不同的角色:
1. 在表达式 sizeof(array) 中,数组名 array 代表数组本身,故这时 sizeof 函数测出的是整个数组的大小。
2. 在表达式 *array 中,array 扮演的是指针,因此这个表达式的结果就是数组第 0 号单元的值。sizeof(*array) 测出的是数组单元的大小。
3. 表达式 array+n(其中 n=0,1,2,.....)中,array 扮演的是指针,故 array+n 的结果是一个指针,它的类型是 TYPE *,它指向的类型是 TYPE,它指向数组第 n 号单元。故 sizeof(array+n) 测出的是指针类型的大小。在 32 位程序中结果是 4。
例十一:
int array[10];
int (*ptr)[10];
ptr = &array;
上例中 ptr 是一个指针,它的类型是 int (*)[10],它指向的类型是 int [10] ,我们用整个数组的首地址来初始化它。在语句 ptr = &array 中,array 代表数组本身。
本节中提到了函数 sizeof(),那么请问 sizeof(指针名称) 测出的究竟是指针自身类型的大小呢,还是指针所指向的类型的大小?
答案是前者。 例如:
int (*ptr)[10];
则在 32 位系统中,有:
sizeof(int (*)[10]) == 4;
sizeof(int [10]) == 40;
sizeof(ptr) == 4;
实际上,sizeof(对象) 测出的都是对象自身的类型的大小,而不是别的什么类型的大小。
运行一段代码:
int arrayay[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
int (*ptr)[10];
ptr = &array;
for (int i=0; i<10; i++)
{
printf("&array[%d]=%p, (*ptr)[%d]=%d\n", i, &array[i], i, (*ptr)[i]);
}
printf("&array=%p\n", &array);
运行以上代码 ,会发现 &array 与 &array[0] 地址是相同的。
因为数组名 array 表示数组的首元素的地址,也就是 &array[0]。因此,&array 与 &array[0] 都表示数组的首元素的地址,所以它们是相同的。但是,它们在语义上略有不同。
&array 表示整个数组的地址,它指向的是一个包含整个数组的内存块的起始地址。这个内存块包含了数组的所有元素,因此,我们可以通过 &array 来访问整个数组。
而 &array[0] 只表示数组第一个元素的地址,它并不包含整个数组的内存块。因此,我们不能直接通过 &array[0] 来访问整个数组。
六、指针和结构类型的关系
可以声明一个指向结构类型对象的指针。
例十二:
struct MyStruct
{
int a;
int b;
int c;
};
声明变量 | 声明说明 |
struct MyStruct ss = {20, 30, 40}; | 声明了结构对象 ss,并把 ss 的成员初始化为 20,30 和 40。 |
struct MyStruct *ptr = &ss; | 声明了一个指向结构对象 ss 的指针。它的类型是MyStruct *,它指向的类型是 MyStruct。 |
int *pstr = (int *)&ss; | 声明了一个指向结构对象 ss 的指针。但是 pstr 和 它被指向的类型 ptr 是不同的。 |
请问怎样通过指针 ptr 来访问 ss 的三个成员变量?
答案:
ptr->a; //指向运算符,或者可以这样(*ptr).a,建议使用前者
ptr->b;
ptr->c;
又请问怎样通过指针 pstr 来访问 ss 的三个成员变量?
答案:
*pstr; //访问了 ss 的成员 a。
*(pstr+1); //访问了 ss 的成员 b。
*(pstr+2); //访问了 ss 的成员 c。
看到这里或许会有人感到疑惑,为什么 ss 能强转为 (int *) 类型,并且还能访问到结构里的成员。如果你有这个疑惑,表示你对指针还是了解的不够透彻。要知道,我已在让你不再害怕指针(上部)【详解指针】中对 “指针的值” 做了详细的介绍,在此通过下图来进一步说明:
#include <stdio.h>
#include <string.h>
void main()
{
struct MyStruct
{
int a;
int b;
int c;
};
struct MyStruct ss = {20, 30, 40};
struct MyStruct *ptr = &ss;
int *pstr = (int *)&ss;
printf("[ptr] a=%d, b=%d, c=%d\n", ptr->a, ptr->b, ptr->c);
printf("[pstr] a=%d, b=%d, c=%d\n", *pstr, *(pstr+1), *(pstr+2));
}
注意:虽然我在 Linux 系统上调试过上述代码,但是要知道,这样使用 pstr 来访问结构成员是不正规的,为了说明为什么不正规,让我们看看怎样通过指针来访问数组的各个单元:(将结构体换成数组)。
例十三:
int array[3] = {35, 56, 37};
int *pa = array;
通过指针 pa 访问数组 array 的三个单元的方法是:
*pa; //访问了第 0 号单元
*(pa+1); //访问了第 1 号单元
*(pa+2); //访问了第 2 号单元
从格式上看到是与通过指针访问结构成员的不正规方法的格式一样。
所有的 C/C++编译器在排列数组的单元时,总是把各个数组单元存放在连续的存储区里,单元和单元之间没有空隙。但在存放结构对象的各个成员时,在某种编译环境下,可能会需要字对齐或双字对齐或者是别的什么对齐,需要在相邻两个成员之间加若干个"填充字节",这就导致各个成员之间可能会有若干个字节的空隙。
所以, 在例十二中,即使 *pstr 访问到了结构对象 ss 的第一个成员变量 a,也不能保证 *(pstr+1) 就一定能访问到结构成员 b。因为成员 a 和成员 b 之间可能会有若干填充字节,说不定 *(pstr+1) 就正好访问到了这些填充字节呢。这也证明了指针的灵活性。要是你的目的就是想看看各个结构成员之间到底有没有填充字节,嘿,这倒是个不错的方法。不过指针访问结构成员的正确方法应该是象例十二中使用指针 ptr 的方法。
七、指针和函数的关系
可以把一个指针声明成为一个指向函数的指针(简称函数指针)。
int fun1(char *, int);
int (*pfun1)(char *, int);
pfun1 = fun1;
int a = (*pfun1)("abcdefg", 7); //通过函数指针调用函数。
例十四:
把指针作为函数的形参。在函数调用语句中,可以用指针表达式来作为实参。
int fun(char *s)
{
int num = 0;
for(int i = 0;;)
{
num += *s;
s++;
}
return num;
}
void main()
{
int a;
char str[] = "abcdefghijklmn";
a = fun(str);
}
这个例子中的函数 fun 统计一个字符串中各个字符的 ASCII 码值之和。前面说了,数组名可以被解释为指向数组首元素的指针。在函数调用中,当把 str 作为实参传递给形参 s 后,实际是把 str 的值传递给了 s,s 所指向的地址就和 str 所指向的地址一致,但是 str 和 s 各自占用各自的存储空间(即 s 指针只是 str 的副本)。在函数体内对 s 进行自加 1 运算,并不意味着同时对 str 进行了自加 1 运算。
请问如何才能在函数内部修改指向数组的指针,并改变原始数组的内容呢?
可以将指向数组的指针,作为指针的指针或指针的引用传递给函数。
#include <stdio.h>
void fun(int **parr, int len)
{
(*parr)[0] = 100; // 修改数组的第一个元素
}
int main()
{
int arr[] = {1, 2, 3, 4, 5};
int *p = arr;
fun(&p, sizeof(arr) / sizeof(int));
printf("%d\n", arr[0]); // 输出结果为 100,原始数组被修改
return 0;
}
在上述代码中,我们定义了一个指向整型数组的指针 p,并将其初始化为数组 arr 的地址。然后,我们调用 fun() 函数,并将指向指针 p 的指针 &p 和数组的长度 len 作为实参传递给函数。
在 fun() 函数内部,我们使用指针的指针方式访问数组元素。具体来说,我们首先使用 *parr 取出指向数组的指针 p,然后使用 (*parr)[0] 访问数组的第一个元素。由于 parr 是一个指向指针的指针,因此需要使用 * 运算符来访问指针指向的内容。
在上述代码,输出结果为 100,表明原始数组的第一个元素已经被修改。
八、指针类型转换
当我们初始化一个指针或给一个指针赋值时,赋值号的左边是一个指针,赋值号的右边是一个指针表达式。在我们前面所举的例子中,绝大多数情况下,指针的类型和指针表达式的类型是一样的, 指针所指向的类型和指针表达式所指向的类型是一样的。
例十五:
float f = 12.3;
float *fptr = &f;
int *p;
在上面的例子中,假如我们想让指针 p 指向实数 f,应该怎么办?是用下面的语句吗?
p = &f;
不对。因为指针 p 的类型是 int *,它指向的类型是 int。表达式 &f 的结果是一个指针,指针的类型是 float *,它指向的类型是 float。两者不一致,直接赋值的方法是不行的。至少在 Linux 系统上, 对指针的赋值语句要求,赋值号两边的类型一致,所指向的类型也一致。为了实现我们的目的,需要进行 "强制类型转换":
p = (int *)&f;
如果有一个指针 p,我们需要把它的类型和所指向的类型改为 TYEP *TYPE,那么语法格式是:(TYPE *)p;
这样强制类型转换的结果是一个新指针,该新指针的类型是 TYPE *,它指向的类型是 TYPE,它指向的地址就是原指针指向的地址。而原来的指针 p 的一切属性都没有被修改(切记)。
一个函数如果使用了指针作为形参,那么在函数调用语句的实参和形参的结合过程中,必须保证类型一致,否则需要强制转换。
例十六:
#include <stdio.h>
void fun(char *s)
{
//printf("[start] s+0=%d, s+1=%d, s+2=%d, s+3=%d\n", *(s+0), *(s+1), *(s+2), *(s+3));
char c;
c = *(s+3); *(s+3) = *(s+0); *(s+0) = c;
c = *(s+2); *(s+2) = *(s+1); *(s+1) = c;
//printf("[end] s+0=%d, s+1=%d, s+2=%d, s+3=%d\n", *(s+0), *(s+1), *(s+2), *(s+3));
}
void main()
{
int a = 125;
fun((char *)&a);
}
注意这是一个 32 位程序,故 int 类型占了四个字节,char 类型占一个字节。函数 fun 的作用是把一个整数的四个字节的顺序来个颠倒。注意到了吗?在函数调用语句中,实参 &a 的结果是一个指针,它的类型是 int *,它指向的类型是 int。形参这个指针的类型是 char *,它指向的类型是 char。这样,在实参和形参的结合过程中,我们必须进行一次从 int * 类型到 char * 类型的转换。 结合这个例子,我们可以这样来想象编译器进行转换的过程:编译器先构造一个临时指针 char *temp,然后执行 temp=(char *)&a,最后再把 temp 的值传递给 s。所以最后的结果是:s 的类型是 char *,它指向的类型是 char,它指向的地址就是 a 的首地址。
我们已经知道,指针的值就是指针指向的地址,在 32 位程序中,指针的值其实是一个 32 位整数。那可不可以把一个整数当作指针的值直接赋给指针呢?就像下面的语句:
unsigned int a;
TYPE *ptr; //TYPE 是 int, char 或结构类型等等类型。
a = 20345686;
ptr = 20345686; //我们的目的是要使指针 ptr 指向地址 20345686
ptr = a; //我们的目的是要使指针 ptr 指向地址 20345686
编译一下,结果发现后面两条语句全是错的。那么我们的目的就不能达到了吗?不,还有办法:
unsigned int a;
TYPE *ptr; //TYPE 是 int, char 或结构类型等等类型。
a = N; //N 必须代表一个合法的地址, 例如:N=20345686;
ptr = (TYPE *)a; //呵呵,这就可以了。
严格说来,这里的(TYPE *)和指针类型转换中的(TYPE *)还不一样。这里的(TYPE *)的意思是把无符号整数 a 的值当作一个地址来看待。上面强调了 a 的值必须代表一个合法的地址,否则的话,在你使用 ptr 的时候,就会出现非法操作错误。
想想能不能反过来,把指针指向的地址即指针的值当作一个整数取出来。完全可以。下面的例子演示了把一个指针的值当作一个整数取出来,然后再把这个整数当作一个地址赋给一个指针:
例十七:
int a = 123;
int *ptr = &a;
char *str;
int b = (int)ptr; //把指针 ptr 的值当作一个整数取出来。
str = (char *)b; //把这个整数的值当作一个地址赋给指针 str。
现在我们已经知道了,可以把指针的值当作一个整数取出来,也可以把一个整数值当作地址赋给一个指针。
九、指针的安全问题
看下面的例子:
例十八:
char s = 'a';
int *ptr;
ptr = (int *)&s;
*ptr = 1298;
指针 ptr 是一个 int * 类型的指针,它指向的类型是 int,它指向的地址就是 s 的首地址。在 32 位系统中,s 占一个字节,int 类型占四个字节。最后一条语句不但改变了 s 所占的一个字节,还把和 s 相临的高地址方向的三个字节也改变了。这三个字节是干什么的?只有编译程序知道,而写程序的人是不太可能知道的。也许这三个字节里存储了非常重要的数据,也许这三个字节里正好是程序的一条代码,而由于你对指针的马虎应用,这三个字节的值被改变了!这会造成崩溃性的错误。
让我们再来看一例:
例十九:
char a;
int *ptr = &a;
ptr++;
*ptr = 115;
该例子完全可以编译通过,并能正常执行。但是看到没有?第 3 句对指针 ptr 进行自加 1 运算后,ptr 指向了和整型变量 a 相邻的高地址方向的一块存储区。这块存储区里是什么?我们不知道。有可能它是一个非常重要的数据,甚至可能是一条代码。而第 4 句竟然往这片存储区里写入一个数据!这是严重的错误。所以在使用指针时,程序员心里必须非常清楚:我的指针究竟指向了哪里。 在用指针访问数组的时候,也要注意不要超出数组的低端和高端界限,否则也会造成类似的错误。在指针的强制类型转换:ptr1 = (TYPE *)ptr2 中,如果 sizeof(ptr2的类型) 大于 sizeof(ptr1的类型),那么在使用指针 ptr1 来访问 ptr2 所指向的存储区时是安全的 。如果 sizeof(ptr2的类 型) 小于 sizeof(ptr1的类型),那么在使用指针 ptr1 来访问 ptr2 所指向的存储区时是不安全的。至于为什么,读者结合例十八来想一想,应该会明白的。