略谈 c 语言中指针与数组的区别
数组与指针是两个不同的概念,即使是从编译的层面上来看。不过,在很多时候,两者的用法极为相似。本文将讨论两者的区别。
一、理论分析
编译器在处理指针与数组的时候,是区别对待的。
对于指针
CODE:
int *p;
p 是一个变量,所以编译器要为之分配一个空间。
CODE:
.comm p, 4
对于数组:
CODE:
int a[10]
a 是一个地址,编译器会为数组 a 分配一个空间,但不会为 a 本身分配空间,在使用到a的地方,会被替换为一个地址+属性,其结果为一个"常量指针"。
CODE:
.comm a, 40
在对一个指针变量进行 dereferance 的时候,比如 (*p)。编译器首先要得到 p 的地址,从中取值,然后把得到的值作为地址,再取值。类似如下汇编:
CODE:
lea (p), %esi /* this is &p */
mov (%esi), %edi /* this is p */
mov (%edi), %eax /* this is p[0] */
或者,更简单的
mov (p), %esi /* this is p */
mov (%esi), %eax /* and this is p[0] */
相比之下,数组的引用
CODE:
int a[10];
a[0];
则省去了取 a 地址的过程,符号 a 代表一个地址,这个地址不存放在任何变量中!
CODE:
lea (a), %esi /* this is a */
mov (%esi), %eax /* this is a[0] */
或更简单的:
mov (a), %esi /* this is a[0] */
熟悉汇编的人,容易从看出,区别是大的。
二、两个例子
第一个例子,演示 "把数组声明为指针" 是如何使程序崩溃的。
CODE:
file: 1.c
int a[10]={0};
file: 2.c
int
main ()
{
extern int *a;
printf ( "%d\n", a[0]);
return 0;
}
运行这个程序,Segmentation fault
在模块1.c 中, a 被定义为一个数组,但在模块 2.c中,a被声明为指针。所以编译器在处理 printf ("%d\n", a[0]) 时:
认为 a 是一个指针,所以先取其地址&a,然而,a 实际是个数组,&a 就是 a本身,所的 &a 是 a 的首地址。
然后编译器取 指针a的值,这实际上是 得到的是数组的第一个元素 a[0] ,值为0!也就是,编译器得到了一个 0 指针,最后,编译器对其derefrence,崩溃!
第二个例子演示“把指针声明为数组”如何的到错误的数据:
CODE:
file: 3.c
int *pa = (int *)0;
f ()
{
printf ( "%x\n", &pa);
}
file: 4.c
int
main ()
{
extern int pa[];
printf ( "%p\n", pa);
printf ( "%d\n", pa[0]);
f ();
return 0;
}
CODE:
0x403010
0
403010
在这个例子中, pa 被定义为一个指针,并初始化为0, 但在另一个模块中,被声明为一个数组.
编译器在处理 printf ("%p\n", pa) 时,认为 pa 是数组,所以直接打印符号pa的值,此值为指针pa的地址!
编译器在处理 printf ("%p\n", pa[0]) 时,认为 pa 是数组,以符号 pa 对应的值加一个偏移0,并取其值,得到的实际上是 指针 pa 的值 即 0.
数组是一些同名同类型变量的有序集合,它们储存在内存的一个连续的储存区内。其中每个成员称为数组元素,各元素用下标加以区别。所以,数组元素又称为下标变量。
数组名是一个常量指针,它恒指向该数组的第一个元素。
指针变量的值是一个正整数,它表示内存中的地址.