2009-04-13

C 语言中字符数组的存储

C 语言中字符数组的存储

程序片段 :

C代码
  1. void mstrcat(char *s, char *t)  
  2.   
  3. {  
  4.   
  5.          s += strlen(s);  
  6.   
  7.          for(;*t!='\0';*s++=*t++);  
  8.   
  9.          *s = '\0';  
  10.   
  11. }  
 

这是一个字符数组连接的函数 .
(一)在测试程序中声明如下 :

C代码
  1. char a[] = "abcd";  
  2. char b[] = "ef";  
  3. char s[] = "ghijklmnopqrstuvwxyz";  
  4. char *c;  
  5. char *d;  
  6.   
  7. mstrcat(b, s);  
  8. /* 连接后的b */  
  9. printf("after:%s\n", b);  
  10. /* a */  
  11. printf("after:%s\n", a);  
  12. /* 各字符数组的首元素地址  */  
  13. printf("%d\n", (int)a);  
  14. printf("%d\n", (int)b);  
  15. printf("%d\n", (int)s);  
 分别在GCC3.4.4和VC6.0后,得出2种不同的结果:
GCC:
after:efghijklmnopqrstuvwxyz
after:uvwxyz
22ccd0
22ccc0
22cca0
得出结论(无异常产生):
每个字符按一个字节存储,并且相邻字符数组按照地址下降来存储,而一个数组内元素按照地址上升来存储.
GCC依照16个字节对齐原则进行对齐处理(即不足16个字节的数组,按16个字节进行对齐存储)


VC6.0:(出现异常)
after:efghijklmnopqrstuvwxyz
after:ijklmnopqrstuvwxyz
1245048
1245044
1245020

得出的结论:
VC6.0:
每个字符按一个字节存储,并且相邻字符数组按照地址下降来顺序存储 ,而一个数组内元素按照地址上升来存储.
VC6.0依照4个字节对齐原则进行对齐处理(即不足4个字节的数组,按4个字节进行对齐存储)

总结:
总之,这种处理方式是种不安全的处理方式,是否出现异常取决于是否有足够的已申请空间的支持.
在GCC中未出现异常是因为GCC按照16字节的对齐方式,即32字节足以容纳连接后的字符数组b.
而在VC中出现异常是因为VC按照4字节的对齐方式,4字节不能容纳b.
可预见的是:如果当b的字符数组长度大于32时,GCC中也会出现异常.

(二)在测试程序中声明如下 :
同样在测试程序中如果声明如下
C代码
  1. char *c;  
  2. char *d;  
  3.   
  4. c = "abcd";  
  5. d = "efghi";  
  6.   
  7. printf("%d\n", (int)c);  
  8. printf("%d\n", (int)d);  
  9.   
  10. mstrcat(c, d);  
  11. printf("%s\n", c);  
 那么,在GCC和VC(版本同上)中的结果如下:
GCC(出现异常):
402000
402005

得出结论:
对于未指定所指对象的指针,其地址是编译器任意指定的,而当指定其所指对象时,指针则存储的是所指对象的首地址(例如,指针c指向的是字符数 组"abcd"的首 地址),由于字符数组之间顺序存放,所以d指向的是5个字节("abcd"占用5个字节存储空间)后的位置,这里我们的看到的地址是升序的.


VC(出现异常):
4333604
4337624

得出结论:
对于VC而言,其相邻指定给指针的字符数组并非顺序存储,但指针指向的位置仍然是所指对象的首地址.
出现异常的原因是:
显然对于d字符数组所需要的连续存储空间c是不满足的(不能操作未申请的存储空间).

ps.
在(一)中,即使使用c语言的标准字符串函数strcat,strcat(b,s)也会出现异常,可见标准函数也没有使用重新申请新空间的方式处理.

没有评论: