C\C++ sizeof
关于sizeof的一般性的问题比较多见, 需要强调的是,sizeof运算符的计算是发生在编译期的。 以下讨论几点细节和实现方法。
首先讨论几点细节:
-
sizeof(i++)之后,i的值会怎样?答案是不变。
查看编译器生成的代码,发现sizeof在编译时直接给定了一个常值,而非在运行时求值。 进而又分析过sizeof(表达式)的结果,清楚了类型提升原理。 但我之前没有注意过表达式中出现副作用的问题,于是在sizeof(i++)的问题上犹豫了。 现在经过查阅资料和实验,结论是:sizeof在大多数情况下是编译时定值的,表达式中的任何副作用 (包括有副作用的运算符、函数调用等) 都不会发生。 这里说“大多数情况”,排除了针对C99的新特性——不定长数组 (variable length array) 的特例。 参考这篇文章 (http://rednaxelafx.javaeye.com/blog/225909) ,如果sizeof运算符的参数是一个不定长数组,则该需要在运行时计算数组长度。
-
sizeof(‘a’)的结果是多少?
这个要看是在C中还是C++中了。根据标准的规定,在C的算术类型提升时,字符常量’a’自动提升为整型,故结果是4(对于32位机器);而在C++中则有字符常量的规定,’a’就是一个单字节的字符常量,故结果是1。我这样理解:C强调了char的“数”属性,而C++强调了char的“字符”属性。
-
sizeof(‘ab’)的结果又是多少?
‘ab’这种语法叫做”多字节字符常量” (multi-character character constant),它限制在单引号中包含2至4个字节。根据标准,多字节字符常量的语义由编译器的实现决定。 在我测试的gcc 4.0和VS2008中,如果int a = ‘abcd’,则a == 0x61626364。sizeof(‘ab’) == sizeof(‘abc’) == sizeof(‘abcd’) == 4。
cout << sizeof('abcd') << endl << sizeof('abc') << endl << sizeof('ab') << endl << sizeof('a') << endl; $g++ test.cpp -o test test.cpp:51:14: warning: multi-character character constant [-Wmultichar] << sizeof('abc') << endl ^ test.cpp:52:14: warning: multi-character character constant [-Wmultichar] << sizeof('ab') << endl 2 warnings generated.
-
那么sizeof(L’a’)呢?
虽然wchar_t是在源代码级可移植的宽字符,但其大小依赖于操作系统或编译器的定义。独立出现的wchar_t常量并不会像char常量那样做算术提升,所以sizeof(L’a’)就等于sizeof(wchar_t)。在我在32位Windows和Linux平台下分别为2和4。
-
至于sizeof(L’ab’)、sizeof(L’中’)、sizeof(L’中国’)又会如何?
宽字符常量的单引号中出现多个字节构成的单个字符(如L’中’)是合法的,对它取sizeof,结果等于具体实现下的sizeof(wchar_t)。但出现多个字节构成的多个字符(如L’ab’、L’中国’)则是没有定义的,编译器可能报错,也可能给出不同的实现。在我测试的gcc4.0和VS2008中,L’abcd’分别返回了0x64和0x61。对它们取sizeof,结果等于具体实现下的sizeof(wchar_t),但注意这是标准未定义的,不应该确信。
另外,看到的关于sizeof的两个精巧的宏实现。
非数组的sizeof:
#defne _sizeof(T) ( (size_t)((T*)0 + 1))
数组的sizeof:
#define array_sizeof(T) ( (size_t)(&T+1) - (size_t)(&T) )
原理就是c/c++中的指针运算。