在c語言算術表達式的編譯過程中,有一個“尋常算術轉換”的問題,大多數情況下,教材中并沒有做具體的有意義的說明,在實際應用中,如果不注意這個問題,可能會產生嚴重的后果!一下以實例做一個說明,希望引起大家的注意。
1、C語言算術表達式“尋常算術轉換”
由于“歷史”(搞笑,C語言弄出來不過幾十年而已,好意思談歷史?)的原因,C語言算術表達式在編譯過程中會對參入運算的對象做“尋常算術轉換”,按照ANSIC標準的說法,大致的描述是這樣的:
當執行算術運算時,如果操作對象的類型不同,就會發生數據類型轉換。對于雙目運算符而言,兩個運算對象的類型都轉換為精度高的那個對象的類型。數據類型轉換的一般規則是:浮點朝著精度更高、長度更長的方向轉換,整型(char,short,int)運算對象如果轉換為signed int類型不會丟失信息,就轉換為signed int類型,否則轉換為 unsigned int類型(詳細表述請參考ANSIC規范)。
嚴重建議你注意:整型運算對象(char,short,int)的轉換規則!由于在很多系統中,long類型與int類型長度不同,比如在C51中,long是32位的,而int是16位的,就有可能因“想當然”而出現錯誤!在C51編譯環境KEIL里,仿真運行下面的例子,x==?
unsigned long x=0x00123456;
x |= (0xe8<<24);
... ...
想當然的結論:x==0xe8123456
想當然的"當然":“x |= (0xe8<<24);”等價于“x =x | (0xe8<<24);”,按照“尋常算術轉換”規則,0xe8被轉換為unsigned long類型了,所以x==0xe8123456
但實際上上述結論是錯誤的。正確的結論是:x==0x00123456
原因分析:C編譯器首先考慮的是子算術表達式(子表達式也是表達式)“(0xe8<<24)”!雙目運算符“<<”的兩個運算
對象都是“沒有顯式類型說明的”常數,于是按照“整型(char,short,int)運算對象如果轉換為signed int類型不會丟失信息,就轉換為signed int類型,否則轉換為 unsigned int類型”的規則,0xe8轉換為16位的0000 0000 11101000B,左移24位以后就變成0000 0000 0000 0000B了!
然后這個16位全0的數與32位的x做 “|”運算, 16位全0轉換為24位全0而已!
假定希望把一個字節常量0xe8“裝配”到32位的x最高8位上,正確的做法應該是怎么樣的呢?這樣寫就行了:
unsigned long x=0x00123456;
x |= ((unsigned long)0xe8<<24);
或者,幾乎沒有可移植性的寫法(顯然也就嚴重的不推薦!!!!)
unsigned long x=0x00123456;
x |= (0xppppqqe8<<24); //0xpppp=0x0001~0xffff, 0xqq=0x00~0xff
說明一下這個嚴重不推薦的寫法以說明問題的本質:
0xppppqqe8的形式,最小的數是0x000100e8,最大的數是0xffffffe8,不管咋樣,在C51里都必須用32位表示才行,所以<<24不會變成0了!
以下是從前日志里一個實際的例子,用于2M字節Flash芯片的讀訪問,其中的變量address是unsigned long類型的,它的低端三個字節用于存放字節地址,最高端字節存放“連續讀”命令0xe8。
void Flash_Read(ulong address, char* buf, uint nbytes)
{
uchar i;
AT45161_CLK = 1;
AT45161_CS(0);
address |= ((ulong)0xE8<<24); //注意ulong強制類型轉換!
for(i=0; i<4; i++) //4字節命令/地址
Flash_Byte_Write((address>>(24-8*i))&0xff);
for(i=0; i<4; i++) Flash_Byte_Write(0xff); //4字節填充位
while(nbytes--) Flash_Byte_Read(buf++);
AT45161_CS(1);
}
參考文獻:C專家編程(Expert C Programming) 【美】Peter Van Der Linden 人郵出版社
|