在PHP官網上看到一個浮點數BUG,測試代碼 。在SVN裏看了一下修復方法:在變量的聲明前加了個volatile關鍵字。不知道這個是什麼意思,特地去網上查了一下,找到了這篇文章,寫得不錯,轉載一下。php
volatile提醒編譯器它後面所定義的變量隨時都有可能改變,所以編譯後的程序每次須要存儲或讀取這個變量的時候,都會直接從變量地址中讀取數據。如 果沒有volatile關鍵字,則編譯器可能優化讀取和存儲,可能暫時使用寄存器中的值,若是這個變量由別的程序更新了的話,將出現不一致的現象。下面舉 例說明。在DSP開發中,常常須要等待某個事件的觸發,因此常常會寫出這樣的程序:
short flag;
void test()
{
do1();
while(flag==0);
do2();
}linux
這段程序等待內存變量flag的值變爲1(懷疑此處是0,有點疑問,)以後才運行do2()。變量flag的值由別的程序更改,這個程序多是某個硬件中 斷服務程序。例如:若是某個按鈕按下的話,就會對DSP產生中斷,在按鍵中斷程序中修改flag爲1,這樣上面的程序就可以得以繼續運行。可是,編譯器並 不知道flag的值會被別的程序修改,所以在它進行優化的時候,可能會把flag的值先讀入某個寄存器,而後等待那個寄存器變爲1。若是不幸進行了這樣的 優化,那麼while循環就變成了死循環,由於寄存器的內容不可能被中斷服務程序修改。爲了讓程序每次都讀取真正flag變量的值,就須要定義爲以下形 式:
volatile short flag;
須要注意的是,沒有volatile也可能能正常運行,可是可能修改了編譯器的優化級別以後就又不能正常運行了。所以常常會出現debug版本正常,可是 release版本卻不能正常的問題。因此爲了安全起見,只要是等待別的程序修改某個變量的話,就加上volatile關鍵字。
volatile的本意是「易變的」
因爲訪問寄存器的速度要快過RAM,因此編譯器通常都會做減小存取外部RAM的優化。好比:
static int i=0;
int main(void)
{
...
while (1)
{
if (i) do_something();
}
}
/* Interrupt service routine. */
void ISR_2(void)
{
i=1;
}
程序的本意是但願ISR_2中斷產生時,在main當中調用do_something函數,可是,因爲編譯器判斷在main函數裏面沒有修改過i,所以可 能只執行一次對從i到某寄存器的讀操做,而後每次if判斷都只使用這個寄存器裏面的「i副本」,致使do_something永遠也不會被調用。若是變量 加上volatile修飾,則編譯器保證對此變量的讀寫操做都不會被優化(確定執行)。此例中i也應該如此說明。
通常說來,volatile用在以下的幾個地方:
一、中斷服務程序中修改的供其它程序檢測的變量須要加volatile;
二、多任務環境下各任務間共享的標誌應該加volatile;
三、存儲器映射的硬件寄存器一般也要加volatile說明,由於每次對它的讀寫均可能由不一樣意義;
另外,以上這幾種狀況常常還要同時考慮數據的完整性(相互關聯的幾個標誌讀了一半被打斷了重寫),在1中能夠經過關中斷來實現,2中能夠禁止任務調度,3中則只能依靠硬件的良好設計了。
2、volatile 的含義
volatile老是與優化有關,編譯器有一種技術叫作數據流分析,分析程序中的變量在哪裏賦值、在哪裏使用、在哪裏失效,分析結果能夠用於常量合併,常量傳播等優化,進一步能夠死代碼消除。但有時這些優化不是程序所須要的,這時能夠用volatile關鍵字禁止作這些優化,volatile的字面含義是易變的,它有下面的做用:
1 不會在兩個操做之間把volatile變量緩存在寄存器中。在多任務、中斷、甚至setjmp環境下,變量可能被其餘的程序改變,編譯器本身沒法知道,volatile就是告訴編譯器這種狀況。
2 不作常量合併、常量傳播等優化,因此像下面的代碼:
volatile int i = 1;
if (i > 0) ...
if的條件不會看成無條件真。
3 對volatile變量的讀寫不會被優化掉。若是你對一個變量賦值但後面沒用到,編譯器經常能夠省略那個賦值操做,然而對Memory Mapped IO的處理是不能這樣優化的。
前面有人說volatile能夠保證對內存操做的原子性,這種說法不大準確,其一,x86須要LOCK前綴才能在SMP下保證原子性,其二,RISC根本不能對內存直接運算,要保證原子性得用別的方法,如atomic_inc。
對於jiffies,它已經聲明爲volatile變量,我認爲直接用jiffies++就能夠了,不必用那種複雜的形式,由於那樣也不能保證原子性。
你可能不知道在Pentium及後續CPU中,下面兩組指令
inc jiffies
;;
mov jiffies, %eax
inc %eax
mov %eax, jiffies
做用相同,但一條指令反而不如三條指令快。
3、編譯器優化 → C關鍵字volatile → memory破壞描述符zz程序員
「memory」比較特殊,多是內嵌彙編中最難懂部分。爲解釋清楚它,先介紹一下編譯器的優化知識,再看C關鍵字volatile。最後去看該描述符。
一、編譯器優化介紹
內存訪問速度遠不及CPU處理速度,爲提升機器總體性能,在硬件上引入硬件高速緩存Cache,加速對內存的訪問。另外在現代CPU中指令的執行並不一 定嚴格按照順序執行,沒有相關性的指令能夠亂序執行,以充分利用CPU的指令流水線,提升執行速度。以上是硬件級別的優化。再看軟件一級的優化:一種是在 編寫代碼時由程序員優化,另外一種是由編譯器進行優化。編譯器優化經常使用的方法有:將內存變量緩存到寄存器;調整指令順序充分利用CPU指令流水線,常見的是從新排序讀寫指令。對 常規內存進行優化的時候,這些優化是透明的,並且效率很好。由編譯器優化或者硬件從新排序引發的問題的解決辦法是在從硬件(或者其餘處理器)的角度看必須 以特定順序執行的操做之間設置內存屏障(memory barrier),linux 提供了一個宏解決編譯器的執行順序問題。
void Barrier(void)
這個函數通知編譯器插入一個內存屏障,但對硬件無效,編譯後的代碼會把當前CPU寄存器中的全部修改過的數值存入內存,須要這些數據的時候再從新從內存中讀出。
二、C語言關鍵字volatile
C語言關鍵字volatile(注意它是用來修飾變量而不是上面介紹的__volatile__)代表某個變量的值可能在外部被改變,所以對這些變量的 存取不能緩存到寄存器,每次使用時須要從新存取。該關鍵字在多線程環境下常用,由於在編寫多線程的程序時,同一個變量可能被多個線程修改,而程序經過 該變量同步各個線程,例如:
DWORD __stdcall threadFunc(LPVOID signal)
{
int* intSignal=reinterpret_cast<int*>(signal);
*intSignal=2;
while(*intSignal!=1)
sleep(1000);
return 0;
}
該線程啓動時將intSignal 置爲2,而後循環等待直到intSignal 爲1 時退出。顯然intSignal的值必須在外部被改變,不然該線程不會退出。可是實際運行的時候該線程卻不會退出,即便在外部將它的值改成1,看一下對應 的僞彙編代碼就明白了:
mov ax,signal
label:
if(ax!=1)
goto label
對於C編譯器來講,它並不知道這個值會被其餘線程修改。天然就把它cache在寄存器裏面。記住,C 編譯器是沒有線程概念的!這時候就須要用到volatile。volatile 的本意是指:這個值可能會在當前線程外部被改變。也就是說,咱們要在threadFunc中的intSignal前面加上volatile關鍵字,這時 候,編譯器知道該變量的值會在外部改變,所以每次訪問該變量時會從新讀取,所做的循環變爲以下面僞碼所示:
label:
mov ax,signal
if(ax!=1)
goto label
三、Memory
有了上面的知識就不難理解Memory修改描述符了,Memory描述符告知GCC:
1)不要將該段內嵌彙編指令與前面的指令從新排序;也就是在執行內嵌彙編代碼以前,它前面的指令都執行完畢
2)不要將變量緩存到寄存器,由於這段代碼可能會用到內存變量,而這些內存變量會以不可預知的方式發生改變,所以GCC插入必要的代碼先將緩存到寄存器的變量值寫回內存,若是後面又訪問這些變量,須要從新訪問內存。
若是彙編指令修改了內存,可是GCC 自己卻察覺不到,由於在輸出部分沒有描述,此時就須要在修改描述部分增長「memory」,告訴GCC 內存已經被修改,GCC 得知這個信息後,就會在這段指令以前,插入必要的指令將前面由於優化Cache 到寄存器中的變量值先寫回內存,若是之後又要使用這些變量再從新讀取。
使用「volatile」也能夠達到這個目的,可是咱們在每一個變量前增長該關鍵字,不如使用「memory」方便。緩存