1.編譯器優化介紹:linux
因爲內存訪問速度遠不及CPU處理速度,爲提升機器總體性能,在硬件上引入硬件高速緩存Cache,加速對內存的訪問。另外在現代CPU中指令的執行並不必定嚴格按照順序執行,沒有相關性的指令能夠亂序執行,以充分利用CPU的指令流水線,提升執行速度。以上是硬件級別的優化。再看軟件一級的優化:一種是在編寫代碼時由程序員優化,另外一種是由編譯器進行優化。編譯器優化經常使用的方法有:將內存變量緩存到寄存器;調整指令順序充分利用CPU指令流水線,常見的是從新排序讀寫指令。對常規內存進行優化的時候,這些優化是透明的,並且效率很好。由編譯器優化或者硬件從新排序引發的問題的解決辦法是在從硬件(或者其餘處理器)的角度看必須以特定順序執行的操做之間設置內存屏障(memory barrier),linux 提供了一個宏解決編譯器的執行順序問題。程序員
void Barrier(void)緩存
這個函數通知編譯器插入一個內存屏障,但對硬件無效,編譯後的代碼會把當前CPU寄存器中的全部修改過的數值存入內存,須要這些數據的時候再從新從內存中讀出。函數
2.volatile老是與優化有關,編譯器有一種技術叫作數據流分析,分析程序中的變量在哪裏賦值、在哪裏使用、在哪裏失效,分析結果能夠用於常量合併,常量傳播等優化,進一步能夠消除一些代碼。但有時這些優化不是程序所須要的,這時能夠用volatile關鍵字禁止作這些優化。性能
1.volatile的本意是「易變的」 由於訪問寄存器要比訪問內存單元快的多,因此編譯器通常都會做減小存取內存的優化,但有可能會讀髒數據。當要求使用volatile聲明變量值的時候,系統老是從新從它所在的內存讀取數據,即便它前面的指令剛剛從該處讀取過數據。精確地說就是,遇到這個關鍵字聲明的變量,編譯器對訪問該變量的代碼就再也不進行優化,從而能夠提供對特殊地址的穩定訪問;若是不使用valatile,則編譯器將對所聲明的語句進行優化。(簡潔的說就是:volatile關鍵詞影響編譯器編譯的結果,用volatile聲明的變量表示該變量隨時可能發生變化,與該變量有關的運算,不要進行編譯優化,以避免出錯)優化
2.看兩個事例:spa
1>告訴compiler不能作任何優化線程
好比要往某一地址送兩指令:
int *ip =...; //設備地址
*ip = 1; //第一個指令
*ip = 2; //第二個指令
以上程序compiler可能作優化而成:
int *ip = ...;
*ip = 2;
結果第一個指令丟失。若是用volatile, compiler就不容許作任何的優化,從而保證程序的原意:
volatile int *ip = ...;
*ip = 1;
*ip = 2;
即便你要compiler作優化,它也不會把兩次付值語句間化爲一。它只能作其它的優化。設計
2>用volatile定義的變量會在程序外被改變,每次都必須從內存中讀取,而不能重複使用放在cache或寄存器中的備份。指針
例如:
volatile char a;
a=0;
while(!a){
//do some things;
}
doother();
若是沒有 volatiledoother()不會被執行
3.下面是使用volatile變量的幾個場景:
1>中斷服務程序中修改的供其它程序檢測的變量須要加volatile;
例如:
static int i=0;
int main(void)
{
if (i) dosomething();
}
}
void ISR_2(void)
{
}
程序的本意是但願ISR_2中斷產生時,在main函數中調用dosomething函數,可是,因爲編譯器判斷在main函數裏面沒有修改過i,所以可能只執行一次對從i到某寄存器的讀操做,而後每次if判斷都只使用這個寄存器裏面的「i副本」,致使dosomething永遠也不會被調用。若是將變量加上volatile修飾,則編譯器保證對此變量的讀寫操做都不會被優化(確定執行)。此例中i也應該如此說明。
2>多任務環境下各任務間共享的標誌應該加volatile
3>存儲器映射的硬件寄存器一般也要加voliate,由於每次對它的讀寫均可能有不一樣意義。
例如:
假設要對一個設備進行初始化,此設備的某一個寄存器爲0xff800000。
int
int
{
}
}
通過編譯器優化後,編譯器認爲前面循環半天都是廢話,對最後的結果毫無影響,由於最終只是將output這個指針賦值爲9,因此編譯器最後給你編譯編譯的代碼結果至關於:
int
{
}
若是你對此外部設備進行初始化的過程是必須是像上面代碼同樣順序的對其賦值,顯然優化過程並不能達到目的。反之若是你不是對此端口反覆寫操做,而是反覆讀操做,其結果是同樣的,編譯器在優化後,也許你的代碼對此地址的讀操做只作了一次。然而從代碼角度看是沒有任何問題的。這時候就該使用volatile通知編譯器這個變量是一個不穩定的,在遇到此變量時候不要優化。
例如:
volatile
另外,以上這幾種狀況常常還要同時考慮數據的完整性(相互關聯的幾個標誌讀了一半被打斷了重寫),在1中能夠經過關中斷來實現,2中禁止任務調度,3中則只能依靠硬件的良好設計。
4.幾個問題
能夠的,例如只讀的狀態寄存器。它是volatile由於它可能被意想不到地改變。它是const由於程序不該該試圖去修改它。
2) 一個指針能夠是volatile 嗎?
能夠,當一箇中服務子程序修該一個指向一個buffer的指針時。
5.volatile的本質:
1> 編譯器的優化
在本次線程內, 當讀取一個變量時,爲提升存取速度,編譯器優化時有時會先把變量讀取到一個寄存器中;之後,再取變量值時,就直接從寄存器中取值;當變量值在本線程裏改變時,會同時把變量的新值copy到該寄存器中,以便保持一致。
當變量在因別的線程等而改變了值,該寄存器的值不會相應改變,從而形成應用程序讀取的值和實際的變量值不一致。
當該寄存器在因別的線程等而改變了值,原變量的值不會改變,從而形成應用程序讀取的值和實際的變量值不一致。
2>volatile應該解釋爲「直接存取原始內存地址」比較合適,「易變的」這種解釋簡直有點誤導人。
6.下面的函數有什麼錯誤:
int square(volatile int *ptr)
{
return *ptr * *ptr;
}
該程序的目的是用來返指針*ptr指向值的平方,可是,因爲*ptr指向一個volatile型參數,編譯器將產生相似下面的代碼:
int square(volatile int *ptr)
{
int a,b;
a = *ptr;
b = *ptr;
return a * b;
}
因爲*ptr的值可能被意想不到地該變,所以a和b多是不一樣的。結果,這段代碼可能返不是你所指望的平方值!正確的代碼以下:
long square(volatile int *ptr)
{
int a;
a = *ptr;
return a * a;
}
注意:頻繁地使用volatile極可能會增長代碼尺寸和下降性能,所以要合理的使用volatile。