前言:這是一年前我爲公司內部寫的一個文檔,旨在向年輕的嵌入式軟件工程師們介紹如何在裸機環境下編寫優質嵌入式C程序。感受是有必定的參考價值,因此拿出來分享,拋磚引玉。java
轉載請註明出處:http://blog.csdn.net/zhzht19861011/article/details/45508029程序員
摘要:本文首先分析了C語言的陷阱和缺陷,對容易犯錯的地方進行概括整理;分析了編譯器語義檢查的不足之處並給出防範措施,以Keil MDK編譯器爲例,介紹了該編譯器的特性、對未定義行爲的處理以及一些高級應用;在此基礎上,介紹了防護性編程的概念,提出了編程過程當中就應該防範於未然的多種措施;提出了測試對編寫優質嵌入式程序的重要做用以及經常使用測試方法;最後,本文試圖以更高的層次看待編程,討論一些通用的編程思想。算法
市面上介紹C語言以及編程方法的書數目繁多,但對如何編寫優質嵌入式C程序卻鮮有介紹,特別是對應用於單片機、ARM七、Cortex-M3這類微控制器上的優質C程序編寫方法幾乎是個空白。本文面向的,正是使用單片機、ARM七、Cortex-M3這類微控制器的底層編程人員。編程
編寫優質嵌入式C程序絕非易事,它跟設計者的思惟和經驗積累關係密切。嵌入式C程序員不只須要熟知硬件的特性、硬件的缺陷等,更要深刻一門語言編程,不浮於表面。爲了更方便的操做硬件,還須要對編譯器進行深刻的瞭解。數組
本文將從語言特性、編譯器、防護性編程、測試和編程思想這幾個方面來討論如何編寫優質嵌入式C程序。與不少雜誌、書籍不一樣,本文提供大量真實實例、代碼段和參考書目,不只介紹應該作什麼,還重點介紹如何作、以及爲何這樣作。編寫優質嵌入式C程序涉及面十分廣,須要程序員長時間的經驗積累,本文但願能縮短這一過程。xcode
語言是編程的基石,C語言詭異且有種種陷阱和缺陷,須要程序員多年曆練才能達到較爲完善的地步。雖然有衆多書籍、雜誌、專題討論過C語言的陷阱和缺陷,但這並不影響本節再次討論它。老是有大批的初學者,前仆後繼的倒在這些陷阱和缺陷上,民用設備、工業設備甚至是航天設備都不例外。本節將結合具體例子再次審視它們,但願引發足夠重視。深刻理解C語言特性,是編寫優質嵌入式C程序的基礎。緩存
1) 「=」和」==」安全
將比較運算符」==」誤寫成賦值運算符」=」,多是絕大多數人都遇到過的,好比下面代碼:性能優化
代碼的本意是比較變量x是否等於常量5,可是誤將」==」寫成了」=」,if語句恆爲真。若是在邏輯判斷表達式中出現賦值運算符,如今的大多數編譯器會給出警告信息。好比keil MDK會給出警告提示:「warning: #187-D: use of "=" where"==" may have been intended」,但並不是全部程序員都會注意到這類警告,所以有經驗的程序員使用下面的代碼來避免此類錯誤:網絡
將常量放在變量x的左邊,即便程序員誤將’==’寫成了’=’,編譯器會產生一個任誰也不能無視的語法錯誤信息:不可給常量賦值!
2) 複合賦值運算符
複合賦值運算符(+=、*=等等)雖然能夠使表達式更加簡潔並有可能產生更高效的機器代碼,但某些複合賦值運算符也會給程序帶來隱含Bug,好比」+=」容易誤寫成」=+」,代碼以下:
代碼本意是想表達tmp=tmp+1,可是將複合賦值運算符」+=」誤寫成」=+」:將正整數常量1賦值給變量tmp。編譯器會欣然接受這類代碼,連警告都不會產生。
若是你能在調試階段就發現這個Bug,真應該慶祝一下,不然這極可能會成爲一個重大隱含Bug,且不易被察覺。
複合賦值運算符」-=」也有相似問題存在。
3) 其它容易誤寫
這些誤寫其實容易被編譯器檢測出,只須要關注編譯器對此的提示信息,就能很快解決。
不少的軟件Bug源自於輸入錯誤。在Google上搜索的時候,有些結果列表項中帶有一條警告,代表Google認爲它帶有惡意代碼。若是你在2009年1月31日一大早使用Google搜索的話,你就會看到,在那天早晨55分鐘的時間內,Google的搜索結果標明每一個站點對你的PC都是有害的。這涉及到整個Internet上的全部站點,包括Google本身的全部站點和服務。Google的惡意軟件檢測功能經過在一個已知攻擊者的列表上查找站點,從而識別出危險站點。在1月31日早晨,對這個列表的更新意外地包含了一條斜槓(「/」)。全部的URL都包含一條斜槓,而且,反惡意軟件功能把這條斜槓理解爲全部的URL都是可疑的,所以,它愉快地對搜索結果中的每一個站點都添加一條警告。不多見到如此簡單的一個輸入錯誤帶來的結果如此奇怪且影響如此普遍,但程序就是這樣,容不得一絲疏忽。
數組經常也是引發程序不穩定的重要因素,C語言數組的迷惑性與數組下標從0開始密不可分,你能夠定義int test[30],可是你毫不能夠使用數組元素test [30],除非你本身明確知道在作什麼。
1) 不能漏加的break
switch…case語句能夠很方便的實現多分支結構,但要注意在合適的位置添加break關鍵字。程序員每每容易漏加break從而引發順序執行多個case語句,這也許是C的一個缺陷之處。
對於switch…case語句,從機率論上說,絕大多數程序一次只需執行一個匹配的case語句,而每個這樣的case語句後都必須跟一個break。去複雜化大機率事件,這多少有些不合常情。
2) 不能亂加的break
break關鍵字用於跳出最近的那層循環語句或者switch語句,但程序員每每不夠重視這一點。
1990年1月15日,AT&T電話網絡位於紐約的一臺交換機宕機而且重啓,引發它鄰近交換機癱瘓,由此及彼,一個連着一個,很快,114臺交換機每六秒宕機重啓一次,六萬人九小時內不能打長途電話。當時的解決方式:工程師重裝了之前的軟件版本。。。過後的事故調查發現,這是break關鍵字誤用形成的。《C專家編程》提供了一個簡化版的問題源碼:
那個程序員但願從if語句跳出,但他卻忘記了break關鍵字實際上跳出最近的那層循環語句或者switch語句。如今它跳出了switch語句,執行了use_modes_pointer()函數。但必要的初始化工做並未完成,爲未來程序的失敗埋下了伏筆。
將一個整形常量賦值給變量,代碼以下所示:
變量a和b相等嗎?
答案是不相等的。咱們知道,16進制常量以’0x’爲前綴,10進制常量不須要前綴,那麼8進制呢?它與10進制和16進製表示方法都不相通,它以數字’0’爲前綴,這多少有點奇葩:三種進制的表示方法徹底不相通。若是8進制也像16進制那樣以數字和字母表示前綴的話,或許更有利於減小軟件Bug,畢竟你使用8進制的次數可能都不會有誤使用的次數多!下面展現一個誤用8進制的例子,最後一個數組元素賦值錯誤:
指針的加減運算是特殊的。下面的代碼運行在32位ARM架構上,執行以後,a和p的值分別是多少?
對於a的值很容判斷出結果爲2,可是p的結果倒是0x00001004。指針p加1後,p的值增長了4,這是爲何呢?緣由是指針作加減運算時是以指針的數據類型爲單位。p+1其實是按照公式p+1*sizeof(int)來計算的。不理解這一點,在使用指針直接操做數據時極易犯錯。
某項目使用下面代碼對連續RAM初始化零操做,但運行發現有些RAM並無被真正清零。
經過分析咱們發現,因爲pRAMaddr是一個無符號int型指針變量,因此pRAMaddr+=4代碼其實使pRAMaddr偏移了4*sizeof(int)=16個字節,因此每執行一次for循環,會使變量pRAMaddr偏移16個字節空間,但只有4字節空間被初始化爲零。其它的12字節數據的內容,在大多數架構處理器中都會是隨機數。
不知道有多少人最初認爲sizeof是一個函數。其實它是一個關鍵字,其做用是返回一個對象或者類型所佔的內存字節數,對絕大多數編譯器而言,返回值爲無符號整形數據。須要注意的是,使用sizeof獲取數組長度時,不要對指針應用sizeof操做符,好比下面的例子:
咱們知道,對於一個數組array[20],咱們使用代碼sizeof(array)/sizeof(array[0])能夠得到數組的元素(這裏爲20),但數組名和指針每每是容易混淆的,有且只有一種狀況下數組名是能夠當作指針的,那就是數組名做爲函數形參時,數組名被認爲是指針,同時,它不能再兼任數組名。注意只有這種狀況下,數組名才能夠當作指針,但不幸的是這種狀況下容易引起風險。在ClearRAM函數內,做爲形參的array[]再也不是數組名了,而成了指針。sizeof(array)至關於求指針變量佔用的字節數,在32位系統下,該值爲4,sizeof(array)/sizeof(array[0])的運算結果也爲4。因此在main函數中調用ClearRAM(Fle),也只能清除數組Fle中的前四個元素了。
增量運算符」++」和減量運算符」--「既能夠作前綴也能夠作後綴。前綴和後綴的區別在於值的增長或減小這一動做發生的時間是不一樣的。做爲前綴是先自加或自減而後作別的運算,做爲後綴時,是先作運算,以後再自加或自減。許多程序員對此認識不夠,就容易埋下隱患。下面的例子能夠很好的解釋前綴和後綴的區別。
代碼執行後,y的值是多少?
這個例子並不是是挖空心思設計出來專門讓你絞盡腦汁的C難題(若是你以爲本身對C細節掌握頗有信心,作一些C難題檢驗一下是個不錯的選擇。那麼,《The C Puzzle Book》這本書必定不要錯過),你甚至能夠將這個難懂的語句做爲不友好代碼的例子。可是它也可讓你更好的理解C語言。根據運算符優先級以及編譯器識別字符的貪心法原則,第二句代碼能夠寫成更明確的形式:
當賦值給變量y時,a的值爲8,b的值爲1,因此變量y的值爲9;賦值完成後,變量a自加,a的值變爲9,千萬不要覺得y的值爲10。這條賦值語句至關於下面的兩條語句:
爲了提升系統效率,邏輯與和邏輯或操做的規定以下:若是對第一個操做數求值後就能夠推斷出最終結果,第二個操做數就不會進行求值!好比下面代碼:
在這個代碼中,只有當i>=0時,i++纔會被執行。這樣,i是否自增是不夠明確的,這可能會埋下隱患。邏輯或與之相似。
結構體可能產生填充,由於對大多數處理器而言,訪問按字或者半字對齊的數據速度更快,當定義結構體時,編譯器爲了性能優化,可能會將它們按照半字或字對齊,這樣會帶來填充問題。好比如下兩個個結構體:
第一個結構體:
第二個結構體:
這兩個結構體元素都是相同的變量,只是元素換了下位置,那麼這兩個結構體變量佔用的內存大小相同嗎?
其實這兩個結構體變量佔用的內存是不一樣的,對於Keil MDK編譯器,默認狀況下第一個結構體變量佔用8個字節,第二個結構體佔用12個字節,差異很大。第一個結構體變量在內存中的存儲格式如圖2-1所示:
圖2-1:結構體變量1內存分佈
第二個結構體變量在內存中的存儲格式如圖2-2所示。對比兩個圖能夠看出MDK編譯器是是怎麼將數據對齊的,這其中的填充內容是以前內存中的數據,是隨機的,因此不能再結構之間逐字節比較;另外,合理的排布結構體內的元素位置,能夠最大限度減小填充,節省RAM。
圖2-2 :結構體變量2內存分佈
C語言有32個關鍵字,卻有34個運算符。要記住全部運算符的優先級是困難的。稍不注意,你的代碼邏輯和實際執行就會有很大出入。
好比下面將BCD碼轉換爲十六進制數的代碼:
這裏uTimeValue存放的BCD碼,想要轉換成16進制數據,實際運行發現,若是uTimeValue的值爲0x23,按照我設定的邏輯,result的值應該是0x17,但運算結果倒是0x07。通過種種排查後,才發現’+’的優先級是大於’&’的,至關於(uTimeValue>>4)*10+uTimeValue與0x0F位與,結果天然與邏輯不符。符合邏輯的代碼應該是:
不合理的#define會加劇優先級問題,讓問題變得更加隱蔽。
編譯器在編譯後將宏帶入,原代碼語句變爲:
運算符'=='的優先級是大於'&'的,代碼IO0PIN&(1<<11) ==(1<<11))等效爲IO0PIN&0x00000001:判斷端口P0.0是否爲高電平,這與原意相差甚遠。所以,使用宏定義的時候,最好將被定義的內容用括號括起來。
按照常規方式使用時,可能引發誤會的運算符還有不少,如表2-1所示。C語言的運算符固然不會只止步於數目繁多!
有一個簡便方法能夠避免優先級問題:不清楚的優先級就加上」()」,但這樣至少有會帶來兩個問題:
不管如何,在嵌入式編程方面,該掌握的基礎知識,偷巧不得。建議花一些時間,將優先級順序以及容易出錯的優先級運算符理清幾遍。
C語言的設計理念一直被人吐槽,由於它認爲C程序員徹底清楚本身在作什麼,其中一個證據就是隱式轉換。C語言規定,不一樣類型的數據(好比char和int型數據)須要轉換成同一類型後,纔可進行計算。若是你混合使用類型,好比用char類型數據和int類型數據作減法,C使用一個規則集合來自動(隱式的)完成類型轉換。這可能很方便,但也很危險。
這就要求咱們理解這個轉換規則而且能應用到程序中去!
1) 當出如今表達式裏時,有符號和無符號的char和short類型都將自動被轉換爲int類型,在須要的狀況下,將自動被轉換爲unsigned int(在short和int具備相同大小時)。這稱爲類型提高。
提高在算數運算中一般不會有什麼大的壞處,但若是位運算符 ~ 和 << 應用在基本類型爲unsigned char或unsigned short 的操做數,結果應該當即強制轉換爲unsigned char或者unsigned short類型(取決於操做時使用的類型)。
假如咱們不瞭解表達式裏的類型提高,認爲在運算過程當中變量port一直是unsigned char類型的。咱們來看一下運算過程:~port結果爲0xa5,0xa5>>4結果爲0x0a,這是咱們指望的值。但實際上,result_8的結果倒是0xfa!在ARM結構下,int類型爲32位。變量port在運算前被提高爲int類型:~port結果爲0xffffffa5,0xa5>>4結果爲0x0ffffffa,賦值給變量result_8,發生類型截斷(這也是隱式的!),result_8=0xfa。通過這麼詭異的隱式轉換,結果跟咱們指望的值,已經截然不同!正確的表達式語句應該爲:
2) 在包含兩種數據類型的任何運算裏,兩個值都會被轉換成兩種類型裏較高的級別。類型級別從高到低的順序是long double、double、float、unsigned long long、long long、unsigned long、long、unsigned int、int。
這種類型提高一般都是件好事,但每每有不少程序員不能真正理解這句話,好比下面的例子(int類型表示16位)。
u32x和u32y的結果都是4464(70000%65536)!不要認爲表達式中有一個高類別uint32_t類型變量,編譯器都會幫你把全部其餘低類別都提高到uint32_t類型。正確的書寫方式:
後一種寫法在本表達式中是正確的,可是在其它表達式中不必定正確,好比:
3) 在賦值語句裏,計算的最後結果被轉換成將要被賦予值的那個變量的類型。這一過程可能致使類型提高也可能致使類型降級。降級可能會致使問題。好比將運算結果爲321的值賦值給8位char類型變量。程序必須對運算時的數據溢出作合理的處理。不少其餘語言,像Pascal(C語言設計者之一曾撰文狠狠批評過Pascal語言),都不容許混合使用類型,但C語言不會限制你的自由,即使這常常引發Bug。
4) 看成爲函數的參數被傳遞時,char和short會被轉換爲int,float會被轉換爲double。
當不得已混合使用類型時,一個比較好的習慣是使用類型強制轉換。強制類型轉換能夠避免編譯器隱式轉換帶來的錯誤,同時也向之後的維護人員傳遞一些有用信息。這有個前提:你要對強制類型轉換有足夠的瞭解!下面總結一些規則:
若是你和一個優秀的程序員共事,你會發現他對他使用的工具很是熟悉,就像一個畫家瞭解他的畫具同樣。----比爾.蓋茨
編譯器的語義檢查很弱小,甚至還會「掩蓋」錯誤。現代的編譯器設計是件浩瀚的工程,爲了讓編譯器設計簡單一些,目前幾乎全部編譯器的語義檢查都比較弱小。爲了得到更快的執行效率,C語言被設計的足夠靈活且幾乎不進行任何運行時檢查,好比數組越界、指針是否合法、運算結果是否溢出等等。這就形成了不少編譯正確但執行奇怪的程序。
C語言足夠靈活,對於一個數組test[30],它容許使用像test[-1]這樣的形式來快速獲取數組首元素所在地址前面的數據;容許將一個常數強制轉換爲函數指針,使用代碼(*((void(*)())0))()來調用位於0地址的函數。C語言給了程序員足夠的自由,但也由程序員承擔濫用自由帶來的責任。
下面的兩個例子都是死循環,若是在不經常使用分支中出現相似代碼,將會形成看似莫名其妙的死機或者重啓。
對於無符號char類型,表示的範圍爲0~255,因此無符號char類型變量i永遠小於256(第一個for循環無限執行),永遠大於等於0(第二個for循環無線執行)。須要說明的是,賦值代碼i=256是被C語言容許的,即便這個初值已經超出了變量i能夠表示的範圍。C語言會想方設法的爲程序員創造出錯的機會,可見一斑。
假如你在if語句後誤加了一個分號,可能會徹底改變了程序邏輯。編譯器也會很配合的幫忙掩蓋,甚至連警告都不提示。代碼以下:
不但如此,編譯器還會忽略掉多餘的空格符和換行符,就像下面的代碼也不會給出足夠提示:
這段代碼的本意是n<3時程序直接返回,因爲程序員的失誤,return少了一個結束分號。編譯器將它翻譯成返回表達式logrec.data=x[0]的結果,return後面即便是一個表達式也是C語言容許的。這樣當n>=3時,表達式logrec.data=x[0];就不會被執行,給程序埋下了隱患。
上文曾提到數組經常是引發程序不穩定的重要因素,程序員每每不經意間就會寫數組越界。
一位同事的代碼在硬件上運行,一段時間後就會發現LCD顯示屏上的一個數字不正常的被改變。通過一段時間的調試,問題被定位到下面的一段代碼中:
這裏聲明瞭擁有30個元素的數組,不幸的是for循環代碼中誤用了本不存在的數組元素SensorData[30],但C語言卻默許這麼使用,並欣然的按照代碼改變了數組元素SensorData[30]所在位置的值, SensorData[30]所在的位置本來是一個LCD顯示變量,這正是顯示屏上的那個值不正常被改變的緣由。真慶幸這麼垂手可得的發現了這個Bug。
其實不少編譯器會對上述代碼產生一個警告:賦值超出數組界限。但並不是全部程序員都對編譯器警告保持足夠敏感,何況,編譯器也並不能檢查出數組越界的全部狀況。好比下面的例子:
你在模塊A中定義數組:
在模塊B中引用該數組,但因爲你引用代碼並不規範,這裏沒有顯示聲明數組大小,但編譯器也容許這麼作:
此次,編譯器不會給出警告信息,由於編譯器壓根就不知道數組的元素個數。因此,當一個數組聲明爲具備外部連接,它的大小應該顯式聲明。
再舉一個編譯器檢查不出數組越界的例子。函數func()的形參是一個數組形式,函數代碼簡化以下所示:
這個給SensorData[30]賦初值的語句,編譯器也是不給任何警告的。實際上,編譯器是將數組名Sensor隱含的轉化爲指向數組第一個元素的指針,函數體是使用指針的形式來訪問數組的,它固然也不會知道數組元素的個數了。形成這種局面的緣由之一是C編譯器的做者們認爲指針代替數組能夠提升程序效率,並且,能夠簡化編譯器的複雜度。
指針和數組是容易給程序形成混亂的,咱們有必要仔細的區分它們的不一樣。其實換一個角度想一想,它們也是容易區分的:能夠將數組名等同於指針的狀況有且只有一處,就是上面例子提到的數組做爲函數形參時。其它時候,數組名是數組名,指針是指針。
下面的例子編譯器一樣檢查不出數組越界。
咱們經常用數組來緩存通信中的一幀數據。在通信中斷中將接收的數據保存到數組中,直到一幀數據徹底接收後再進行處理。即便定義的數組長度足夠長,接收數據的過程當中也可能發生數組越界,特別是干擾嚴重時。這是因爲外界的干擾破壞了數據幀的某些位,對一幀的數據長度判斷錯誤,接收的數據超出數組範圍,多餘的數據改寫與數組相鄰的變量,形成系統崩潰。因爲中斷事件的異步性,這類數組越界編譯器沒法檢查到。
若是局部數組越界,可能引起ARM架構硬件異常。
同事的一個設備用於接收無線傳感器的數據,一次軟件升級後,發現接收設備工做一段時間後會死機。調試代表ARM7處理器發生了硬件異常,異常處理代碼是一段死循環(死機的直接緣由)。接收設備有一個硬件模塊用於接收無線傳感器的整包數據並存在本身的緩衝區中,當硬件模塊接收數據完成後,使用外部中斷通知設備取數據,外部中斷服務程序精簡後以下所示:
因爲存在多個無線傳感器近乎同時發送數據的可能加之GetData()函數保護力度不夠,數組DataBuf在取數據過程當中發生越界。因爲數組DataBuf爲局部變量,被分配在堆棧中,同在此堆棧中的還有中斷髮生時的運行環境以及中斷返回地址。溢出的數據將這些數據破壞掉,中斷返回時PC指針可能變成一個不合法值,硬件異常由此產生。
若是咱們精心設計溢出部分的數據,化數據爲指令,就能夠利用數組越界來修改PC指針的值,使之指向咱們但願執行的代碼。
1988年,第一個網絡蠕蟲在一天以內感染了2000到6000臺計算機,這個蠕蟲程序利用的正是一個標準輸入庫函數的數組越界Bug。原由是一個標準輸入輸出庫函數gets(),原來設計爲從數據流中獲取一段文本,遺憾的是,gets()函數沒有規定輸入文本的長度。gets()函數內部定義了一個500字節的數組,攻擊者發送了大於500字節的數據,利用溢出的數據修改了堆棧中的PC指針,從而獲取了系統權限。目前,雖然有更好的庫函數來代替gets函數,但gets函數仍然存在着。
作嵌入式設備開發,若是不對volatile修飾符具備足夠了解,實在是說不過去。volatile是C語言32個關鍵字中的一個,屬於類型限定符,經常使用的const關鍵字也屬於類型限定符。
volatile限定符用來告訴編譯器,該對象的值無任何持久性,不要對它進行任何優化;它迫使編譯器每次須要該對象數據內容時都必須讀該對象,而不是隻讀一次數據並將它放在寄存器中以便後續訪問之用(這樣的優化能夠提升系統速度)。
這個特性在嵌入式應用中頗有用,好比你的IO口的數據不知道何時就會改變,這就要求編譯器每次都必須真正的讀取該IO端口。這裏使用了詞語「真正的讀」,是由於因爲編譯器的優化,你的邏輯反應到代碼上是對的,可是代碼通過編譯器翻譯後,有可能與你的邏輯不符。你的代碼邏輯多是每次都會讀取IO端口數據,但實際上編譯器將代碼翻譯成彙編時,可能只是讀一次IO端口數據並保存到寄存器中,接下來的屢次讀IO口都是使用寄存器中的值來進行處理。由於讀寫寄存器是最快的,這樣能夠優化程序效率。與之相似的,中斷裏的變量、多線程中的共享變量等都存在這樣的問題。
不使用volatile,可能形成運行邏輯錯誤,可是沒必要要的使用volatile會形成代碼效率低下(編譯器不優化volatile限定的變量),所以清楚的知道何處該使用volatile限定符,是一個嵌入式程序員的必修內容。
一個程序模塊一般由兩個文件組成,源文件和頭文件。若是你在源文件定義變量:
並在頭文件中聲明該變量:
編譯器會提示一個語法錯誤:變量’ test’聲明類型不一致。但若是你在源文件定義變量:
在頭文件中這樣聲明變量:
編譯器卻不會給出錯誤信息(有些編譯器僅給出一條警告)。當你在另一個模塊(該模塊包含聲明變量test的頭文件)使用變量test時,它已經再也不具備volatile限定,這樣極可能形成一些重大錯誤。好比下面的例子,注意該例子是爲了說明volatile限定符而專門構造出的,由於現實中的volatile使用Bug大都隱含,而且難以理解。
在模塊A的源文件中,定義變量:
該變量用來在一個定時器中斷服務程序中進行軟件計時:
在模塊A的頭文件中,聲明變量:
在模塊B中,要使用TimerCount變量進行精確的軟件延時:
實際上,這是一個死循環。因爲模塊A頭文件中聲明變量TimerCount時漏掉了volatile限定符,在模塊B中,變量TimerCount是被看成unsigned int類型變量。因爲寄存器速度遠快於RAM,編譯器在使用非volatile限定變量時是先將變量從RAM中拷貝到寄存器中,若是同一個代碼塊再次用到該變量,就再也不從RAM中拷貝數據而是直接使用以前寄存器備份值。代碼while(TimerCount<=TIMER_VALUE)中,變量TimerCount僅第一次執行時被使用,以後都是使用的寄存器備份值,而這個寄存器值一直爲0,因此程序無限循環。圖3-1的流程圖說明了程序使用限定符volatile和不使用volatile的執行過程。
爲了更容易的理解編譯器如何處理volatile限定符,這裏給出未使用volatile限定符和使用volatile限定符程序的反彙編代碼:
能夠看到,若是沒有使用volatile關鍵字,程序一直比較R0內數據與0xC8是否相等,但R0中的數據是0,因此程序會一直在這裏循環比較(死循環);再看使用了volatile關鍵字的反彙編代碼,程序會先從變量中讀出數據放到R1寄存器中,而後再讓R1內數據與0xC8相比較,這纔是咱們C代碼的正確邏輯!
ARM架構下的編譯器會頻繁的使用堆棧,堆棧用於存儲函數的返回值、AAPCS規定的必須保護的寄存器以及局部變量,包括局部數組、結構體、聯合體和C++的類。默認狀況下,堆棧的位置、初始值都是由編譯器設置,所以須要對編譯器的堆棧有必定了解。從堆棧中分配的局部變量的初值是不肯定的,所以須要運行時顯式初始化該變量。一旦離開局部變量的做用域,這個變量當即被釋放,其它代碼也就能夠使用它,所以堆棧中的一個內存位置可能對應整個程序的多個變量。
局部變量必須顯式初始化,除非你肯定知道你要作什麼。下面的代碼獲得的溫度值跟預期會有很大差異,由於在使用局部變量sum時,並不能保證它的初值爲0。編譯器會在第一次運行時清零堆棧區域,這加劇了此類Bug的隱蔽性。
因爲一旦程序離開局部變量的做用域即被釋放,因此下面代碼返回指向局部變量的指針是沒有實際意義的,該指針指向的區域可能會被其它程序使用,其值會被改變。
因爲編譯器的語義檢查比較弱,咱們能夠使用第三方代碼分析工具,使用這些工具來發現潛在的問題,這裏介紹其中比較著名的是PC-Lint。
PC-Lint由Gimpel Software公司開發,能夠檢查C代碼的語法和語義並給出潛在的BUG報告。PC-Lint能夠顯著下降調試時間。
目前公司ARM7和Cortex-M3內核可能是使用Keil MDK編譯器來開發程序,經過簡單配置,PC-Lint能夠被集成到MDK上,以便更方便的檢查代碼。MDK已經提供了PC-Lint的配置模板,因此整個配置過程十分簡單,Keil MDK開發套件並不包含PC-Lint程序,在此以前,須要預先安裝可用的PC-Lint程序,配置過程以下:
1) 點擊菜單Tools---Set-up PC-Lint…
PC-Lint Include Folders:該列表路徑下的文件纔會被PC-Lint檢查,此外,這些路徑下的文件內使用#include包含的文件也會被檢查;
Lint Executable:指定PC-Lint程序的路徑
Configuration File:指定配置文件的路徑,該配置文件由MDK編譯器提供。
2) 菜單Tools---Lint 文件路徑.c/.h
檢查當前文件。
3) 菜單Tools---Lint All C-Source Files
檢查全部C源文件。
PC-Lint的輸出信息顯示在MDK編譯器的Build Output窗口中,雙擊其中的一條信息能夠跳轉到源文件所在位置。
編譯器語義檢查的弱小在很大程度上滋長了不可靠代碼的普遍存在。隨着時代的進步,如今愈來愈多的編譯器開發商意識到了語義檢查的重要性,編譯器的語義檢查也愈來愈強大,好比公司使用的Keil MDK編譯器,雖然它的編輯器依然不盡人意,但在其 V4.47及以上版本中增長了動態語法檢查並增強了語義檢查,能夠友好的提示更多警告信息。建議常常關注編譯器官方網站並將編譯器升級到V4.47或以上版本,升級的另外一個好處是這些版本的編輯器增長了標識符自動補全功能,能夠大大節省編碼的時間。
C語言標準特別的規定某些行爲是未定義的,編寫未定義行爲的代碼,其輸出結果由編譯器決定! C標準委員會定義未定義行爲的緣由以下:
C語言的未定義行爲,使得C極度高效靈活而且給編譯器實現帶來了方便,但這並不利於優質嵌入式C程序的編寫。由於許多 C 語言中看起來有意義的東西都是未定義的,而且這也容易使你的代碼埋下隱患,而且不利於跨編譯器移植。Java程序會極力避免未定義行爲,並用一系列手段進行運行時檢查,使用Java能夠相對容易的寫出安全代碼,但體積龐大效率低下。做爲嵌入式程序員,咱們須要瞭解這些未定義行爲,利用C語言的靈活性,寫出比Java更安全、效率更高的代碼來。
1) 自增自減在表達式中連續出現並做用於同一變量或者自增自減在表達式中出現一次,但做用的變量屢次出現
自增(++)和自減(--)這一動做發生在表達式的哪一個時刻是由編譯器決定的,好比:
不一樣的編譯器可能有着不一樣的彙編代碼,多是先執行i++再進行乘法和加法運行,也多是先進行加法和乘法運算,再執行i++,由於這句代碼在一個表達式中出現了連續的自增並做用於同一變量。更加隱蔽的是自增自減在表達式中出現一次,但做用的變量屢次出現,好比:
先執行i++再賦值,仍是先賦值再執行i++是由編譯器決定的,而兩種不一樣的執行順序的結果差異是巨大的。
2) 函數實參被求值的順序
函數若是有多個實參,這些實參的求值順序是由編譯器決定的,好比:
是先執行++n仍是先執行power(2,n)是由編譯器決定的。
3) 有符號整數溢出
有符號整數溢出是未定義的行爲,編譯器決定有符號整數溢出按照哪一種方式取值。好比下面代碼:
4) 有符號數右移、移位的數量是負值或者大於操做數的位數
5) 除數爲零
6) malloc()、calloc()或realloc()分配零字節內存
代碼中引入未定義行爲會爲代碼埋下隱患,防止代碼中出現未定義行爲是困難的,咱們總能不經意間就會在代碼中引入未定義行爲。可是仍是有一些方法能夠下降這種事件,總結以下:
標準C99附錄J.2「未定義行爲」列舉了C99中的顯式未定義行爲,經過查看該文檔,瞭解那些行爲是未定義的,並在編碼中時刻保持警戒;
編譯器警告信息以及PC-Lint等靜態檢查工具可以發現不少未定義行爲並警告,要時刻關注這些工具反饋的信息;
1)避免構造複雜的自增或者自減表達式,實際上,應該避免構造全部複雜表達式;
好比a[i] = i++;語句能夠改成a[i] = i; i++;這兩句代碼。
2)只對無符號操做數使用位操做;
檢查是否溢出、除數是否爲零,申請的內存數量是否爲零等等,好比上面的有符號整數溢出例子,能夠按照以下方式編寫,以消除未定義特性:
上面的代碼是通用的,不依賴於任何CPU架構,可是代碼效率很低。若是是有符號數使用補碼的CPU架構(目前常見CPU絕大多數都是使用補碼),還能夠用下面的代碼來作溢出檢查:
使用的原理解釋一下,由於在加法運算中,操做數value1和value2只有符號相同時,纔可能發生溢出,因此咱們先將這兩個數轉換爲無符號類型,兩個數的和保存在變量usum中。若是發生溢出,則value一、value2和usum的最高位(符號位)必定不一樣,表達式(usum ^ value1) & (usum ^ value2) 的最高位必定爲1,這個表達式位與(&)上INT_MIN是爲了將最高位以外的其它位設置爲0。
不少引入了未定義行爲的程序也能運行良好,這要歸功於編譯器處理未定義行爲的策略。不是你的代碼寫的正確,而是剛好編譯器處理策略跟你須要的邏輯相同。瞭解編譯器的未定義行爲處理策略,可讓你更清楚的認識到那些引入了未定義行爲程序可以運行良好是多麼幸運的事,否則多換幾個編譯器試試!
以Keil MDK爲例,列舉經常使用的處理策略以下:
1) 有符號量的右移是算術移位,即移位時要保證符號位不改變。
2)對於int類的值:超過31位的左移結果爲零;無符號值或正的有符號值超過31位的右移結果爲零。負的有符號值移位結果爲-1。
3)整型數除以零返回零
在嵌入式開發過程當中,咱們須要常常和編譯器打交道,只有深刻了解編譯器,才能用好它,編寫更高效代碼,更靈活的操做硬件,實現一些高級功能。下面以公司最經常使用的Keil MDK爲例,來描述一下編譯器的細節。
1) 默認狀況下,char類型的數據項是無符號的,因此它的取值範圍是0~255;
2) 在全部的內部和外部標識符中,大寫和小寫字符不一樣;
3) 一般局部變量保存在寄存器中,但當局部變量太多放到棧裏的時候,它們老是字對齊的。
4) 壓縮類型的天然對齊方式爲1。使用關鍵字__packed來壓縮特定結構,將全部有效類型的對齊邊界設置爲1;
5) 整數以二進制補碼形式表示;浮點量按IEEE格式存儲;
6) 整數除法的餘數的符號於被除數相同,由ISO C90標準得出;
7) 若是整型值被截斷爲短的有符號整型,則經過放棄適當數目的最高有效位來獲得結果。若是原始數是太大的正或負數,對於新的類型,沒法保證結果的符號將於原始數相同。
8) 整型數超界不引起異常;像unsigned char test; test=1000;這類是不會報錯的;
9) 在嚴格C中,枚舉值必須被表示爲整型。例如,必須在‑2147483648 到+2147483647的範圍內。但MDK自動使用對象包含enum範圍的最小整型來實現(好比char類型),除非使用編譯器命令‑‑enum_is_int 來強制將enum的基礎類型設爲至少和整型同樣寬。超出範圍的枚舉值默認僅產生警告:#66:enumeration value is out of "int" range;
10) 對於結構體填充,根據定義結構的方式,keil MDK編譯器用如下方式的一種來填充結構:
I> 定義爲static或者extern的結構用零填充;
II> 棧或堆上的結構,例如,用malloc()或者auto定義的結構,使用先前存儲在那些存儲器位置的任何內容進行填充。不能使用memcmp()來比較以這種方式定義的填充結構!
11) 編譯器不對聲明爲volatile類型的數據進行優化;
12) __nop():延時一個指令週期,編譯器毫不會優化它。若是硬件支持NOP指令,則該句被替換爲NOP指令,若是硬件不支持NOP指令,編譯器將它替換爲一個等效於NOP的指令,具體指令由編譯器本身決定;
13) __align(n):指示編譯器在n 字節邊界上對齊變量。對於局部變量,n的值爲一、二、四、8;
14) __attribute__((at(address))):能夠使用此變量屬性指定變量的絕對地址;
15) __inline:提示編譯器在合理的狀況下內聯編譯C或C++ 函數;
咱們程序中的一些全局變量和靜態變量在定義時進行了初始化,通過編譯器編譯後,這些初始值被存放在了代碼的哪裏?咱們舉個例子說明:
我曾作過一個項目,項目中的一個設備須要在線編程,也就是經過協議,將上位機發給設備的數據經過在應用編程(IAP)技術寫入到設備的內部Flash中。我將內部Flash作了劃分,一小部分運行程序,大部分用來存儲上位機發來的數據。隨着程序量的增長,在一次更新程序後發現,在線編程以後,設備運行正常,可是重啓設備後,運行出現了故障!通過一系列排查,發現故障的緣由是一個全局變量的初值被改變了。這是件很難以想象的事情,你在定義這個變量的時候指定了初始值,當你在第一次使用這個變量時卻發現這個初值已經被改掉了!這中間沒有對這個變量作任何賦值操做,其它變量也沒有任何溢出,而且屢次在線調試代表,進入main函數的時候,該變量的初值已經被改成一個恆定值。
要想知道爲何全局變量的初值被改變,就要了解這些初值編譯後被放到了二進制文件的哪裏。在此以前,須要先了解一點連接原理。
ARM映象文件各組成部分在存儲系統中的地址有兩種:一種是映象文件位於存儲器時(通俗的說就是存儲在Flash中的二進制代碼)的地址,稱爲加載地址;一種是映象文件運行時(通俗的說就是給板子上電,開始運行Flash中的程序了)的地址,稱爲運行時地址。賦初值的全局變量和靜態變量在程序還沒運行的時候,初值是被放在Flash中的,這個時候他們的地址稱爲加載地址,當程序運行後,這些初值會從Flash中拷貝到RAM中,這時候就是運行時地址了。
原來,對於在程序中賦初值的全局變量和靜態變量,程序編譯後,MDK將這些初值放到Flash中,位於緊靠在可執行代碼的後面。在程序進入main函數前,會運行一段庫代碼,將這部分數據拷貝至相應RAM位置。因爲個人設備程序量不斷增長,超過了爲設備程序預留的Flash空間,在線編程時,將一部分存儲全局變量和靜態變量初值的Flash給從新編程了。在重啓設備前,初值已經被拷貝到RAM中,因此這個時候程序運行是正常的,但從新上電後,這部分初值其實是在線編程的數據,天然與初值不一樣了。
咱們會在代碼中使用各類變量,好比全局變量、靜態變量、局部變量,而且這些變量時由編譯器統一管理的,有時候咱們須要知道變量用掉了多少RAM,以及這些變量在RAM中的具體位置。這是一個常常會遇到的事情,舉一個例子,程序中的一個變量在運行時老是不正常的被改變,那麼有理由懷疑它臨近的變量或數組溢出了,溢出的數據更改了這個變量值。要排查掉這個可能性,就必須知道該變量被分配到RAM的哪裏、這個位置附近是什麼變量,以便針對性的作跟蹤。
其實MDK編譯器的輸出文件中有一個「工程名.map」文件,裏面記錄了代碼、變量、堆棧的存儲位置,經過這個文件,能夠查看使用的變量被分配到RAM的哪一個位置。要生成這個文件,須要在Options for Targer窗口,Listing標籤欄下,勾選Linker Listing前的複選框,如圖3-1所示。
圖3-1 設置編譯器生產MAP文件
MDK中,咱們只須要在配置文件中定義堆棧大小,編譯器會自動在RAM的空閒區域選擇一塊合適的地方來分配給咱們定義的堆棧,這個地方位於RAM的那個地方呢?
經過查看MAP文件,原來MDK將堆棧放到程序使用到的RAM空間的後面,好比你的RAM空間從0x4000 0000開始,你的程序用掉了0x200字節RAM,那麼堆棧空間就從0x4000 0200處開始。
使用了多少堆棧,是否溢出?
在進入main()函數以前,MDK會把未初始化的RAM給清零的,咱們的RAM可能很大,只使用了其中一小部分,MDK會不會把全部RAM都初始化呢?
答案是否認的,MDK只是把你的程序用到的RAM以及堆棧RAM給初始化,其它RAM的內容是無論的。若是你要使用絕對地址訪問MDK未初始化的RAM,那就要當心翼翼的了,由於這些RAM上電時的內容極可能是隨機的,每次上電都不一樣。
對於控制類產品,當系統復位後(非上電覆位),可能要求保持住復位前RAM中的數據,用來快速恢復現場,或者不至於因瞬間復位而重啓現場設備。而keil mdk在默認狀況下,任何形式的復位都會將RAM區的非初始化變量數據清零。
MDK編譯程序生成的可執行文件中,每一個輸出段都最多有三個屬性:RO屬性、RW屬性和ZI屬性。對於一個全局變量或靜態變量,用const修飾符修飾的變量最可能放在RO屬性區,初始化的變量會放在RW屬性區,那麼剩下的變量就要放到ZI屬性區了。默認狀況下,ZI屬性區的數據在每次復位後,程序執行main函數內的代碼以前,由編譯器「自做主張」的初始化爲零。因此咱們要在C代碼中設置一些變量在復位後不被零初始化,那必定不能任由編譯器「胡做非爲」,咱們要用一些規則,約束一下編譯器。
分散加載文件對於鏈接器來講相當重要,在分散加載文件中,使用UNINIT來修飾一個執行節,能夠避免編譯器對該區節的ZI數據進行零初始化。這是要解決非零初始化變量的關鍵。所以咱們能夠定義一個UNINIT修飾的數據節,而後將但願非零初始化的變量放入這個區域中。因而,就有了第一種方法:
1) 修改分散加載文件,增長一個名爲MYRAM的執行節,該執行節起始地址爲0x1000A000,長度爲0x2000字節(8KB),由UNINIT修飾:
那麼,若是在程序中有一個數組,你不想讓它復位後零初始化,就能夠這樣來定義變量:
變量屬性修飾符__attribute__((at(adde)))用來將變量強制定位到adde所在地址處。因爲地址0x1000A000開始的8KB區域ZI變量不會被零初始化,因此位於這一區域的數組plc_eu_backup也就不會被零初始化了。
這種方法的缺點是顯而易見的:要程序員手動分配變量的地址。若是非零初始化數據比較多,這將是件不可思議的大工程(之後的維護、增長、修改代碼等等)。因此要找到一種辦法,讓編譯器去自動分配這一區域的變量。
2) 分散加載文件同方法1,若是仍是定義一個數組,能夠用下面方法:
變量屬性修飾符__attribute__((section(「name」),zero_init))用於將變量強制定義到name屬性數據節中,zero_init表示將未初始化的變量放到ZI數據節中。由於「NO_INIT」這顯性命名的自定義節,具備UNINIT屬性。
3) 將一個模塊內的非初始化變量都非零初始化
假如該模塊名字爲test.c,修改分散加載文件以下所示:
在該模塊定義時變量時使用以下方法:
這裏,變量屬性修飾符__attribute__((zero_init))用於將未初始化的變量放到ZI數據節中變量,其實MDK默認狀況下,未初始化的變量就是放在ZI數據區的。
嵌入式產品的可靠性天然與硬件密不可分,但在硬件肯定、而且沒有第三方測試的前提下,使用防護性編程思想寫出的代碼,每每具備更高的穩定性。
防護性編程首先須要認清C語言的種種缺陷和陷阱,C語言對於運行時的檢查十分弱小,須要程序員謹慎的考慮代碼,在必要的時候增長判斷;防護性編程的另外一個核心思想是假設代碼運行在並不可靠的硬件上,外接干擾有可能會打亂程序執行順序、更改RAM存儲數據等等。
程序員可能無心識的傳遞了錯誤參數;外界的強幹擾可能將傳遞的參數修改掉,或者使用隨機參數意外的調用函數,所以在執行函數主體前,須要先肯定實參是否合法。
對函數返回的錯誤碼,要進行全面仔細處理,必要時作錯誤記錄。
若是動態計算一個地址時,要保證被計算的地址是合理的並指向某個有意義的地方。特別對於指向一個結構或數組的內部的指針,當指針增長或者改變後仍然指向同一個結構或數組。
數組越界的問題前文已經講述的不少了,因爲C不會對數組進行有效的檢測,所以必須在應用中顯式的檢測數組越界問題。下面的例子可用於中斷接收通信數據。
在使用一些庫函數時,一樣須要對邊界進行檢查,好比下面的memset(RecBuf,0,len)函數把RecBuf指指向的內存區的前len個字節用0填充,若是不注意len的長度,就會將數組RecBuf以外的內存區清零:
除法運算前,檢查除數是否爲零幾乎已經成爲共識,可是僅檢查除數是否爲零就夠了嗎?
考慮兩個整數相除,對於一個signed long類型變量,它能表示的數值範圍爲:-2147483648 ~+2147483647,若是讓-2147483648/ -1,那麼結果應該是+2147483648,可是這個結果已經超出了signedlong所能表示的範圍了。因此,在這種狀況下,除了要檢測除數是否爲零外,還要檢測除法是否溢出。
整數的加減乘運算都有可能發生溢出,在討論未定義行爲時,給出過一個有符號整形加法溢出判斷代碼,這裏再給出一個無符號整形加法溢出判斷代碼段:
嵌入式硬件通常沒有浮點處理器,浮點數運算在嵌入式也比較少見而且溢出判斷嚴重依賴C庫支持,這裏不討論。
在討論未定義行爲時,提到有符號數右移、移位的數量是負值或者大於操做數的位數都是未定義行爲,也提到不對有符號數進行位操做,但要檢測移位的數量是否大於操做數的位數。下面給出一個無符號整數左移檢測代碼段:
在其它一切措施都失效的狀況下,看門狗多是最後的防線。它的原理特別簡單,但卻能大大提升設備的可靠性。若是設備有硬件看門狗,必定要爲它編寫驅動程序。
這是由於從上電覆位結束到開啓看門狗的這段時間內,設備有可能被幹擾而跳過看門狗初始化程序,致使看門狗失效。儘量早的開啓看門狗,能夠下降這種機率;
在中斷程序喂狗,因爲干擾的存在,程序可能一直處於中斷之中,這樣會致使看門狗失效。若是在主程序中設置標誌位,中斷程序喂狗時與這個標誌位聯合判斷,也是容許的;
產品的特性決定了喂狗間隔。對於不涉及安全性、實時性的設備,喂狗間隔比較寬鬆,但間隔時間不宜過長,不然被用戶感知到,是影響用戶體驗的。對於設計安全性、有實時控制類的設備,原則是儘量快的復位,不然會形成事故。
克萊門汀號在進行第二階段的任務時,本來預訂要從月球飛行到太空深處的Geographos小行星進行探勘,然而這艘太空探測器在飛向小行星時卻因爲一個軟件缺陷而使其中斷運做20分鐘,不但未能到達小行星,也由於控制噴嘴燃燒了11分鐘使電力供應下降,沒法再透過遠端控制探測器,最終結束這項任務,但也致使了資源與資金的浪費。
「克萊門汀太空任務失敗這件事讓我感到十分震驚,它其實能夠透過硬件中一款簡單的看門狗計時器避免掉這項意外,但因爲當時的開發時間至關緊縮,程序設計人員沒時間編寫程序來啓動它,」Ganssle說。
遺憾的是,1998年發射的近地號太空船(NEAR)也遇到了相同的問題。因爲編程人員並未採納建議,所以,當推動器減速器系統故障時,29公斤的儲備燃料也隨之報銷──這一樣是一個原本可經由看門狗定時器編程而避免的問題,同時也證實要從其餘程序設計人員的錯誤中學習並不容易。
RAM中的數據在受到干擾狀況下有可能被改變,對於系統關鍵數據應該進行保護。關鍵數據包括全局變量、靜態變量以及須要保護的數據區域。備份數據與原數據不該該處於相鄰位置,所以不該由編譯器默認分配備份數據位置,而應該由程序員指定區域存儲。能夠將RAM分爲3個區域,第一個區域保存原碼,第二個區域保存反碼,第三個區域保存異或碼,區域之間預留必定量的「空白」RAM做爲隔離。能夠使用編譯器的「分散加載」機制將變量分別存儲在這些區域。須要進行讀取時,同時讀出3份數據並進行表決,取至少有兩個相同的那個值。
假如設備的RAM從0x1000_0000開始,我須要在RAM的0x1000_0000~0x10007FFF內存儲原碼,在0x1000_9000~0x10009FFF內存儲反碼,在0x1000_B000~0x1000BFFF內存儲0xAA的異或碼,編譯器的分散加載能夠設置爲:
若是一個關鍵變量須要多處備份,能夠按照下面方式定義變量,將三個變量分別指定到三個不連續的RAM區中,並在定義時按照原碼、反碼、0xAA的異或碼進行初始化。
當須要寫這個變量時,這三個位置都要更新;讀取變量時,讀取三個值作判斷,取至少有兩個相同的那個值。
爲何選取異或碼而不是補碼?這是由於MDK的整數是按照補碼存儲的,正數的補碼與原碼相同,在這種狀況下,原碼和補碼是一致的,不但起不到冗餘做用,反而對可靠性有害。好比存儲的一個非零整數區由於干擾,RAM都被清零,因爲原碼和補碼一致,按照3取2的「表決法」,會將干擾值0當作正確的數據。
非易失性存儲器包括但不限於Flash、EEPROM、鐵電。僅僅將寫入非易失性存儲器中的數據再讀出校驗是不夠的。強幹擾狀況下可能致使非易失性存儲器內的數據錯誤,在寫非易失性存儲器的期間系統掉電將致使數據丟失,因干擾致使程序跑飛到寫非易失性存儲器函數中,將致使數據存儲紊亂。一種可靠的辦法是將非易失性存儲器分紅多個區,每一個數據都將按照不一樣的形式寫入到這些分區中,須要進行讀取時,同時讀出多份數據並進行表決,取相同數目較多的那個值。
對於初始化序列或者有必定前後順序的函數調用,爲了保證調用順序或者確保每一個函數都被調用,咱們能夠使用環環相扣,實質上這也是一種軟件鎖。此外對於一些安全關鍵代碼語句(是語句,而不是函數),能夠給它們設置軟件鎖,只有持有特定鑰匙的,才能夠訪問這些關鍵代碼。也能夠通俗的理解爲,關鍵安全代碼不能按照單一條件執行,要額外的多設置一個標誌。
好比,向Flash寫一個數據,咱們會判斷數據是否合法、寫入的地址是否合法,計算要寫入的扇區。以後調用寫Flash子程序,在這個子程序中,判斷扇區地址是否合法、數據長度是否合法,以後就要將數據寫入Flash。因爲寫Flash語句是安全關鍵代碼,因此程序給這些語句上鎖:必須具備正確的鑰匙才能夠寫Flash。這樣即便是程序跑飛到寫Flash子程序,也能大大下降誤寫的風險。
該程序段是編程lpc1778內部Flash,其中調用IAP程序的函數iap_entry(paramin, paramout)是關鍵安全代碼,因此在執行該代碼前,先判斷一個特定設置的安全鎖標誌ProgStart,只有這個標誌符合設定值,纔會執行編程Flash操做。若是由於意外程序跑飛到該函數,因爲ProgStart標誌不正確,是不會對Flash進行編程的。
通信線上的數據誤碼相對嚴重,通信線越長,所處的環境越惡劣,誤碼會越嚴重。拋開硬件和環境的做用,咱們的軟件應能識別錯誤的通信數據。對此有一些應用措施:
每幀字節數越多,發生誤碼的可能性就越大,無效的數據也會越多。對此以太網規定每幀數據不大於1500字節,高可靠性的CAN收發器規定每幀數據不得多於8字節,對於RS485,基於RS485鏈路應用最普遍的Modbus協議一幀數據規定不超過256字節。所以,建議制定內部通信協議時,使用RS485時規定每幀數據不超過256字節;
編寫程序時應使能奇偶校驗,每幀超過16字節的應用,建議至少編寫CRC16校驗程序;
1)增長緩衝區溢出判斷。這是由於數據接收可能是在中斷中完成,編譯器檢測不出緩衝區是否溢出,須要手動檢查,在上文介紹數據溢出一節中已經詳細說明。
2)增長超時判斷。當一幀數據接收到一半,長時間接收不到剩餘數據,則認爲這幀數據無效,從新開始接收。可選,跟不一樣的協議有關,但緩衝區溢出判斷必須實現。這是由於對於須要幀頭判斷的協議,上位機可能發送完幀頭後忽然斷電,重啓後上位機是重新的幀開始發送的,可是下位機已經接收到了上次未發送完的幀頭,因此上位機的此次幀頭會被下位機當成正常數據接收。這有可能形成數據長度字段爲一個很大的值,填滿該長度的緩衝區須要至關多的數據(好比一幀可能1000字節),影響響應時間;另外一方面,若是程序沒有緩衝區溢出判斷,那麼緩衝區極可能溢出,後果是災難性的。
若是檢測到通信數據發生了錯誤,則要有重傳機制從新發送出錯的幀。
開關量容易受到尖脈衝干擾,若是不進行濾除,可能會形成誤動做。通常狀況下,須要對開關量輸入信號進行屢次採樣,並進行邏輯判斷直到確認信號無誤爲止。
開關信號簡單的一次輸出是不安全的,干擾信號可能會翻轉開關量輸出的狀態。採起重複刷新輸出能夠有效防止電平的翻轉。
微處理器的寄存器值也可能會因外界干擾而改變,外設初始化值須要在寄存器中長期保存,最容易被破壞。因爲Flash中的數據相對不易被破壞,能夠將初始化信息預先寫入Flash,待程序空閒時比較與初始化相關的寄存器值是否被更改,若是發現非法更改則使用Flash中的值進行恢復。
公司目前使用的4.3寸LCD顯示屏抗干擾能力通常。若是顯示屏與控制器之間的排線距離過長或者對使用該顯示屏的設備打靜電或者脈衝羣,顯示屏有可能會花屏或者白屏。對此,咱們能夠將初始化顯示屏的數據保存在Flash中,程序運行後,每隔一段時間從顯示屏的寄存器讀出當前值和Flash存儲的值相比較,若是發現二者不一樣,則從新初始化顯示屏。下面給出校驗源碼,僅供參考。
定義數據結構:
定義const修飾的結構體變量,存儲LCD部分寄存器的初始值,這個初始值跟具體的應用初始化有關,不必定是表中的數據,一般狀況下,這個結構體變量被存儲到Flash中。
實現函數以下所示,函數會遍歷結構體變量中的每個命令,以及每個命令下的初始值,若是有一個不正確,則跳出循環,執行從新初始化和恢復措施。這個函數中的MY_DEBUGF宏是我本身的調試函數,使用串口打印調試信息,在接下來的第五部分將詳細敘述。經過這個函數,我能夠長時間監控顯示屏的哪些命令、哪些位容易被幹擾。程序裏使用了一個被妖魔化的關鍵字:goto。大多數C語言書籍對goto關鍵字談之色變,但你應該有本身的判斷。在函數內部跳出多重循環,除了goto關鍵字,又有哪一種方法能如此簡潔高效!
對於8051內核單片機,因爲沒有相應的硬件支持,能夠用純軟件設置軟件陷阱,用來攔截一些程序跑飛。對於ARM7或者Cortex-M系列單片機,硬件已經內建了多種異常,軟件須要根據硬件異常來編寫陷阱程序,用來快速定位甚至恢復錯誤。
有時候程序員會使用while(!flag);語句阻塞在此等待標誌flag改變,好比串口發送時用來等待一字節數據發送完成。這樣的代碼時存在風險的,若是由於某些緣由標誌位一直不改變則會形成系統死機。
一個良好冗餘的程序是設置一個超時定時器,超過必定時間後,強制程序退出while循環。
2003年8月11日發生的W32.Blaster.Worm蠕蟲事件致使全球經濟損失高達5億美圓,這個漏洞是利用了Windows分佈式組件對象模型的遠程過程調用接口中的一個邏輯缺陷:在調用GetMachineName()函數時,循環只設置了一個不充分的結束條件。
原代碼簡化以下所示:
微軟發佈的安全補丁MS03-026解決了這個問題,爲GetMachineName()函數設置了充分終止條件。一個解決代碼簡化以下所示(並不是微軟補丁代碼):
思惟再縝密的程序員也不可能編寫徹底完好陷的程序,測試的目的正是儘量多的發現這些缺陷並改正。這裏說的測試,是指程序員的自測試。前期的自測試可以更早的發現錯誤,相應的修復成本也會很低,若是你不完全測試本身的代碼,恐怕你開發的就不僅是代碼,可能還會聲名狼藉。
優質嵌入式C程序跟優質的基礎元素關係密切,能夠將函數做爲基礎元素,咱們的測試正是從最基本的函數開始。判斷哪些函數須要測試須要必定的經驗積累,雖然代碼行數跟邏輯複雜度並不成正比,但若是你不能判斷某個函數是否要測試,一個簡單粗暴的方法是:當函數有效代碼超過20行,就測試它。
程序員對本身的代碼以及邏輯關係十分清楚,測試時,按照每個邏輯分支全面測試。不少錯誤發生在咱們認爲不會出錯的地方,因此即使某個邏輯分支很簡單,也建議測試一遍。第一個緣由是咱們本身看本身的代碼老是不容易發現錯誤,而測試能暴露這些錯誤;另外一方面,語法正確、邏輯正確的代碼,通過編譯器編譯後,生成的彙編代碼極可能與你的邏輯相差甚遠。好比咱們前文說起的使用volatile以及不使用volatile關鍵字編譯後生成的彙編代碼,再好比咱們用低優化級別編譯和使用高優化級別編譯後生成的彙編代碼,均可能相差很大,實際運行測試,能夠暴漏這些隱含錯誤。最後,雖然可能性極小,編譯器自己也可能有BUG,特別是構造複雜表達式的狀況下(應極力避免複雜表達式)。
使用硬件調試器(好比J-link)測試是最通用的手段。能夠單步運行、設置斷點,能夠很方便的查看當前寄存器、變量的值。在尋找缺陷方面,使用硬件調試器測試是最簡單卻又最有效的手段。
硬件調試器已經在公司廣泛使用,這方面的測試不作介紹,想必你們都已經很熟悉了。
就像沒有一種方法能完美解決全部問題,在實際項目中,硬件調試器也有難以觸及的地方。能夠舉幾個例子說明:
好比公司使用lwIP協議棧,若是跟蹤數據的處理過程,須要從接收數據開始一直到應用層處理數據,之間會通過驅動層、IP層、TCP層和應用層,會通過十幾個文件幾十個函數,使用硬件調試器跟蹤費時費力;
有一些缺陷,多是不定時出現的,有多是幾分鐘出現,也有多是幾個小時甚至幾天纔出現,像這樣的缺陷很難用硬件調試器捕捉到;
好比咱們用組合鍵來完成某個功能,規定按下按鍵1不小於3秒後鬆開,而後在6秒內分別按下按鍵二、按鍵三、按鍵4這三個按鍵來執行咱們的特定程序,要測試相似這種過程,硬件調試器很難作到;
除了測試缺陷須要,有時候咱們在作穩定性測試時,須要知道軟件每時每刻運行到那些分支、執行了哪些操做、咱們關心的變量當前值是什麼等等,這些都代表,咱們還須要一種和硬件調試器互補的測試手段。
這個測試手段就是在程序中增長額外調試語句,當程序運行時,經過這些調試語句將運行信息輸出到能夠方便查看的設備上,能夠是PC機、LCD顯示屏、存儲卡等等。
以串口輸出到PC機爲例,下面提供完整的測試思路。在此以前,咱們先對這種測試手段提一些要求:
咱們在初學C語言的時候,都接觸過printf函數,這個函數能夠方便的輸出信息,並能夠將各類變量格式化爲指定格式的字符串,咱們應當提供相似的函數;
在編碼階段,咱們可能會往程序中加入大量的調試語句,可是程序發佈時,須要將這些調試語句從代碼中移除,這將是件恐怖的過程。咱們必須提供一種策略,能夠方便的移除這些調試語句。
1) 使用庫函數printf。以MDK爲例,方法以下:
I>初始化串口
II>重構fputc函數,printf函數會調用fputc函數執行底層串口的數據發送。
III> 在Options for Targer窗口,Targer標籤欄下,勾選Use MicroLIB前的複選框以便避免使用半主機功能。(注:標準C庫printf函數默認開啓半主機功能,若是非要使用標準C庫,請自行查閱資料)
2) 構建本身的調試函數
使用庫函數比較方便,但也少了一些靈活性,不利於爲所欲爲的定製輸出格式。本身編寫相似printf函數則會更靈活一些,並且不依賴任何編譯器。下面給出一個完整的類printf函數實現,該函數支持有限的格式參數,使用方法與庫函數一致。同庫函數相似,該也須要提供一個底層串口發送函數(原型爲:int32_t UARTwrite(const uint8_t *pcBuf, uint32_t ulLen)),用來發送指定數目的字符,並返回最終發送的字符個數。
上文說到,咱們增長的調試語句應能很方便的從最終發行版中去掉,所以咱們不能直接調用printf或者自定義的UARTprintf函數,須要將這些調試函數作一層封裝,以便隨時從代碼中去除這些調試語句。參考方法以下:
在咱們編碼測試期間,定義宏MY_DEBUG,並使用宏MY_DEBUGF(注意比前面那個宏多了一個‘F’)輸出調試信息。通過預處理後,宏MY_DEBUGF(message)會被UARTprintf message代替,從而實現了調試信息的輸出;當正式發佈時,只須要將宏MY_DEBUG註釋掉,通過預處理後,全部MY_DEBUGF(message)語句都會被空格代替,而從將調試信息從代碼中去除掉。
《計算機程序結構與說明》一書在開篇寫到:程序寫出來是給人看的,附帶能在機器上運行。
使用什麼樣的編碼樣式一直都頗具爭議性的,好比縮進和大括號的位置。由於編碼的樣式也會影響程序的可讀性,面對一個亂放括號、對齊都不一致的源碼,咱們很難提起閱讀它的興趣。咱們總要看別人的程序,若是彼此編碼樣式相近,讀起源碼來會以爲比較溫馨。可是編碼風格的問題是主觀的,永遠不可能在編碼風格上達成統一意見。所以只要你的編碼樣式整潔、結構清晰就足夠了。除此以外,對編碼樣式再沒有其它要求。
提出匈牙利命名法的程序員、前微軟首席架構師Charles Simonyi說:我以爲代碼清單帶給人的愉快同整潔的家差很少。你一眼就能分辨出家裏是雜亂無章仍是整潔如新。這也許意義不大。由於光是房子整潔說明不了什麼,它仍可能藏污納垢!可是第一印象很重要,它至少反映了程序的某些方面。我敢打賭,我在3米開外就能看出程序拙劣與否。我也許無法保證它很不錯,但若是從3米外看起來就很糟,我敢保證這程序寫得不用心。若是寫得不用心,那它在邏輯上也許就不會優美。
變量、函數、宏等等都須要命名,清晰的命名是優秀代碼的特色之一。命名的要點之一是名稱應能清晰的描述這個對象,以致於一個初級程序員也能不費力的讀懂你的代碼邏輯。咱們寫的代碼主要給誰看是須要思考的:給本身、給編譯器仍是給別人看?我以爲代碼最主要的是給別人看,其次是給本身看。若是沒有一個清晰的命名,別人在維護你的程序時很難在整個全貌上看清代碼,由於要記住十多個以上的糟糕命名的變量是件很是困難的事;並且一段時間以後你回過頭來看本身的代碼,頗有可能不記得那些糟糕命名的變量是什麼意思。
爲對象起一個清晰的名字並非簡單的事情。首先能認識到名稱的重要性須要有一個過程,這也許跟譚式C程序教材被大學普遍使用有關:滿書的a、b、c、x、y、z變量名是很難在關鍵的初學階段給人傳達優秀編程思想的;其次如何恰當的爲對象命名也頗有挑戰性,要準確、無歧義、不羅嗦,要對英文有必定水平,全部這些都要知足時,就會變得很困難;此外,命名還須要考慮總體一致性,在同一個項目中要有統一的風格,堅持這種風格也並不容易。
關於如何命名,Charles Simonyi說:面對一個具有某些屬性的結構,不要隨隨便便地取個名字,而後讓全部人去琢磨名字和屬性之間有什麼關聯,你應該把屬性自己,用做結構的名字。
註釋向來也是爭議之一,不加註釋和過多的註釋我都是反對的。不加註釋的代碼顯然是很糟糕的,但過多的註釋也會妨礙程序的可讀性,因爲註釋可能存在的歧義,有可能會誤解程序真實意圖,此外,過多的註釋會增長程序員沒必要要的時間。若是你的編碼樣式整潔、命名又很清晰,那麼,你的代碼可讀性不會差到哪去,而註釋的本意就是爲了便於理解程序。
這裏建議使用良好的編碼樣式和清晰的命名來減小注釋,對模塊、函數、變量、數據結構、算法和關鍵代碼作註釋,應重視註釋的質量而不是數量。若是你須要一大段註釋才能說清楚程序作什麼,那麼你應該注意了:是不是由於程序變量命名不夠清晰,或者代碼邏輯過於混亂,這個時候你應該考慮的可能就不是註釋,而是如何精簡這個程序了。
數據結構是程序設計的基礎。在設計程序以前,應該先考慮好所須要的數據結構。
前微軟首席架構師Charles Simonyi:編程的第一步是想象。就是要在腦海中對前因後果有極爲清晰的把握。在這個初始階段,我會使用紙和鉛筆。我只是信手塗鴉,並不寫代碼。我也許會畫些方框或箭頭,但基本上只是塗鴉,由於真正的想法在我腦海裏。我喜歡想象那些有待維護的結構,那些結構表明着我想編碼的真實世界。一旦這個結構考慮得至關嚴謹和明確,我便開始寫代碼。我會坐到終端前,或者換在之前的話,就會拿張白紙,開始寫代碼。這至關容易。我只要把頭腦中的想法變換成代碼寫下來,我知道結果應該是什麼樣的。大部分代碼會水到渠成,不過我維護的那些數據結構纔是關鍵。我會先想好數據結構,並在整個編碼過程當中將它們牢記於心。
開發過以太網和操做系統SDS 940的Butler Lampson:(程序員)最重要的素質是可以把問題的解決方案組織成容易操控的結構。
開發CP/M操做系統的Gary.A:若是不能確認數據結構是正確的,我是決不會開始編碼的。我會先畫數據結構,而後花很長時間思考數據結構。在肯定數據結構以後我就開始寫一些小段的代碼,並不斷地改善和監測。在編碼過程當中進行測試能夠確保所作的修改是局部的,而且若是有什麼問題的話,可以立刻發現。
微軟創始人比爾·蓋茨:編寫程序最重要的部分是設計數據結構。接下來重要的部分是分解各類代碼塊。
編寫世界上第一個電子表格軟件的Dan Bricklin:在我看來,寫程序最重要的部分是設計數據結構,此外,你還必須知道人機界面會是什麼樣的。
咱們舉個例子來講明。在介紹防護性編程的時候,提到公司使用的LCD顯示屏抗干擾能力通常,爲了提升LCD的穩定性,須要按期讀出LCD內部的關鍵寄存器值,而後跟存在Flash中的初始值相比較。須要讀出的LCD寄存器有十多個,從每一個寄存器讀出的值也不盡相同,從1個到8個字節都有可能。若是不考慮數據結構,編寫出的程序將會很冗長。
咱們分析這個過程,發現能提取出不少相同的元素,好比每次讀LCD寄存器都須要該寄存器的命令號,都會通過讀寄存器、判斷值是否相同、處理異常狀況這一過程。因此咱們能夠提取一些相同的元素,組織成數據結構,用統一的方法去處理這些數據,將數據與處理過程分開來。
咱們能夠先提取相同的元素,將之組織成數據結構:這裏lcd_command表示的是LCD寄存器命令號;lcd_get_value是一個數組,表示寄存器要初始化的值,這是由於對於一個LCD寄存器,可能要初始化多個字節,這是硬件特性決定的;lcd_value_num是指一個寄存器要多少個字節的初值,這是由於每個寄存器的初值數目是不一樣的,咱們用同一個方法處理數據時,是須要這個信息的。
就本例而言,咱們將要處理的數據都是事先固定的,因此定義好數據結構後,咱們能夠將這些數據組織成表格:
經過合理的數據結構,咱們能夠將數據和處理過程分開,LCD冗餘判斷過程能夠用很簡潔的代碼來實現。更重要的是,將數據和處理過程分開更有利於代碼的維護。好比,經過實驗發現,咱們還須要增長一個LCD寄存器的值進行判斷,這時候只須要將新增長的寄存器信息按照數據結構格式,放到LCD寄存器設置值列表中的任意位置便可,不用增長任何處理代碼便可實現!這僅僅是數據結構的優點之一,使用數據結構還能簡化編程,使複雜過程變的簡單,這個只有實際編程後纔會有更深的理解。
本文介紹了編寫優質嵌入式C程序涉及的多個方面。每一年都有億萬計的C程序運行在單片機、ARM七、Cortex-M3這些微處理器上,但在這些處理器上如何編寫優質高效的C程序,幾乎沒有書籍作專門介紹。本文試圖在這方面作一些努力。編寫優質嵌入式C程序須要大量的專業知識,本文雖盡力描述編寫嵌入式C程序所須要的各類技能,但本文卻無力將每個方面都面面俱到的描述出來,因此本文最後會列舉一些閱讀書目,這些書大多都是真正大師的經驗之談。站在巨人的肩膀上,能夠看的更遠。