Eclipse保存文件時出現字符編碼錯誤,以下圖所示:
Ecplise的默認編碼,以下圖所示:
eclipse 因爲開源因此支持了比較雜的編碼方式,而這些一個工程導入時添加了很多的外來程序,因爲不是同一工程一次編碼帶來了其中含有 GBK 或 UTF8 或 UTF16 或 ASCII 等文件編譯時就會出現錯誤警告。數據庫
UTF-8:Unicode Transformation Format- 8bit,容許含 BOM,但一般不含 BOM 。是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。瀏覽器
UTF-8 包含全世界全部國家須要用到的字符,是國際編碼,通用性強。UTF-8 編碼的文字能夠在各國支持UTF8字符集的瀏覽器上顯示。若是是 UTF8 編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。 網絡
GBK 是國家標準GB2312 基礎上擴容後兼容 GB2312 的標準。GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,爲了區分中文,將其最高位都設定成1。eclipse
GBK 包含所有中文字符,是國家編碼,通用性比 UTF8 差,不過 UTF-8 佔用的數據庫比 GBK 大。字體
Unicode(統一碼、萬國碼、單一碼)是一種在計算機上使用的字符編碼。編碼
Unicode 是爲了解決傳統的字符編碼方案的侷限而產生的,它爲每種語言中的每一個字符設定了統一而且惟一的二進制編碼,以知足跨語言、跨平臺進行文本轉換、處理的要求。spa
1990年開始研發,1994年正式公佈。3d
Unicode的最初目標,是用1個16位的編碼來爲超過65000個字符提供映射。但這還不夠,它不能覆蓋所有歷史上的文字,也不能解決傳輸的問題,尤爲在那些基於網絡的應用中。已有的軟件必須作大量的工做來解碼16位的數據。code
所以,Unicode用一些基本的保留字符制定了三套編碼方式。它們分別是UTF-八、UTF-16和UTF-32。orm
正如名字所示,在UTF-8中,字符是以8位序列來編碼的,用一個或幾個字節來表示一個字符。這種方式的最大好處是:UTF-8保留了ASCII字符的編碼做爲它的一部分,例如,在UTF-8和ASCII中,「A」的編碼都是0x41.。
UTF-16和UTF-32分別是Unicode的16位和32位編碼方式。考慮到最初的目的,一般說的Unicode就是指UTF-16。在討論Unicode時,搞清楚哪一種編碼方式很是重要。
- UTF-8沒有字節序和討厭的BOM問題
- UTF-8制霸互聯網幾乎成爲事實標準
- UTF-8對ASCII極佳的兼容性
- 在英語統治的地球上,UTF-8能夠利用單字節特性節省體積
- UTF-16在絕大多數狀況下都是定長的,處理起來容易,然而如今處理器和內存都愈加不值錢,這個優點沒那麼重要了。
Linux系統中默認的中文字體編碼爲UTF-8, 而Windows系統中默認的中文編碼爲GBK,Ecplise默認的中文編碼也是GBK。