ANSI和UNICODE區別

時間 2019-11-16

原文原文鏈接

到底什麼是ANSI，什麼是UNICODE呢？其實這是兩種不一樣的編碼方式標準，ANSI中的字符采用8bit，而UNICODE中的字符采用16bit。8bit的ANSI編碼只能表示256種字符，表示26個英文字母是綽綽有餘的，可是表示漢字，韓國語，日語等有着成千上萬個字符的非西方字符確定就不夠了，正是如此才引入了UNICODE標準。
在軟件開發中，特別是使用C語言的一些有關字符串處理的函數，ANSI和UNICODE是區分是用的，那麼ANSI類型的字符和UNICODE類型的字符如何定義，如何使用呢？ANSI和UNICODE又如何轉換呢？
一．定義部分：
ANSI： char str[1024]; 可用字符串處理函數：strcpy( ), strcat( ), strlen( )等等。UNICODE：wchar_t str[1024]；可用字符串處理函數
二．可用函數：
ANSI：即 char，可用字符串處理函數：strcat( ),strcpy( ), strlen( )等以str打頭的函數。
UNICODE：即wchar_t 可用字符串處理函數：wcscat(),wcscpy(),wcslen()等以wcs打頭的函數。
三．系統支持
Windows 98 ：只支持ANSI。
Windows 2k ：既支持ANSI又支持UNICODE。
Windows CE ：只支持UNICODE。
說明
1．在COM裏面只支持UNICODE。
2． Windows 2000整個OS系統都是基於UNICODE的，爲此在windows 2000下使用ANSI是須要付出代價的，雖然在編碼上不用任何的轉換，可是這種轉化是隱藏的，是佔用系統資源的（CPU，內存）。
3．在Windows 98下必須使用UNICODE，則須要本身手動的編碼切換。
三．如何區分：
在咱們軟件開發中每每須要即支持ANSI又支持UNICODE，不可能在要求類型轉換的時候，從新改變字符串的類型，和使用於字符串上的操做函數。爲此, 標準的C 運行期庫和Windows 提供了宏定義的方式。
在C語言裏面提供了 _UNICODE宏（有下劃線），在Windows裏面提供了UNICODE宏（無下劃線），只要定了_UNICODE宏和UNICODE宏，系統就會自動切換到UNICODE版本，不然，系統按照ANSI的方式進行編譯和運行。
只定義了宏並不能實現自動的轉換，他還須要一系列的字符定義支持。
1． TCHAR
若是定義了UNICODE宏則TCHAR被定義爲wchar_t。
typedef wchar_t TCHAR;
不然TCHAR被定義爲char
typedef char TCHAR;
2． LPTSTR
若是定義了UNICODE宏則LPTSTR被定義爲LPWSTR。
typedef LPTSTR LPWSTR;
不然TCHAR被定義爲char
typedef LPTSTR LPSTR; windows

經常，咱們須要在ANSI和UNICODE之間進行字符串的轉換，則須要用到如下代碼：函數

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。