UNICODE:它是用兩個字節表示一個字符的方法。好比字符'A'在ASCII下面是一個字符,可'A'在UNICODE下面是兩個字符,高字符用0填充,並且漢字'程'在ASCII下面是兩個字節,而在UNICODE下仍舊是兩個字節 。html
UNICODE的用處就是定長表示世界文字,據統計,用兩個字節能夠編碼現存的全部文字而沒有二義。c++
MBCS: (Multi-ByteChactacterSystem)它是多字節字符集,它是不定長表示世界文字的編碼。編程
MBCS表示英文字母時就和ASCII同樣(這也是咱們容易把MBCS和ASCII搞混的緣由),但表示其餘文字時就須要用多字節。 數組
WINDOWS 下面的程序設計能夠支持MBCS和UNICODE兩種編碼的字符串,具體用那種就看你定義了MBCS宏仍是UNICODE宏。安全
MBCS宏對應的字符串指針 是char*也就是LPSTR;app
UNICODE對應的指針是unsigned short*也就是LPWSTR;函數
爲了寫程序方便微軟定義了類型LPTSTR,在MBCS下他就是char*, 在UNICODE下它是unsigned char*,這樣你就能夠重定義一個宏進行不一樣字符集的轉換了。ui
LPTSTR、LPCSTR、LPCTSTR、LPSTR的意義:編碼
LPSTR:32bit指針 指向一個字符串,每一個字符佔1字節url
LPCSTR: 32-bit指針 指向一個常字符串,每一個字符佔1字節
LPCTSTR: 32-bit指針 指向一個常字符串, 每字符可能佔1字節或2字節,取決於Unicode是否認義
LPTSTR: 32-bit指針 表示指向字符/字符串的指針 每字符可能佔1字節或2字節,取決於Unicode是否認義
Windows使用兩種字符集ANSI和UNICODE,前者就是一般使用的單字節方式,但這種方式處理象中文這樣的雙字節字符不方便,容易出現半個漢字的狀況。然後者是雙字節方式,方便處理雙字節字符。
WindowsNT 的全部與字符有關的函數都提供兩種方式的版本,而Windows9x只支持ANSI方式。_T通常同字常數相關,如_T("Hello"。若是你編譯一個 程序爲ANSI方式,_T實際不起任何做用。而若是編譯一個程序爲UNICODE方式,則編譯器會把"Hello"字符串以UNICODE方式保存。_T 和_L的區別在於,_L無論你是以什麼方式編譯,一概UNICODE方式保存.
Windows核心編程的第一章。
L是表示字符串資源爲Unicode的。
好比 wchar_t Str[] = L"Hello World!"; 這個就是雙子節存儲字符了。
_T是一個適配的宏~
當 #ifdef _UNICODE的時候 _T就是L 沒有#ifdef _UNICODE的時候 _T就是ANSI的。
好比
LPTSTR lpStr = new TCHAR[32]; TCHAR* szBuf = _T("Hello"); 以上兩句使得不管是在UNICODE編譯條件下都是正確編譯的。
並且MS推薦你使用相匹配的字符串函數。 好比處理LPTSTR或者LPCTSTR 的時候,不要用strlen ,而是要用_tcslen
不然在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是很是有意思的一個符號(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪一種字符集?編譯的時候才決定
在vc++中有着各類字符串的表示法,如您所說。
首先char* 是指向ANSI字符數組的指針,其中每一個字符佔據8位(有效數據是除掉最高位的其餘7位),這裏保持了與傳統的C,C++的兼容。
LP的含義是長指針(long pointer)。
LPSTR是一個指向以‘/0’結尾的ANSI字符數組的指針,與char*能夠互換使用,在win32中較多地使用 LPSTR。而LPCSTR中增長的‘C’的含義是「CONSTANT」(常量),代表這種數據類型的實例不能被使用它的API函數改變,除此以外,它與 LPSTR是等同的。
爲了知足程序代碼國際化的須要,業界推出了Unicode標準,它提供了一種簡單和一致的表達字符串的方法,全部字符中的字節都是16位的值,其數量也可 以知足差很少世界上全部書面語言字符的編碼需求,開發程序時使用Unicode(類型爲wchar_t)是一種被鼓勵的作法。
LPWSTR與LPCWSTR由此產生,它們的含義相似於LPSTR與LPCSTR,只是字符數據是16位的wchar_t而不是char。
而後爲了實現兩種編碼的通用,提出了TCHAR的定義:
若是定義_UNICODE,聲明以下: typedef wchar_t TCHAR;
若是沒有定義_UNICODE,則聲明以下: typedef char TCHAR;
LPTSTR和LPCTSTR中的含義就是每一個字符是這樣的TCHAR。
CString類中的字符就是被聲明爲TCHAR類型的,它提供了一個封裝好的類供用戶方便地使用。
若是您還須要進一步的信息,請參看http://msdn.microsoft.com/library/default.asp?url=/library/en-us/vclib/html/_crt_data_type_mappings.asp等其餘有關信息。
LPTSTR、LPCSTR、LPCTSTR、LPSTR之間的轉換:
如何理解LPCTSTR類型? 2007-11-10 21:43
L表示long指針
這是爲了兼容Windows 3.1等16位操做系統遺留下來的,在win32中以及其餘的32爲操做系統中, long指針和near指針及far修飾符都是爲了兼容的做用。沒有實際意義。
P表示這是一個指針
C表示是一個常量
T表示在Win32環境中, 有一個_T宏
這個宏用來表示你的字符是否使用UNICODE, 若是你的程序定義了UNICODE或者其餘相關的宏,那麼這個字符或者字符串將被做爲UNICODE字符串,不然就是標準的ANSI字符串。
STR表示這個變量是一個字符串
因此LPCTSTR就表示一個指向常固定地址的能夠根據一些宏定義改變語義的字符串。 一樣, LPCSTR就只能是一個ANSI字符串,在程序中咱們大部分時間要使用帶T的類型定義。
LPCTSTR == const TCHAR *
CString 和 LPCTSTR 能夠說通用。 緣由在於CString定義的自動類型轉換,沒什麼奇特的,最簡單的C++操做符重載而已。
常 量字符串ansi和unicode的區分是由宏_T來決定的。可是用_T("abcd")時, 字符串"abcd"就會根據編譯時的是否認一_UNICODE來決定是char* 仍是 w_char*。 一樣,TCHAR 也是相同目的字符宏。 看看定義就明白了。簡單起見,下面只介紹 ansi 的狀況,unicode 能夠類推。
ansi狀況下,LPCTSTR 就是 const char*, 是常量字符串(不能修改的)。 而LPTSTR 就是 char*, 即普通字符串(很是量,可修改的)。 這兩種都是基本類型, 而CString 是 C++類, 兼容這兩種基本類型是最起碼的任務了。
因爲const char* 最簡單(常量,不涉及內存變動,操做迅速), CString 直接定義了一個類型轉換函數 operator LPCTSTR() {......}, 直接返回他所維護的字符串。
當你須要一個const char* 而傳入了CString時, C++編譯器自動調用 CString重載的操做符 LPCTSTR()來進行隱式的類型轉換。 當須要CString , 而傳入了 const char* 時(其實 char* 也能夠),C++編譯器則自動調用CString的構造函數來構造臨時的 CString對象。
所以CString 和 LPCTSTR 基本能夠通用。
可是 LPTSTR又不一樣了,他是 char*, 意味着你隨時可能修改裏面的數據,這就須要內存管理了(如字符串變長,原來的存貯空間就不夠了,則須要從新調整分配內存)。 因此 不能隨便的將 const char* 強制轉換成 char* 使用。 樓主舉的例子 LPSTR lpstr = (LPSTR)(LPCTSTR)string; 就是這種不安全的使用方法。
這個地方使用的是強制類型轉換,你都強制轉換了,C++編譯器固然不會拒絕你,但同時他也認爲你確實知道本身要作的是什麼。所以是不會給出警告的。 強制的任意類型轉換是C(++)的一項強大之處,但也是一大弊端。這一問題在 vc6 之後的版本(僅針對vc而言)中獲得逐步的改進(你須要更明確的類型轉換聲明)。
其實在不少地方均可以看到相似 LPSTR lpstr = (LPSTR)(LPCTSTR)string; 地用法,這種狀況通常是函數的約束定義不夠完善的緣由, 好比一個函數接受一個字符串參數的輸入,裏面對該字符串又沒有任何的修改,那麼該參數就應該定義成 const char*, 可是不少初學者弄不清const地用法,或者是懶, 總之就是隨意寫成了 char* 。 這樣子傳入CString時就須要強制的轉換一下。
這種作法是不安全的,也是不被建議的用法,你必須徹底明白、確認該字符串沒有被修改。
CString 轉換到 LPTSTR (char*), 預約的作法是調用CString的GetBuffer函數,使用完畢以後通常都要再調用ReleaseBuffer函數來確認修改 (某些狀況下也有不調用ReleaseBuffer的,一樣你須要很是明確爲何這麼作時才能這樣子處理,通常應用環境能夠不考慮這種狀況)。
同時須要注意的是, 在GetBuffer 和 ReleaseBuffer之間,CString分配了內存交由你來處理,所以不能再調用其餘的CString函數。
CString 轉LPCTSTR: CString cStr; const char *lpctStr=(LPCTSTR)cStr;
LPCTSTR轉CString: LPCTSTR lpctStr; CString cStr=lpctStr;
本文來自CSDN博客,轉載請標明出處:http://blog.csdn.net/yuhuimin111/archive/2009/05/08/4161462.aspx