C/C++筆記(04):GB2312字符串和UTF-8之間的轉換

在編程過程當中須要對字符串進行不一樣的轉換,特別是Gb2312和Utf-8直接的轉換。
編程

在幾個開源的魔獸私服中,不少都是國外開發的,而暴雪爲了可以兼容世界上的各個字符集也使用了UTF-8。在中國使用VS(VS2005以上版本)開發基本都是使用Gb2312的Unicode字符集,因此當在編程過程當中就須要進行字符轉換,這樣才能兼容遊戲,不然就是亂碼。而在控制檯顯示字符串時,正好相反須要將UTF-8的字符串轉換成Gb2312才能正常顯示。
bash

爲了解決這個問題,轉換以下;其實不少地方均可以使用到字符串的編碼轉換,代碼以下:ide

// UTF-8到GB2312的轉換  
char* U2G(const char* utf8)  
{  
    int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);  
    wchar_t* wstr = new wchar_t[len+1];  
    memset(wstr, 0, len+1);  
    MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);  
    len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL,   NULL);  
    char* str = new char[len+1];  
    memset(str, 0, len+1);  
    WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);  
    if(wstr) delete[] wstr;  
    return str;  
}  
複製代碼
// GB2312到UTF-8的轉換  
char* G2U(const char* gb2312)  
{  
    int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);  
    wchar_t* wstr = new wchar_t[len+1];  
    memset(wstr, 0, len+1);  
    MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);  
    len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL);  
    char* str = new char[len+1];  
    memset(str, 0, len+1);  
    WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);  
    if(wstr) delete[] wstr;  
    return str;  
}  
複製代碼

不管是GB2312到UTF-8的轉換,仍是UTF-8到GB2312的轉換,都須要注意的是在使用字符串後,須要刪除字符串指針;這是由於以上兩個方法返回的是字符串指針,若是沒有刪除將會內存泄漏。ui

相關文章
相關標籤/搜索