tiny中文亂碼問題,不過僅適用於windows,因此xml不能夠出現中文

我是在SetAttribute() 函數以前使用的ide

SetAttribute(const char* name,const char * _value)函數

 

首先獲得了一個CString 類型的變量 strItem編碼

而後spa

char *pBuf = strItem.GetBuffer();.net

GBKToUTF8(pBuf);xml

SetAttribute("Title",pBuf);blog

 

便可。內存

 

 

http://blog.csdn.net/wj253209529/archive/2009/09/28/4607040.aspx文檔

 

亂碼是因爲GB2312與UTF8之間轉換不當形成的,tinyxml在處理UTF8自己沒有問題,當你打開一個UTF8的文檔,能夠在加載的時候指定UTF8的方式,或者文檔聲明處指明的編碼格式,tinyxml會按照相應的編碼格式加載,但不少時候當咱們輸出或寫入中文字段時會出現亂碼,不管在內存,仍是打印出來的內容.這是由於咱們的軟件一般是GB2312編碼,而讀取或寫入的內容是UTF8,天然就會出錯.能夠藉助如下的兩個函數來實現轉換:it

void UTF8ToGBK( char *&szOut )
{
 unsigned short *wszGBK;
 char *szGBK;
 //長度
 int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
 wszGBK = new unsigned short[len+1];
 memset(wszGBK, 0, len * 2 + 2);
 MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);

 //長度
 len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
 szGBK = new char[len+1];
 memset(szGBK, 0, len + 1);
 WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);

 //szOut = szGBK; //這樣獲得的szOut不正確,由於此句意義是將szGBK的首地址賦給szOut,當delete []szGBK執行後szGBK的內

                             //存空間將被釋放,此時將得不到szOut的內容

 memset(szOut,'/0',strlen(szGBK)+1); //改將szGBK的內容賦給szOut ,這樣即便szGBK被釋放也能獲得正確的值
 memcpy(szOut,szGBK,strlen(szGBK));


 delete []szGBK;
 delete []wszGBK;
}

void GBKToUTF8(char* &szOut)
{
 char* strGBK = szOut;

 int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);
 unsigned short * wszUtf8 = new unsigned short[len+1];
 memset(wszUtf8, 0, len * 2 + 2);
 MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len);

 len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);
 char *szUtf8=new char[len + 1];
 memset(szUtf8, 0, len + 1);
 WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL);

 //szOut = szUtf8;
 memset(szOut,'/0',strlen(szUtf8)+1);
 memcpy(szOut,szUtf8,strlen(szUtf8));

 delete[] szUtf8;  delete[] wszUtf8; }

相關文章
相關標籤/搜索