UTF-8到GBK轉換

實際就是由寬字節轉換爲多字節的過程ide

-------------post

首先MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len) 轉換UTF-8 到表中UNICODE操作系統

而後編譯器

WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL); UNICODE轉換爲標準多字節
編譯

這個時候已是ANSI格式了,事實上不是GBK格式,但是通常這個時候編譯器和操做系統字符集就能去解決下邊的事了。就是說可以直接當普通的char *來用了class

---------------

void UTF8ToGBK( char *&szOut )
{
  unsigned short *wszGBK;
  char *szGBK;
  //長度
  int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
  wszGBK = new unsigned short[len+1];
  memset(wszGBK, 0, len * 2 + 2);
  MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);


  //長度
  len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
  szGBK = new char[len+1];
  memset(szGBK, 0, len + 1);
  WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);


  //szOut = szGBK; //這樣獲得的szOut不對,因爲此句意義是將szGBK的首地址賦給szOut。當delete []szGBK運行後szGBK的內


  //存空間將被釋放。此時將得不到szOut的內容


  memset(szOut,'0',strlen(szGBK)+1); //改將szGBK的內容賦給szOut ,這樣即便szGBK被釋放也能獲得正確的值
  memcpy(szOut,szGBK,strlen(szGBK)+1);//最後這個+1不要忘了




  delete []szGBK;
  delete []wszGBK;
}
di

相關文章
相關標籤/搜索