C#漢字轉爲Unicode編碼

主要用於生成json格式時,將漢字轉成Unicoude編碼,防止頁面亂碼。json

protected string GetUnicode(string text)
{
	string result = "";
	for (int i = 0; i < text.Length; i++)
	{
		if ((int)text[i] > 32 && (int)text[i] < 127)
		{
			result += text[i].ToString();
		}
		else
			result += string.Format("\\u{0:x4}", (int)text[i]);
	}
	return result;
}

涉及的知識點:
一、「x」則表明十六進制,「x4」表明十六進制表示的可控制長度,若是長度不夠,則用前導的0填補。
二、Unicode寫法:在表示一個Unicode的字符時,一般會用「U+」而後緊接着一組十六進制的數字來表示這一個字符。
三、 ASCII 碼(American Standard Code for Information Interchange,全稱美國信息交換標準碼)
基本的 ASCII 字符集共有 128 個字符,其中有 96 個可打印字符,包括經常使用的字母、數字、標點符號等,另外還有 32 個控制字符。
•0~31及127(共33個)是控制字符或通訊專用字符(其他爲可顯示字符),如控制符:LF(換行)、CR(回車)、FF(換頁)、DEL(刪除)、BS(退格)、BEL(振鈴)等;通訊專用字符:SOH(文頭)、EOT(文尾)、ACK(確認)等;ASCII值爲八、九、10和13分別轉換爲退格、製表、換行和回車字符。它們並無特定的圖形顯示,但會依不一樣的應用程序而對文本顯示有不一樣的影響。
•32~126(共95個)是字符(32sp是空格),其中48~57爲0到9十個阿拉伯數字,65~90爲26個大寫英文字母,97~122爲26個小寫字母,其他爲一些標點符號、運算符號等。編碼

相關文章
相關標籤/搜索