Unicode 是用兩個字節表示每一個字符的字符編碼方案。國際標準組織 (ISO) 幾乎爲每種語言的每一個字符和符號在 0 到 65,535 (216 – 1) 範圍內定義了一個數字(再加上爲未來發展保留的一些空餘空間)。在全部 32 位版本的 Windows 中,部件對象模型 (COM) 都使用 Unicode,它是 OLE 和 ActiveX 技術的基礎。Windows NT 所有支持 Unicode。雖然 Unicode 和 DBCS 都是雙字節字符,但它們的編碼方案徹底不一樣html
Unicode給每一個字符提供了一個惟一的數字,不管是什麼平臺,不管是什麼程序,不論什麼語言。Unicode使單一軟件產品或單一網站可以貫穿多個平臺,語言和國家,而不須要重建。它可將數據傳輸到許多不一樣的系統,而無損壞。服務器
產生的環境:網站
基本上,計算機只是處理數字。它們指定一個數字,來儲存字母或其餘字符。在創造Unicode以前,有數百種指定這些數字的編碼系統。沒有一個編碼能夠包含足夠的字符:例如,單單歐州共同體就須要好幾種不一樣的編碼來包括全部的語言。即便是單一種語言,例如英語,也沒有哪個編碼能夠適用於全部的字母,標點符號,和經常使用的技術符號。
這些編碼系統也會互相沖突。也就是說,兩種編碼可能使用相同的數字表明兩個不一樣的字符,或使用不一樣的數字表明相同的字符。任何一臺特定的計算機(特別是服務器)都須要支持許多不一樣的編碼,可是,不論何時數據經過不一樣的編碼或平臺之間,那些數據總會有損壞的危險。編碼
來自:url
http://www.joelonsoftware.com/articles/Unicode.htmlcode
http://dengo.org/archives/901htm
http://zhidao.baidu.com/link?url=ELut17y7pesezRTI7y4DPgiIChLk-q8z_-o7MT2iqlcttAFcVtd7oVEtfnA1m421tgs85-hFJTCIn1DskgM5_K對象