UTF-8是UNICODE的一種變長字符編碼又稱萬國碼,由Ken Thompson於1992年建立。如今已經標準化爲RFC 3629。UTF-8用1到6個字節編碼UNICODE字符。用在網頁上能夠同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)。html
UTF-8編碼能夠經過屏蔽位和移位操做快速讀寫。字符串比較時strcmp()和wcscmp()的返回結果相同,所以使排序變得更加容易。字節FF和FE在UTF-8編碼中永遠不會出現,所以他們能夠用來代表UTF-16或UTF-32文本(見BOM) UTF-8 是字節順序無關的。它的字節順序在全部系統中都是同樣的,所以它實際上並不須要BOM。編碼
說了這麼多UTF-8的好處,如今言歸正傳,說說一個將txt文件轉換成UTF-8格式超簡單的方法。url
首先,咱們打開一個txt文件,以下圖:
而後,在上部的菜單欄中,咱們選擇 」文件「 ---> "另存爲"
在彈出的新窗口中,設置新文件的保存位置,而且將對話框下方的」編碼「 選擇爲」UTF-8「, 最後點擊
保存按鈕,就生成了一個UTF-8格式的TXT文件了。
htm