文本文件編碼方式的簡單識別

 在實際編程中常常會碰到須要讀取一個文本文件的內容並將其顯示到程序中的狀況。若是文件中全部的內容都以ASCII方式編碼當然簡單(一般包含英文字母和數字的文件,好比readme之類),但遇到包含其餘語言字符,如中文和日文之類就必須在顯示以前知道其編碼方式。這是由於不少程序在顯示文本內容時只接受UNICODE,故咱們必須對非UNICODE的編碼方式進行轉換。因爲談到UNICODE時一般討論的都是UCS
相關文章
相關標籤/搜索