判斷文件的編碼格式

轉載的原博客地址html 1:簡單判斷是UTF-8或不是UTF-8,由於通常除了UTF-8以外就是GBK,因此就設置默認爲GBK。  按照給定的字符集存儲文件時,在文件的最開頭的三個字節中就有可能存儲着編碼信息,因此,基本的原理就是隻要讀出文件前三個字節,斷定這些字節的值,就能夠得知其編碼的格式。其實,若是項目運行的平臺就是中文操做系統,若是這些文本文件在項目內產生,即開發人員能夠控制文本的編碼格
相關文章
相關標籤/搜索