如何判斷一個文本文件內容的編碼格式 UTF-8 ? ANSI(GBK)

UTF-8編碼的文本文檔,有的帶有BOM (Byte Order Mark, 字節序標誌),即0xEF, 0xBB, 0xBF,有的沒有。Windows下的txt文本編輯器在保存UTF-8格式的文本文檔時會自動添加BOM到文件頭。在判斷這類文檔時,能夠根據文檔的前3個字節來進行判斷。然而BOM不是必需的,並且也不是推薦的。對不但願UTF-8文檔帶有BOM的程序會帶來兼容性問題,例如Java編譯器在
相關文章
相關標籤/搜索