如何判斷一個文件的編碼格式是gb2312仍是gbk等

GB2312-80編碼的編碼範圍是高位0xa1-0xfe,低位是 0xa1-0xfe ,其中漢字範圍爲 0xb0a1 和 0xf7fe,若是隻是簡單地判斷漢字,則只要查看高字節是否大於等於0xa1就能夠了,還有就是,全角字符的高字節通通等於0xa3,因此很容易能夠區別出全角字符來。 html  Unicode:FF、FE     Unicode big endian:FE、FF     UTF-8
相關文章
相關標籤/搜索