Go語言檢測文件編碼的方法

Go語言檢測文件編碼的方法

開源軟件github.com/saintfish/chardet提供了檢測文件編碼的功能。git

安裝

go get github.com/saintfish/chardet

檢測編碼

rawBytes := []byte("some text")
detector := chardet.NewTextDetector()
charset, err := detector.DetectBest(rawBytes)
if err != nil {
    panic(err)
}

println(charset.Charset)
println(charset.Language)

支持的編碼

UTF-8 GB-18030 ISO-8859-1 UTF-16BE UTF-16LE UTF-32BE UTF-32LE Big5

編碼檢測方法

檢測輸入的字節流中是否出現了某個特定編碼纔有的字符。github

修改記錄

  1. 2018年11月16日 創建文檔。
相關文章
相關標籤/搜索