最近在玩node.js,用http客戶端獲取的html不少都是gbk或gb2312編碼的,網上找了下,都說要使用iconv,想一想太麻煩,在維基百科找了下,找到了unicode-gbk編碼映射,以及unicode-utf8的算法,因而將映射表當下來搞了個編碼轉換的工具,代碼也不多,不到100行html
獲取:node
npm install encoding_convertor
使用:算法
var ec = require('encoding_convertor'); ec.convert(src, 'gbk', function(err, result){ console.log(result); }); //src: gbk編碼的buffer, 第二個參數是要轉換的編碼,回調函數 result: utf-8編碼的字符串
如今已經內置了gbk的編碼映射表,若是想支持其它的編碼能夠去維基百科搞,不過格式必定要是otherencoding:unicode\nnpm
gbk映射來源:ICU:UNICODE-GBK table函數
unicode-utf8算法來源:utf-8編碼 維基百科工具