搜狗實驗室數據亂碼問題 使用iconv轉碼

之前下載了搜狗實驗室的用戶搜索日誌數據包發現爲亂碼 使用enca查看編碼發現是gbk編碼,需要將其轉化爲utf8編碼 我們使用的ubuntu系統,可以下載iconv來對文件進行批量轉碼 iconv -f gbk utf-8 SogouQ.reduced>sogou.txt.utf8 收工
相關文章
相關標籤/搜索