關於HANLP的亂碼問題

在利用HanLP進行分詞的時候,我將一篇新聞txt讀入之後分詞出現了這種情況: 一大篇文字就轉化成了亂碼,剛開始我不明白是什麼問題,後來上網搜也搜不到,後來突然想到可能是txt文檔的編碼有問題。於是我打開我的輸入文件然後另存爲一遍,發現它默認的是ANSI格式的文檔,怪不得讀出來會是亂碼。 後來我將文檔另存爲,並更改爲utf-8的編碼格式,再進行一遍分詞操作,之前的問題就解決了。
相關文章
相關標籤/搜索