Spark RDD中文亂碼問題

使用RDD編程時,把一箇中文數據文件導入到Linux下的pycharm,打開亂碼,能夠在pycharm中經過設置編碼方式設置爲GBK或者UTF-8另其顯示爲中文,可是對該數據進行操做時,輸出到控制檯或者保存到文件中仍是會出現亂碼,從根源入手,在Linux下進行轉碼web iconv -f gb18030 -t utf8 1.txt -o 2.txt
相關文章
相關標籤/搜索