在Linux環境下建了個文本文件,經過編寫的腳本處理沒有問題.把腳本挪到Windows 10環境下就一命嗚呼編程一堆亂碼了.把Windows 10下的文本文件放到Linux去處理,發現也是亂碼.html
問題 1編程
1.1 error code:測試
'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte編碼
1.2 solution:code
打開文件時添加參數 errors="ignore"htm
1.3 reference:ip
https://zhidao.baidu.com/question/430772955877875452.htmlutf-8
問題 2get
2.1 error description:it
轉換後的文本爲亂碼.
2.2 solution:
我發如今Windows下的文本文件到了Linux環境下,打印出來就是亂碼了.好奇怪.網上資料也看了好多也都無濟於事.在看到某篇文章(真的很抱歉,我回去沒翻到那篇文章)提到字符編碼的時候,我忽然想是否是這裏出了問題.
因而我把 encoding='UTF-8' 改爲了 encoding='GB2312' ,咦,亂碼沒有了,可愛的中文字符又回來了,我又試了下 encoding='GBK',仍是中文.
問題就這麼莫名其妙的解決了,我以爲先Mark下,而後後面再仔細研究下這個問題的始末.