[python] 中文亂碼問題

一.問題描述

  在Linux環境下建了個文本文件,經過編寫的腳本處理沒有問題.把腳本挪到Windows 10環境下就一命嗚呼編程一堆亂碼了.把Windows 10下的文本文件放到Linux去處理,發現也是亂碼.html

二.系統環境

  • 編寫環境: Linux Mint 18.1
  • Python版本: 3.7.4
  • 測試環境: Windows 10

三.解決辦法

  1. 問題 1編程

    1.1 error code:測試

      'utf-8' codec can't decode byte 0xc8 in position 0: invalid continuation byte編碼

    1.2 solution:code

      打開文件時添加參數 errors="ignore"htm

    1.3 reference:ip

      https://zhidao.baidu.com/question/430772955877875452.htmlutf-8

  2. 問題 2get

    2.1 error description:it

      轉換後的文本爲亂碼.

    2.2 solution:

      我發如今Windows下的文本文件到了Linux環境下,打印出來就是亂碼了.好奇怪.網上資料也看了好多也都無濟於事.在看到某篇文章(真的很抱歉,我回去沒翻到那篇文章)提到字符編碼的時候,我忽然想是否是這裏出了問題.

      因而我把 encoding='UTF-8' 改爲了 encoding='GB2312' ,咦,亂碼沒有了,可愛的中文字符又回來了,我又試了下 encoding='GBK',仍是中文.

      問題就這麼莫名其妙的解決了,我以爲先Mark下,而後後面再仔細研究下這個問題的始末.

相關文章
相關標籤/搜索