文本編碼與解碼問題解決方案

文本的編碼與解碼問題,其中很常見的一種解碼錯誤以下所示:html

        問題一   UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 130: illegal multibyte sequence編碼

 

  • (首先在打開文本的時候,設置其編碼格式,

            例:open(‘1.txt’,encoding=’gbk’); spa

  • 若是文本中出現的一些特殊符號超出了gbk的編碼範圍,那麼使用上述方法依舊不能正確解碼,咱們使用編碼範圍更廣的‘gb18030’進行解碼

            例:open(‘1.txt’,encoding=’gb18030’); .net

  • (3)、若以前兩種方法仍不能解決解碼問題,說明文中出現了連‘gb18030’也沒法編碼的字符,能夠使用‘ignore’屬性將沒法解碼的特殊符號進行忽略處理,

           例:open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’); code

 

       問題二    'gbk' codec can't decode byte 0x93 in position 5456: illegal multibyte sequencehtm

  • 解決方式1     FILE_OBJECT= open('order.log','r', encoding='UTF-8')
  • 解決方式2       FILE_OBJECT= open('order.log','rb')


---------------------
參考:https://blog.csdn.net/shijing_0214/article/details/51971734

blog

參考: https://www.cnblogs.com/mengyu/p/6638975.htmlit

相關文章
相關標籤/搜索