記一次讀取csv報「'gb2312' codec can't decode byte 0x9b」解決辦法

問題:UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 2-3: illegal multibyte sequencepython

 

 

緣由:python在作將普通字符串轉換爲unicode對象時,編碼

例如:u_string = unicode(string , "gb2312"),若是你的字符串string中有諸如某些繁體字,例如"河滘小學"code

中的滘,那麼gb2312做爲簡體中文編碼是不能進行解析的,必須使用國標擴展碼gbk,gbk支持繁體中文和日文假文對象

 

解決方法:使用gbk,代替gb2312,例如:u_string = unicode(string , "gbk")

blog

相關文章
相關標籤/搜索