問題:UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 2-3: illegal multibyte sequencepython
緣由:python在作將普通字符串轉換爲unicode對象時,編碼
例如:u_string = unicode(string , "gb2312"),若是你的字符串string中有諸如某些繁體字,例如"河滘小學"code
中的滘,那麼gb2312做爲簡體中文編碼是不能進行解析的,必須使用國標擴展碼gbk,gbk支持繁體中文和日文假文對象
解決方法:使用gbk,代替gb2312,例如:u_string = unicode(string , "gbk")
blog