python2.7常見的編碼問題,Python「Non-ASCII character 'xe5' in file」報錯問題

0. 寫在前面python 原由:以前寫個數據預處理程序的時候遇到了點問題,用re模塊的正則查找方法search時老是找不出來(找錯了或者出亂碼),因而搗鼓搗鼓。後端 通過:查資料,作實驗,發現用utf8編碼的str類型的字符串在search方法中行不通,由於str是字節串,和字符之間沒有固定的一一對應的關係,正則無法用字節串來進行正確匹配。安全 結果:把正則式和目標字符串都使用unicode類型
相關文章
相關標籤/搜索