爬蟲中文亂碼繁體字亂碼問題解決

工作需要爬取淘寶對應的賣家賬戶,爲了簡單就直接用正則匹配所需掌櫃名稱。  ps:項目較老,用的python2.7 遇到三個問題: 1.中文亂碼,開始直接就 Response.encoding = 'utf-8',結果中文都是亂碼。查資料可以用  Response.apparent_encoding 看出返回網頁的編碼格式 GB2312 2.繁體字亂碼 簡單中文沒問題,但是繁體字又是亂碼,而且Res
相關文章
相關標籤/搜索