url中有空格等特殊字符及中文字符處理

在做爬蟲時,爬下來的書籍的URL地址各式各樣,什麼情況都有。 有的url地址既有中文,又有%20 空格等特殊字符。如 http://www.ishareread.com/book/2018/不成問題的問題%20-%20老舍.mobi 如果是在url中有中文需要轉碼,但轉碼後會將%號替換成%25,導致url不能訪問了。 解決的辦法,先判斷url中是否有中文,如果有中文,則替換特殊字符,再進行轉碼。
相關文章
相關標籤/搜索