用Python處理HTML轉義字符的5種方式

寫爬蟲是一個發送請求,提取數據,清洗數據,存儲數據的過程。在這個過程中,不同的數據源返回的數據格式各不相同,有 JSON 格式,有 XML 文檔,不過大部分還是 HTML 文檔,HTML 經常會混雜有轉移字符,這些字符我們需要把它轉義成真正的字符。 什麼是轉義字符 在 HTML 中 <、>、& 等字符有特殊含義(<,> 用於標籤中,& 用於轉義),他們不能在 HTML 代碼中直接使用,如果要在網頁
相關文章
相關標籤/搜索