對Python3 解析html的幾種操作方式小結

解析html是爬蟲後的重要的一個處理數據的環節。一下記錄解析html的幾種方式。 先介紹基礎的輔助函數,主要用於獲取html並輸入解析後的結束 1,lxml.html的方式進行解析, 2,使用BeautifulSoup,不多說了,大家網上找資料看看 3,使用SGMLParser,主要是通過start、end tag的方式進行了,解析工程比較明朗,但是有點麻煩,而且該案例的場景不太適合該方法,(哈哈
相關文章
相關標籤/搜索