關於Python爬蟲學習進步(xpath處理的小插曲--xpath如同「失靈」)

首先,本文是我在用xpath來進行處理時的一些情況,想做一些筆記: 除了用正則可以處理之外,還可以用xpath來進行處理,關鍵在於: 用etree()方法來解析獲取到的HTML文檔,將其解析成HTML DOM模型: 首先要,如果沒有lxml的話,可以看這裏,安裝好後,就可以在寫Python時用這句了, 然後使用即可 然後使用xpath()方法: 當然,其中的路徑是根據自己爬取頁面的信息才能確定的
相關文章
相關標籤/搜索