關於Python爬蟲學習進步（xpath處理的小插曲--xpath如同「失靈」）

時間 2021-01-13

標籤爬蟲欄目 Python 简体版

原文原文鏈接

首先，本文是我在用xpath來進行處理時的一些情況，想做一些筆記：除了用正則可以處理之外，還可以用xpath來進行處理，關鍵在於：用etree()方法來解析獲取到的HTML文檔，將其解析成HTML DOM模型：首先要，如果沒有lxml的話，可以看這裏，安裝好後，就可以在寫Python時用這句了，然後使用即可然後使用xpath()方法：當然，其中的路徑是根據自己爬取頁面的信息才能確定的

>>阅读原文<<