《PYTHON3網絡爬蟲開發實踐》——第四章解析庫的使用

時間 2021-01-11

原文原文鏈接

第四章解析庫的使用 4.1 XPath 對於網頁的節點來說，它可以定義id、 class或其他屬性。而且節點之間還有層次關係，在網頁中可以通過XPath或CSS選擇器來定位一一個或多個節點。那麼，在頁面解析時，利用XPath或CSS選擇器來提取某個節點，然後再調用相應方法獲取它的正文內容或者屬性，就可以提取我們想要的任意信息了。 XPath提供了超過100個內建函數，用於字符串、數值、時間的匹配

>>阅读原文<<