《PYTHON3網絡爬蟲開發實踐》——第四章 解析庫的使用

第四章 解析庫的使用 4.1 XPath 對於網頁的節點來說,它可以定義id、 class或其他屬性。而且節點之間還有層次關係,在網頁中可以通過XPath或CSS選擇器來定位一一個或多個節點。那麼,在頁面解析時,利用XPath或CSS選擇器來提取某個節點,然後再調用相應方法獲取它的正文內容或者屬性,就可以提取我們想要的任意信息了。 XPath提供了超過100個內建函數,用於字符串、數值、時間的匹配
相關文章
相關標籤/搜索