xpath 獲取元素及爬蟲實例

時間 2021-01-09

原文原文鏈接

主流爬蟲方法分類： 1，selenium+Chrome/PhantomJS 2，Requests+正則表達式 3，Requests+ BeautifulSoup 4，Requests+分析ajax 5，Requests+xpath（lxml包）或CSS 今天要講的第5種。原理：將有可能不合法的HTML 解析爲統一格式。雖然Lxml可以正確解析屬性兩側缺失的引號，並閉合標籤，不過該模塊沒有額外添

>>阅读原文<<