python爬蟲系列(七):XPath的使用

(一)簡介與安裝 以前咱們瞭解了bs4 處理HTML文檔,今天來看看另外一種方式,就是lxml,也就是XPath類庫。咱們能夠先將HTML文件轉換爲XML文檔,而後用Xpath查找本身想要的內容的所在節點就能夠了。那麼XML被設計爲傳輸和存儲數據,焦點是數據的內容,而頁面HTML則是顯示數據以及更好的顯示數據。 安裝很簡答,用咱們的老朋友pip 進行安裝便可。pip install lxml,而不
相關文章
相關標籤/搜索