python爬蟲之xpath和lxml解析內容

上兩章說了urllib和request庫如何訪問一個頁面或者接口,從而獲取數據,如果是訪問接口,還好說,畢竟返回的json還是很好解析的,他是結構化的,我們可以把它轉化成字典來解析,但是如果返回的是xml或者html,就有點麻煩了,今天就主要說一下如果解析這些html內容的工具:xpath和lxml。 xpath xpath是一個可以在xml和html來查找信息的語言。語法如下 表達式 描述 示例
相關文章
相關標籤/搜索