HTML網頁解析之Xpath,bs4及re

HTML網頁解析篇 1.經常使用工具介紹 Xpath:XPath即爲XML路徑語言(XML Path Language),它是一種用來肯定XML文檔中某部分位置的語言。 bs4:一個HTML/XML 的解析器,主要用於解析和提取 HTML/XML 數據。 re:正則表達式是一種通用的字符串表達框架,用來基於匹配模式測試字符串內的模式,替換文本和查找文本。 2.各工具詳解 2.1 Xpath XPa
相關文章
相關標籤/搜索