WebMagic功能——XPath、CSS選擇器、正則表達式 || 抽取元素API、獲取結果API || ​​​​​​​獲取鏈接||​​​​​​​使用Pipeline保存結果

WebMagic功能 實現PageProcessor 抽取元素Selectable WebMagic裏主要使用了三種抽取技術:XPath、正則表達式和CSS選擇器。另外,對於JSON格式的內容,可使用JsonPath進行解析。 XPath CSS選擇器 CSS選擇器是與XPath類似的語言。它比XPath寫起來要簡單一些,但是如果寫複雜一點的抽取規則,就相對要麻煩一點。 正則表達式 正則表達式則是
相關文章
相關標籤/搜索