Scrapy選擇器Xpath和CSS

時間 2020-01-15

原文原文鏈接

使用Scrapy爬取數據前，須要先了解Scrapy的選擇器。網絡網絡爬蟲的原理就是獲取網頁返回，而後提取所需的內容。簡單的網頁可使用Python的re模塊提取內容，複雜一點的可使用scrapy。scrapy提取數據的機制被稱爲選擇器（seletors），經過特定的XPath或者CSS表達式來「選擇」HTML文件中的某個部分。scrapy XPath是一門用來在XML文件中選擇節點的語言，也能夠用

>>阅读原文<<