Scrapy選擇器Xpath和CSS

使用Scrapy爬取數據前,須要先了解Scrapy的選擇器。網絡 網絡爬蟲的原理就是獲取網頁返回,而後提取所需的內容。簡單的網頁可使用Python的re模塊提取內容,複雜一點的可使用scrapy。scrapy提取數據的機制被稱爲選擇器(seletors),經過特定的XPath或者CSS表達式來「選擇」HTML文件中的某個部分。scrapy XPath是一門用來在XML文件中選擇節點的語言,也能夠用
相關文章
相關標籤/搜索