Link Extractors(連接解析器)是用來提取response中連接的工具類。有一下三種類型:html
scrapy.contrib.linkextractors.LinkExtractorscrapy
scrapy.contrib.linkextractors.lxmlhtml.LxmlLinkExtractor工具
scrapy.contrib.linkextractors.sgml.SgmlLinkExtractorurl
初始化的時候能夠設置相應的過濾條件,這個你們能夠官方API上查看,API上直說了初始化,沒有提到實例方法。Link Extractors(連接解析器)有兩個方法 extract_links( self, response) 和 matches( self, url ),返回scrapy.contrib.linkextractors.lxmlhtml.Link類型list,Link包含url(連接),text(文本),fragment, nofollow四個屬性,後面這兩個不太清楚是幹嗎的,你們若是知道能夠告訴我,謝謝。spa
但願你們多多指正,謝謝!xml