Link Extractors(連接解析器)

Link Extractors(連接解析器)是用來提取response中連接的工具類。有一下三種類型:html

scrapy.contrib.linkextractors.LinkExtractorscrapy

scrapy.contrib.linkextractors.lxmlhtml.LxmlLinkExtractor工具

scrapy.contrib.linkextractors.sgml.SgmlLinkExtractorurl

初始化的時候能夠設置相應的過濾條件,這個你們能夠官方API上查看,API上直說了初始化,沒有提到實例方法。Link Extractors(連接解析器)有兩個方法 extract_links( self, response) 和 matches( self, url ),返回scrapy.contrib.linkextractors.lxmlhtml.Link類型list,Link包含url(連接),text(文本),fragment, nofollow四個屬性,後面這兩個不太清楚是幹嗎的,你們若是知道能夠告訴我,謝謝。spa

但願你們多多指正,謝謝!xml

相關文章
相關標籤/搜索