CrawlScript語言輕鬆實現網絡爬蟲——輕鬆爬取整站信息

CrawlScript語言在beta0.3版本中集成了整站爬蟲的功能,只需要簡單幾句,就可以完成對整站的爬取。 首先下載CrawlScript beta 0.3: CrawlScript beta 0.3版及demo下載。 下載後解壓,在CrawlScript-bin文件夾中有一個demo.js,這個代碼雖然只有幾行,但是實現了對整個新華網的新聞正文的爬取和抽取,一個完整的網絡爬蟲。 運行方式:用
相關文章
相關標籤/搜索