java 爬蟲大型教程(二)

java 爬蟲大型教程(二) 編寫基本的爬蟲 1. 實現PageProcessor 這部分我們直接通過CdnRepoPageProcessor這個例子來介紹PageProcessor的編寫方式。PageProcessor定製分爲三個部分,分別是爬蟲的配置、頁面元素的抽取和鏈接的發現。 import us.codecraft.webmagic.Page; import us.codecraft.we
相關文章
相關標籤/搜索