玩大數據必定用獲得的19款Java開源Web爬蟲

網絡爬蟲(又被稱爲網頁蜘蛛,網絡機器人,在FOAF社區中間,更常常的稱爲網頁追逐者),是一種按照必定的規則,自動地抓取萬維網信息的程序或者腳本。另一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。javascript 今天將爲你們介紹19款Java開源Web爬蟲,須要的小夥伴們趕快收藏吧。java 1、Heritrix Heritrix 是一個由 java 開發的、開源的網絡爬蟲,用戶可使用
相關文章
相關標籤/搜索