使用Java作網頁抓取

如今有愈來愈多的人熱衷於作網絡爬蟲(網絡蜘蛛),也有愈來愈多的地方須要網絡爬蟲,好比搜索引擎、資訊採集、輿情監測等等,諸如此類。網絡爬蟲涉及到的技術(算法/策略)廣而複雜,如網頁獲取、網頁跟蹤、網頁分析、網頁搜索、網頁評級和結構/非結構化數據抽取以及後期更細粒度的數據挖掘等方方面面,對於新手來講,不是一朝一夕便能徹底掌握且熟練應用的,對於做者來講,更沒法在一篇文章內就將其說清楚。所以在本篇文章中,
相關文章
相關標籤/搜索