數據挖掘的前提---信息抓取:通用爬蟲和聚焦爬蟲

一. 互聯網信息抓取 二. 爬蟲概述 三. 通用爬蟲和聚焦爬蟲 四. Nutch搜索引擎 五. 爬蟲實例分析:輿情信息匯聚 一. 互聯網信息抓取 隨着網絡的迅速發展,Internet (萬維網)成爲當今世界最大的信息載體,每天又有不可計數的新數據涌入Internet 中。如今, 人們面臨的一個巨大的挑戰就是如何從海量數據中提取有效信息並加以利用。「 要處理數據,就要先得到數據」,從Internet
相關文章
相關標籤/搜索