爬蟲實戰9—基於page rank的順序調整

文章說明:本文是在學習一個網絡爬蟲課程時所做筆記,文章如有不對的地方,歡迎指出,積極討論。 一、Page Rank PageRank算法計算每一個網頁的PageRank值,然後根據這個值的大小對網頁的重要性進行排序。 對海量的節點進行排序。排序策略算法。 Google的兩大神器:(1)Page Rank ;(2)Big Table。 用於爬蟲的兩點: (1)優先抓誰; (2)數據爬取回來以後,查詢
相關文章
相關標籤/搜索