Hadoop與Spark算法分析(四)——PageRank算法

PageRank是用於解決網頁重要性排序的關鍵技術之一,其基於網頁之間連接關係構建一個有向圖結構,實現各個網頁級別的劃分。一個網頁的PageRank值(後面簡稱PR值),取決於其餘網頁對該網頁的貢獻和,以公式形式表示爲,其中U表示全部網頁指向網頁b的網頁集合,L(a)表示網頁a的出度,d表示用戶瀏覽一個網頁的隨機機率,用於解決網頁關係間的陷阱問題。根據公式遞歸計算,各網頁的PR值將最終趨於穩定。能
相關文章
相關標籤/搜索