pagerank

pagerank示例:spa

 

 

公式說明: blog

S(Vi) :Vi的PR值排序

Vi   :Vi頁面im

d    :一個阻尼係數,(其實我也不太明白),一個做用就是避免起點頁面的PR爲零。統計結果代表,設置成0.85就行。(大約100屢次迭代PR值就能收斂到一個穩定的值,而當阻尼係數接近1時,須要的迭代次數會陡然增長不少,且排序不穩定)統計

Out(Vj) :表示從頁面(Vj)鏈接到其餘頁面的個數img

j ∈ In(Vi):表示屬於連接到頁面Vi的頁面。co

概括: ps

1.採用投票的思想,

2.一個頁面會連接到N個頁面,那麼這個頁面連接到其中目標頁面的PR值,就是N分之一,這就是入鏈頁面的PR值

3.把全部入鏈頁面的PR值相加,就獲得了總的PR值

4.最後通過阻尼係數的處理,就獲得了最終頁面的PR值。

 

舉個例子:

 

按照公式:

1.  page1的PR值,由於是首個頁面,沒有入鏈頁面,因此PR值就是 S(P1) =(1-d) + d * 0 = 1-0.85=0.15

2.  page2,page3與page1頁面相同,因此都是0.15

3.  計算page4的PR值,page1,page3都是page4的入鏈,因此要計算它們的平均PR值,page1的出鏈是page4,page5,因此page1的PR值就是0.15/2=0.0525;page3的出鏈也是2個,因此PR值就是0.15/2=0.0525;

4. S(P4) =  (1-d) + d * (S(P1) + S(P2))

              = 0.15 + 0.85 * (0.0525 + 0.0525)

              = 0.2775

相關文章
相關標籤/搜索