pagerank示例:spa
公式說明: blog
S(Vi) :Vi的PR值排序
Vi :Vi頁面im
d :一個阻尼係數,(其實我也不太明白),一個做用就是避免起點頁面的PR爲零。統計結果代表,設置成0.85就行。(大約100屢次迭代PR值就能收斂到一個穩定的值,而當阻尼係數接近1時,須要的迭代次數會陡然增長不少,且排序不穩定)統計
Out(Vj) :表示從頁面(Vj)鏈接到其餘頁面的個數img
j ∈ In(Vi):表示屬於連接到頁面Vi的頁面。co
概括: ps
1.採用投票的思想,
2.一個頁面會連接到N個頁面,那麼這個頁面連接到其中目標頁面的PR值,就是N分之一,這就是入鏈頁面的PR值
3.把全部入鏈頁面的PR值相加,就獲得了總的PR值
4.最後通過阻尼係數的處理,就獲得了最終頁面的PR值。
舉個例子:
按照公式:
1. page1的PR值,由於是首個頁面,沒有入鏈頁面,因此PR值就是 S(P1) =(1-d) + d * 0 = 1-0.85=0.15
2. page2,page3與page1頁面相同,因此都是0.15
3. 計算page4的PR值,page1,page3都是page4的入鏈,因此要計算它們的平均PR值,page1的出鏈是page4,page5,因此page1的PR值就是0.15/2=0.0525;page3的出鏈也是2個,因此PR值就是0.15/2=0.0525;
4. S(P4) = (1-d) + d * (S(P1) + S(P2))
= 0.15 + 0.85 * (0.0525 + 0.0525)
= 0.2775