PageRank 算法隨記

將連接視做投票

遞歸的意思是:假如如今要求C,指向C的入鏈只有B,那麼得先求B的重要度,B重要度的大小取決於指向B的入鏈以及這些入鏈的重要度。

簡單的遞歸公式

流模型

「隨機」的解釋:從i這個頁面開始,它可能有di種選擇,並且他作每一種選擇的時候,選擇的機率是相同的,即他決定到下一個頁面是一個隨機的選擇(應該跳到那個頁面),咱們把上面圖中的矩陣叫隨機鄰接矩陣。算法

矩陣方程

Σri=1在這裏表示限定條件,和流方程同樣,不加限定條件會有無窮多個解。因此這裏的限定條件是假定全部網頁的重要度求和等於1。

矩陣的行和r向量相乘的時候就是對流公式的表示。

矩陣方程實例

冪迭代方法

兩個向量的1範數,實際上是對應位置的差值絕對值之和。

r向量是全部網頁的重要程度組成的向量。網絡

冪迭代求解

總共是3個節點,初始化每一個節點的重要度分別是1/3。

r=r'的意思是,最後求得r'的值趨於穩定,再也不變化。優化

隨機遊動的解釋

若是有不少頁面指向頁面j的話,那麼它的重要度是很高的。

平穩分佈

存在性和惟一性

在節點少的圖中,若是新增一個節點的話,整個圖是須要從新算的。可是在億級節點的話,多一個節點少一個節點,對圖的影響不必定大。像百度和谷歌就不會頻繁的去計算。3d

按照流公式迭代不必定會收斂到咱們想要的結果。cdn

收不收斂?

a,b節點圖,若是用1,0去初始化的話,會發現他們一直再對調。

ABCD圖,全部的權重最後都歸到了C這一個點。blog

隨着矩陣運算的迭代,拿到的ABCD四個值都會很是很是趨於零。

PageRank問題

m這個點就是個陷阱問題,最終全部的權重都被吸到m這個點上。

終結者問題,最後的迭代結果是零零零,m這個點沒有任何出鏈。

解決辦法:隨機傳送

e表明所有的網頁,就是說瀏覽者會隨機的在所有網頁中打開一個。

pagerank是一個針對圖的算法,有名是由於,最先的時候谷歌用它作了一個所謂比較公正的網絡排序,但後來人們對他作了各類優化,爭取經過他的規則,把本身的網頁提升比較靠前的位置,也經過優化來使結果更加的穩定。排序

pagerank能夠幫你在有關聯的圖中找到最重要的節點。遞歸

相關文章
相關標籤/搜索