將連接視做投票
遞歸的意思是:假如如今要求C,指向C的入鏈只有B,那麼得先求B的重要度,B重要度的大小取決於指向B的入鏈以及這些入鏈的重要度。
簡單的遞歸公式
流模型
「隨機」的解釋:從i這個頁面開始,它可能有di種選擇,並且他作每一種選擇的時候,選擇的機率是相同的,即他決定到下一個頁面是一個隨機的選擇(應該跳到那個頁面),咱們把上面圖中的矩陣叫隨機鄰接矩陣。算法
矩陣方程
Σri=1在這裏表示限定條件,和流方程同樣,不加限定條件會有無窮多個解。因此這裏的限定條件是假定全部網頁的重要度求和等於1。
矩陣的行和r向量相乘的時候就是對流公式的表示。
矩陣方程實例
冪迭代方法
兩個向量的1範數,實際上是對應位置的差值絕對值之和。
r向量是全部網頁的重要程度組成的向量。網絡
冪迭代求解
總共是3個節點,初始化每一個節點的重要度分別是1/3。
r=r'的意思是,最後求得r'的值趨於穩定,再也不變化。優化
隨機遊動的解釋
若是有不少頁面指向頁面j的話,那麼它的重要度是很高的。
平穩分佈
存在性和惟一性
在節點少的圖中,若是新增一個節點的話,整個圖是須要從新算的。可是在億級節點的話,多一個節點少一個節點,對圖的影響不必定大。像百度和谷歌就不會頻繁的去計算。3d
按照流公式迭代不必定會收斂到咱們想要的結果。cdn
收不收斂?
a,b節點圖,若是用1,0去初始化的話,會發現他們一直再對調。
ABCD圖,全部的權重最後都歸到了C這一個點。blog
隨着矩陣運算的迭代,拿到的ABCD四個值都會很是很是趨於零。
PageRank問題
m這個點就是個陷阱問題,最終全部的權重都被吸到m這個點上。
終結者問題,最後的迭代結果是零零零,m這個點沒有任何出鏈。
解決辦法:隨機傳送
e表明所有的網頁,就是說瀏覽者會隨機的在所有網頁中打開一個。
pagerank是一個針對圖的算法,有名是由於,最先的時候谷歌用它作了一個所謂比較公正的網絡排序,但後來人們對他作了各類優化,爭取經過他的規則,把本身的網頁提升比較靠前的位置,也經過優化來使結果更加的穩定。排序
pagerank能夠幫你在有關聯的圖中找到最重要的節點。遞歸