業務需求及編程思路編程
PageRank簡單計算工具
假設一個由只有4個頁面組成的集合:A,B,C和D。若是全部頁面都鏈向A,那麼A的PR(PageRank)值將是B,C及D的和。3d
繼續假設B也有連接到C,而且D也有連接到包括A的3個頁面。一個頁面不能投票2次。因此B給每一個頁面半票。以一樣的邏輯,D投出的票只有三分之一算到了A的PageRank上。blog
換句話說,根據鏈出總數平分一個頁面的PR值。class
一、自定義一個節點工具類NodeUtils,包括pr值、出鏈數等屬性程序
二、Map類im
三、Reduce類img
四、主程序集合
五、運行程序di