Hadoop(三) 大數據離線計算與實時計算

1、大數據離線計算:MapReduce計算模型 一、MapReduce是處理HDFS上的數據apache 二、MapReduce的思想來源是PageRank(搜索排名),原理是進行分佈式計算。windows 如上圖,網頁跳轉中,訪問網頁3的次數最多,也就是權重最大的爲網頁3。好比京東、淘寶中給推薦的商品,就是近期訪問的比較多的商品。框架 MapReduce的思想是把一個大任務拆分紅多個小任務,再把
相關文章
相關標籤/搜索