基於Hadoop平臺作大數據的幾種應用

一、本身寫MapReduce任務,雖然開發難度大一點,但運行效率比Pig和Hive高,像Google的PageRank排名,機器學習、推薦,全盤掃描的ETL都是這種方式的典型應用; 二、用Hive作分析,Hive的一大好處就是能使用程序員熟悉的SQL進行計算任務編寫,但某些運算效率不及M/R; 三、用Pig作數據分析,Pig是Yahoo的研發成果,yahoo也但願將其推廣爲大數據領域內的數據分析標
相關文章
相關標籤/搜索