HaLoop:大集羣上高效的迭代數據處理(上)

摘要:超大規模數據挖掘和數據分析需求的日益增加,引領着工業和學術界設計大數據計算平臺新模式。MapReduce和Dryad是兩種流行的平臺,數據流在這兩種平臺上採用操做符的有向非循環圖形式。迭代程序在數據挖掘、網頁排名、圖像分析、模型擬合等許多應用領域中天然而然地出現了,而這兩種平臺缺少對迭代程序的內嵌支持。在這篇文章中會呈現HaLoop,這是一種改進的用來服務於各類應用的Hadoop MapRe
相關文章
相關標籤/搜索