HaLoop：大集羣上高效的迭代數據處理（上）

時間 2020-08-08

原文原文鏈接

摘要：超大規模數據挖掘和數據分析需求的日益增加，引領着工業和學術界設計大數據計算平臺新模式。MapReduce和Dryad是兩種流行的平臺，數據流在這兩種平臺上採用操做符的有向非循環圖形式。迭代程序在數據挖掘、網頁排名、圖像分析、模型擬合等許多應用領域中天然而然地出現了，而這兩種平臺缺少對迭代程序的內嵌支持。在這篇文章中會呈現HaLoop，這是一種改進的用來服務於各類應用的Hadoop MapRe

>>阅读原文<<