在AWS Elastic MapReduce上運行PageRank Hadoop作業

在上一篇文章中,我描述了執行PageRank計算的示例,該示例是使用Apache Hadoop進行Mining Massive Dataset課程的一部分。 在那篇文章中,我接受了Java中現有的Hadoop作業,並做了一些修改(添加了單元測試,並通過參數設置了文件路徑)。 這篇文章展示瞭如何在現實的Hadoop集羣上使用此作業。 該集羣是一個由1個主節點和5個核心節點組成的AWS EMR集羣 ,
相關文章
相關標籤/搜索