在AWS Elastic MapReduce上運行PageRank Hadoop作業

時間 2021-01-02

標籤 java hadoop 大數據 spark python 欄目 Hadoop 简体版

原文原文鏈接

在上一篇文章中，我描述了執行PageRank計算的示例，該示例是使用Apache Hadoop進行Mining Massive Dataset課程的一部分。在那篇文章中，我接受了Java中現有的Hadoop作業，並做了一些修改（添加了單元測試，並通過參數設置了文件路徑）。這篇文章展示瞭如何在現實的Hadoop集羣上使用此作業。該集羣是一個由1個主節點和5個核心節點組成的AWS EMR集羣，

>>阅读原文<<