【大數據分析經常使用算法】0.簡介

簡介

本系列教程主要探討有關大數據的全部經常使用算法的實現,按期加入有趣的項目實踐。java

一、實現語言

初步使用java實現,後續加入python。python

  • Hadoop Mapreduce Java實現 位於包*.mapreduce下。
  • Spark MapReduce Java實現 位於包*.spark下。

python實現會在之後加入。算法

每一個算法存在一個模塊,測試文件位置父模塊根目錄下,對應名字可從系列教程裏面找到。框架

二、實現框架

  • Hadoop 2.7.3
  • Spark 2.4

三、參考

  • 書籍《算法實現:Hadoop/spark》
相關文章
相關標籤/搜索