Java轉行大數據該怎麼規劃學習

  Java轉行大數據該怎麼規劃學習,學習過Java以後在學習大數據相對會輕鬆一些,主要是要分清你要先從那個方向入手python

 

  1. 大數據開發工程師,這個比較適合剛剛從Java轉換過來的人員作,主要學習HDFS,MapReduce,Yarn,Hive,Flume,Sqoop,Spark等技術便可轉轉型。

 

  1. 數倉工程師:這個須要SQL基礎好一些,其餘環境配置基本上公司已經完成,主要是針對Hive方向的開發和數據倉庫的建模擦操做。

 

  1. 實時工程師:這個主要針對的是Spark部分,SparkStreaming是老牌的實時處理,相對公司使用仍是比較多的,近年來阿里收購了Flink以後,加速了Flink在國內的步伐,因此這個flink最好也要學習,Storm就能夠適當的瞭解。

 

4.數據挖掘:須要學習完成大數據體系,也就是大數據開發工程須要學習的,除了這些外要學會,機器學習R語言主要是爲了統計分析和繪圖,在Hadoop生態圈中是有本身的機器學習庫的mahout提供可擴展的機器學習領域經典算法的實現,包括聚類、分類、推薦過濾、頻繁子項挖掘等,且可經過Hadoop擴展,可是鑑於MapReduce的性能,建議學習Spark MLlib: MLlib是Spark是經常使用的機器學習算法的實現庫,支持二元分類,迴歸,聚類以及協同過濾等算法。同時也包括一個底層的梯度降低優化基礎算法。除了以外,也能夠學系python,python中也有一套完整的機器學習庫。算法

相關文章
相關標籤/搜索