都知道大數據薪資高,前景好。而大數據又須要Java基礎。對於稍微懂些Java的童鞋來講,到底如何轉行大數據呢?今天小編給你一個大數據工程師具體的學習路線圖。【ps:無java基礎也能夠學習大數據】java
分享轉行經驗路線程序員
對於Java程序員,大數據的主流平臺hadoop是基於Java開發的,因此Java程序員往大數據開發方向轉行從語言環境上更爲順暢,另外不少基於大數據的應用框架也是Java的,因此在不少大數據項目裏掌握Java語言是有必定優點的。算法
在這裏仍是要推薦下我本身建的大數據學習交流羣:529867072,羣裏都是學大數據開發的,若是你正在學習大數據 ,小編歡迎你加入,你們都是軟件開發黨,不按期分享乾貨(只有大數據軟件開發相關的),包括我本身整理的一份最新的大數據進階資料和高級開發教程,歡迎進階中和進想深刻大數據的小夥伴加入。sql
固然,hadoop核心價值在於提供了分佈式文件系統和分佈式計算引擎,對於大部分公司而言,並不須要對這個引擎進行修改。這時候除了熟悉編程,你一般還須要學習數據處理和數據挖掘的一些知識。尤爲是往數據挖掘工程師方向發展,則你須要掌握更多的算法相關的知識。數據庫
對於數據挖掘工程師而言,雖然也須要掌握編程工具,但大部分狀況下是把hadoop當作平臺和工具,藉助這個平臺和工具提供的接口使用各類腳本語言進行數據處理和數據挖掘。編程
所以,若是你是往數據挖掘工程方向發展,那麼,熟練掌握分佈式編程語言如scala、spark-mllib等可能更爲重要。網絡
Java程序員轉大數據工程師的學習路線圖:框架
第一步:分佈式計算框架運維
掌握hadoop和spark分佈式計算框架,瞭解文件系統、消息隊列和Nosql數據庫,學習相關組件如hadoop、MR、spark、hive、hbase、redies、kafka等;編程語言
第二步:算法和工具
學習瞭解各類數據挖掘算法,如分類、聚類、關聯規則、迴歸、決策樹、神經網絡等,熟練掌握一門數據挖掘編程工具:Python或者Scala。目前主流平臺和框架已經提供了算法庫,如hadoop上的Mahout和spark上的Mllib,你也能夠從學習這些接口和腳本語言開始學習這些算法。
第三步:數學
補充數學知識:高數、機率論和線代
第四步:項目實踐
1)開源項目:tensorflow:Google的開源庫,已經有40000多個star,很是驚人,支持移動設備;
2)參加數據競賽
3)經過企業實習獲取項目經驗
若是你僅僅是作大數據開發和運維,則能夠跳過第二步和第三步,若是你是側重於應用已有算法進行數據挖掘,那麼第三步也能夠先跳過。