學了大數據能幹啥

對於剛入行大數據的朋友,有很多不清楚大數據究竟是作什麼的。今天這篇文章我結合我本身的經歷,按照數據處理的上下游關係,簡單劃分目前大數據的職位:算法

大數據框架開發工程師:主要開發分佈式計算、存儲框架,這個崗位主要在大公司有應用,尤爲是雲計算業務,中小企業基本上應用雲服務或者開源的框架,如:Hadoop、Spark、Flink數據庫

大數據/ETL開發工程師:應用 Hadoop 、 Spark、Flink等大數據框架,處理實時或離線的日誌數據,落地到數據庫或者分佈式文件系統編程

數據倉庫工程師:進行數據建模,提供方便的數據服務,工做核心是數據倉庫的分層設計,設計數倉中每一個表的結構以及表之間的關係。目前主流的建模方式爲維度建模,實現技術主要是 Hive框架

BI/數據分析師:主要是作基本的報表開發,對數據進行分析,從數據中挖掘價值,對數據進行解讀,指導商業決策。這塊不太側重編程,但最好對數據有感興趣,平時須要注重培養對數據的敏感度機器學習

機器學習/數據挖掘:從數據發現規律和特徵,利用機器學習或深度學習挖掘數據的價值或者潛在問題,對將來進行預測。這塊更須要系統的機器學習的知識分佈式

實際工做中職位界限不會劃分這麼清晰,可能每一個人負責的內容會涉及幾個方面。好比BI開發須要會數據建模,同時解讀數據可能也會用上機器學習算法。oop

但願每一個想從事大數據的朋友都能結合本身的興趣,找準位置。學習

 

公衆號「渡碼」,分享更多高質量內容大數據

相關文章
相關標籤/搜索