常常有初學者在博客和QQ問我,本身想往大數據方向發展,該學哪些技術,學習路線是什麼樣的,以爲大數據很火,就業很好,薪資很高。。。。。。。若是本身很迷茫,爲了這些緣由想往大數據方向發展,也能夠,那麼我就想問一下,你的專業是什麼,對於計算機/軟件,你的興趣是什麼?是計算機專業,對操做系統、硬件、網絡、服務器感興趣?是軟件專業,對軟件開發、編程、寫代碼感興趣?仍是數學、統計學專業,對數據和數字特別感興趣。。ios
其實這就是想告訴你的大數據的三個發展方向,平臺搭建/優化/運維/監控、大數據開發/設計/架構、數據分析/挖掘。請不要問我哪一個容易,哪一個前景好,哪一個錢多。數據庫
我先普及一下大數據的4V特徵:編程
數據量大,TB->PB服務器
數據類型繁多,結構化、非結構化文本、日誌、視頻、圖片、地理位置等;網絡
商業價值高,可是這種價值須要在海量數據之上,經過數據分析與機器學習更快速的挖掘出來;架構
處理時效性高,海量數據的處理需求再也不侷限在離線計算當中。框架
現現在,開源的大數據框架愈來愈多,愈來愈強,以下是我列舉的關於大數據技術方面的幾個服務框架:運維
文件存儲:Hadoop HDFS、Tachyon、KFS機器學習
離線計算:Hadoop MapReduce、Spark分佈式
流式、實時計算:Storm、Spark Streaming、S四、Heron
K-V、NOSQL數據庫:HBase、Redis、MongoDB
資源管理:YARN、Mesos
日誌收集:Flume、Scribe、Logstash、Kibana
消息系統:Kafka、StormMQ、ZeroMQ、RabbitMQ
查詢分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid
分佈式協調服務:Zookeeper
集羣管理與監控:Ambari、Ganglia、Nagios、Cloudera Manager
數據挖掘、機器學習:Mahout、Spark MLLib
數據同步:Sqoop
任務調度:Oozie
這麼多東東,怎麼開始,怎麼學習,別急,小編告訴你怎麼玩這些:大數據學習資料分享羣119599574 無論你是小白仍是大牛,小編我都挺歡迎,不按期分享乾貨,包括我本身整理的一份最新的適合2018年學習的大數據開發和零基礎入門教程,歡迎初學和進階中的小夥伴