如何高效快速的學習大數據

 

 

常常有初學者在博客和QQ問我,本身想往大數據方向發展,該學哪些技術,學習路線是什麼樣的,以爲大數據很火,就業很好,薪資很高。。。。。。。若是本身很迷茫,爲了這些緣由想往大數據方向發展,也能夠,那麼我就想問一下,你的專業是什麼,對於計算機/軟件,你的興趣是什麼?是計算機專業,對操做系統、硬件、網絡、服務器感興趣?是軟件專業,對軟件開發、編程、寫代碼感興趣?仍是數學、統計學專業,對數據和數字特別感興趣。。ios

其實這就是想告訴你的大數據的三個發展方向,平臺搭建/優化/運維/監控、大數據開發/設計/架構、數據分析/挖掘。請不要問我哪一個容易,哪一個前景好,哪一個錢多。數據庫

我先普及一下大數據的4V特徵:編程

  1. 數據量大,TB->PB服務器

  2. 數據類型繁多,結構化、非結構化文本、日誌、視頻、圖片、地理位置等;網絡

  3. 商業價值高,可是這種價值須要在海量數據之上,經過數據分析與機器學習更快速的挖掘出來;架構

  4. 處理時效性高,海量數據的處理需求再也不侷限在離線計算當中。框架

現現在,開源的大數據框架愈來愈多,愈來愈強,以下是我列舉的關於大數據技術方面的幾個服務框架:運維

文件存儲:Hadoop HDFS、Tachyon、KFS機器學習

離線計算:Hadoop MapReduce、Spark分佈式

流式、實時計算:Storm、Spark Streaming、S四、Heron

K-V、NOSQL數據庫:HBase、Redis、MongoDB

資源管理:YARN、Mesos

日誌收集:Flume、Scribe、Logstash、Kibana

消息系統:Kafka、StormMQ、ZeroMQ、RabbitMQ

查詢分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid

分佈式協調服務:Zookeeper

集羣管理與監控:Ambari、Ganglia、Nagios、Cloudera Manager

數據挖掘、機器學習:Mahout、Spark MLLib

數據同步:Sqoop

任務調度:Oozie

這麼多東東,怎麼開始,怎麼學習,別急,小編告訴你怎麼玩這些:大數據學習資料分享羣119599574 無論你是小白仍是大牛,小編我都挺歡迎,不按期分享乾貨,包括我本身整理的一份最新的適合2018年學習的大數據開發和零基礎入門教程,歡迎初學和進階中的小夥伴

相關文章
相關標籤/搜索