簡單來講,咱們能夠把大數據分析工具簡單分紅兩個維度:數據庫
第一維度:數據存儲層——數據報表層——數據分析層——數據展示層編程
第二維度:用戶級——部門級——企業級——BI級工具
一、數據存儲層學習
數據存儲涉及到數據庫的概念和數據庫語言,這方面不必定要深鑽研,但至少要理解數據的存儲方式、數據的基本結構和數據類型。SQL查詢語言必不可少,精通最好。可從經常使用的select查詢,update修改,delete刪除,insert插入的基本結構和讀取入手。開發工具
Access2003. Access07等 ,這是最基本的我的數據庫,常常用於我的或部分基本的數據存儲;MySQL數據庫,這個對於部門]級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力;大數據
SQL Server 2005或更高版本,對中小企業, - -些大型企業也能夠採用SQL Server數據庫,其實這個時候自己除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;spa
DB2,Oracle數據庫都是大型數據庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了, 通常大型數據庫公司都提供很是好的數據整合應用平臺;插件
BI級別,實際上這個不是數據庫,而是創建在前面數據庫基礎上的,企業級應用的數據倉庫。DataWarehouse,創建在DW級上的數據存儲基本上都是商業智能平臺,整合了各類數據分析,報表、分析和展示! BI級別的數據倉庫結合BI產品也是近幾年的大趨勢。設計
.在入門學習大數據的過程中有碰見學習,行業,缺少系統學習路線,系統學習規劃,歡迎你加入個人大數據學習交流裙:251956502 ,裙文件有我這幾年整理的大數據學習手冊,開發工具,PDF文檔書籍,你能夠自行下載。接口
二、報表層
企業存儲了數據須要讀取,須要展示,報表工具是最廣泛應用的工具,尤爲是在國內。傳統報表解決的是展示問題,目前國內的帆軟報表FineReport已經算在業內作到頂尖,是帶着數據分析思想的報表,因其優異的接口開放功能、填報、表單功能,可以作到打通數據的進出,涵蓋了早期商業智能的功能。
Tableau,同FineBI同樣,可分在報表層也可分爲數據展示層。FineBI和Tableau同屬於近年來很是棒的軟件,可做爲可視化數據分析軟件,我經常使用FineBI從數據庫中進行報表和可視化分析。相對而言,可視化Tableau更優,但FineBI又有另外一種身份——商業智能,因此在大數據處理方面的能力更勝一籌。
三、數據分析層
這個層其實有不少分析工具,固然咱們最經常使用的就是Excel ,我常常用的就是統計分析和數據挖掘工具;
Excel軟件,首先版本越高越好用這是確定的;固然對Excel來說不少人只是掌握了5%Excel功能,Excel功能很是強大,甚至能夠完成全部的統計分析工做!可是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;
SPSS軟件:當前版本是18,名字也改爲了PASW Statistics ;我從3.0開始Dos環境下編程分析,到如今版本的變遷也能夠看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始愈來愈重視商業分析,如今已經成爲了預測分析軟件;
SAS軟件: SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來說,SAS比較難學些,但若是掌握了SAS會更有價值,好比離散選擇模型,抽樣問題,正交實驗設計等仍是SAS比較好用,另外, SAS的學習材料比較多,也公開,會有收穫的!
JMP分析: SAS的一個分析分支
XLstat : Excel的插件,能夠完成大部分SPSS統計分析功能
四、表現層
表現層也叫數據可視化,以上每種工具都幾乎提供了一點展示功能。FineBI和Tableau的可視化功能上文有提過。其實,近年來Excel的可視化愈來愈棒,配上一些插件,使用感更佳。
PPT:辦公經常使用,用來寫數據分析報告;
Xmind&百度腦圖:梳理流程,幫助思考分析,展示數據分析的層次;
Xcelsius軟件:Dashboard製做和數據可視化報表工具,能夠直接讀取數據庫,在Excel裏建模,互聯網展示,最大特點仍是能夠在PPT中實現動態報表。
最後,須要說明的是,這樣的分類並非區分軟件,只是想說明軟件的應用。有時候咱們把數據庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展示;固然有時候展示就是分析,分析也是報表,報表就是數據存儲了!