大數據分析是研究大量的數據的過程當中尋找模式,相關性和其餘有用的信息,能夠幫助企業更好地適應變化,並作出更明智的決策。下面整理了一些大數據分析能用到的工具,助力你們更好的應用大數據技術。編程
1、hadoop
Hadoop 是一個可以對大量數據進行分佈式處理的軟件框架。可是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,由於它假設計算元素和存儲會失敗,所以它維護多個工做數據副本,確保可以針對失敗的節點從新分佈處理。Hadoop 是高效的,由於它以並行的方式工做,經過並行處理加快處理速度。Hadoop 仍是可伸縮的,可以處理 PB 級數據。此外,Hadoop 依賴於社區服務器,所以它的成本比較低,任何人均可以使用。api
Hadoop帶有用 Java 語言編寫的框架,所以運行在 Linux 生產平臺上是很是理想的。Hadoop 上的應用程序也可使用其餘語言編寫,好比 C++。服務器
2、HPCC
HPCC,High Performance Computing and Communications(高性能計算與通訊)的縮寫。1993年,由美國科學、工程、技術聯邦協調理事會向國會提交了「重大挑戰項目:高性能計算與 通訊」的報告,也就是被稱爲HPCC計劃的報告,即美國總統科學戰略項目,其目的是經過增強研究與開發解決一批重要的科學與技術挑戰問題。HPCC是美國實施信息高速公路而上實施的計劃,該計劃的實施將耗資百億美圓,其主要目標要達到:開發可擴展的計算系統及相關軟件,以支持太位級網絡傳輸性能,開發千兆比特網絡技術,擴展研究和教育機構及網絡鏈接能力。網絡
3、 Smartbi
Smartbi是國內領先的BI廠商,企業級商業智能和大數據分析平臺,通過多年的持續發展,整合了各行業的數據分析和決策支持的功能需求。架構
Smartbi知足最終用戶在企業級報表、數據可視化分析、自助探索分析、數據挖掘建模、AI智能分析等大數據分析需求。產品普遍應用於領導駕駛艙、KPI監控看板、財務分析、銷售分析、市場分析、生產分析、供應鏈分析、風險分析、質量分析、客戶細分、精準營銷等管理領域。官網的產品培訓文檔也比較齊全,並且是公開的,學習操做易上手。框架
4、SPSS軟件
我從3.0開始Dos環境下編程分析,到如今版本的變遷也能夠看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始愈來愈重視商業分析,如今已經成爲了預測分析軟件。機器學習
5、RapidMiner
RapidMiner是世界領先的數據挖掘解決方案,在一個很是大的程度上有着先進技術。它數據挖掘任務涉及範圍普遍,包括各類數據藝術,能簡化數據挖掘過程的設計和評價。編程語言
6、Storm
Storm是自由的開源軟件,一個分佈式的、容錯的實時計算系統。Storm能夠很是可靠的處理龐大的數據流,用於處理Hadoop的批量數據。分佈式
Storm很簡單,支持許多種編程語言,使用起來很是有趣。Storm由Twitter開源而來,其它知名的應用企業包括Groupon、淘寶、支付寶、阿里巴巴、樂元素、Admaster等等。ide
Storm有許多應用領域:實時分析、在線機器學習、不停頓的計算、分佈式RPC(遠過程調用協議,一種經過網絡從遠程計算機程序上請求服務)、ETL(Extraction-Transformation-Loading的縮寫,即數據抽取、轉換和加載)等等。Storm的處理速度驚人:經測 試,每一個節點每秒鐘能夠處理100萬個數據元組。Storm是可擴展、容錯,很容易設置和操做。
7、SAS軟件
SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來說,SAS比較難學些,但若是掌握了SAS會更有價值,好比離散選擇模型,抽樣問題,正交實驗設計等仍是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收穫的。
8、Apache Drill
爲了幫助企業用戶尋找更爲有效、加快Hadoop數據查詢的方法,Apache軟件基金會近日發起了一項名爲「Drill」的開源項目。Apache Drill 實現了 Google's Dremel。該項目將會建立出開源版本的谷歌Dremel Hadoop工具(谷歌使用該工具來爲Hadoop數據分析工具的互聯網應用提速)。而「Drill」將有助於Hadoop用戶實現更快查詢海量數據集的目的。
經過開發「Drill」Apache開源項目,組織機構將有望創建Drill所屬的API接口和靈活強大的體系架構,從而幫助支持普遍的數據源、數據格式和查詢語言。
國內的數據分析軟件,Smartbi的產品和服務挺不錯,老牌專業的BI廠商。功能成熟全面,安裝部署一次,就能使用企業報表平臺、自助探索分析和數據挖掘產品,性能也不錯,跑個億級數據量,秒級響應,值得推薦!