R語言與Tableau集成之可視化應用

Tableau是一款很是棒的數據可視化商業軟件,經過拖拉拽的方式迅速的實現數據可視化。並且該軟件能夠鏈接任何一種數據庫,在處理大型數據時一點都不遜色。下面展現幾幅Tableau繪製的圖形:算法

clipboard.png

面積圖、條形圖的綜合使數據庫

clipboard.png

該圖反映的是2014年全球飢餓指數,將數據繪製在地圖中服務器

clipboard.png

這是一幅颶風行走的路徑圖,粗細反映了颶風的風速函數

clipboard.png

這是一幅很是流行的桑基圖工具

從上面的幾幅圖中發現,該軟件做圖效果仍是很是炫酷的,遺憾的是,其沒法從事數據分析和挖掘工做,即沒法直接將數據分析或挖掘的結果進行可視化。幸運的是,從Tableau的8.0開始,Tableau與R語言打通,能夠在Tableau中運行R腳本,從而將R語言的分析或挖掘結果在Tableau中展現,可謂強強聯手,所向披靡。性能

下文就跟你們說說如何實現Tableau和R語言的聯手,繪製聯手後的可視化。首先須要在R中下載Rserve包,經過該包,實現兩個軟件的打通。spa

install.packages(‘Rserve’)

library(Rserve)

這裏必須使用下面函數,表示啓動R服務器code

Rserve()

其次,經過Tableau鏈接R語言。ip

在Tableau界面下鏈接R語言:「幫助」——「設置和性能」——「管理R鏈接」,輸入服務器及端口號便可成功鏈接(這裏的服務器是本地機算計,故服務器填’localhost’)。以下圖所示:數據分析

clipboard.png

上圖顯示R語言與Tableau鏈接成功。完成前面兩步後,最後實戰一下二合一的效果,具體請看下圖。

1、如何將統計學意義的異常值尋找出來?

經過R建立異常值字段:

clipboard.png

字段腳本以下:

clipboard.png

clipboard.png

上圖的異常值判斷標準是:超過上四分位數的1.5倍四分位距或低於下四分位數的1.5倍四分位距。

2、連續變量的預測

雖然Tableau能夠直接繪製趨勢線,並根據趨勢線作預測,可是這僅僅是一個因變量與一個自變量之間的趨勢關係,以下圖繪製的利潤趨勢僅僅與時間維度相關:

clipboard.png

若是影響利潤的因素由銷售數量、銷售額和折扣率三個變量組成,該如何將回歸後的預測體如今圖中呢?

經過R擬合預測值:

clipboard.png

字段腳本以下:

clipboard.png

Tableau展現結果:

clipboard.png

從圖中的結果顯示,預測與實際的趨勢一致,是一個比較理想的預測模型。

3、聚類分析

聚類分析是數據挖掘中無監督的算法之一,R語言能夠很是便捷的實現各類聚類算法,如K-Means、K中心、EM指望最大法、層次分析等,下面就是要K均值算法的距離結果在Tableau中展現:

clipboard.png

clipboard.png

Tableau展現結果:

clipboard.png

很是便捷,這就輕鬆搞定聚類結果的可視化。

若是你手頭有試用期內的Tableau或已經買了並在工做中正在使用,不妨試試Tableau與R語言的結合,這會讓你感嘆不已:強大的可視化工具與強大的統計分析工具讓你的工做變得更加高效和方便。

相關文章
相關標籤/搜索