R語言與Tableau集成之可視化應用

做者 | CDA數據分析師

Tableau是一款很是棒的數據可視化商業軟件,經過拖拉拽的方式迅速的實現數據可視化。並且該軟件能夠鏈接任何一種數據庫,在處理大型數據時一點都不遜色。缺點是其沒法從事數據分析和挖掘工做,幸運的是,從Tableau的8.0開始,Tableau與R語言打通,能夠在Tableau中運行R腳本,從而將R語言的分析或挖掘結果在Tableau中展現。算法

如何實現Tableau和R語言的聯手繪製可視化圖表呢?數據庫

首先須要在R中下載Rserve包小程序

install.packages(‘Rserve’)服務器

library(Rserve)工具

啓動R服務器性能

Rserve()spa

其次,經過Tableau鏈接R語言。 在Tableau界面下鏈接R語言:「幫助」——「設置和性能」——「管理R鏈接」,輸入服務器及端口號便可成功鏈接(這裏的服務器是本地機算計,故服務器填’localhost’)。3d

1、如何將統計學意義的異常值尋找出來? 經過R建立異常值字段:blog

上圖的異常值判斷標準是:超過上四分位數的1.5倍四分位距或低於下四分位數的1.5倍四分位距。 2、連續變量的預測 雖然Tableau能夠直接繪製趨勢線,並根據趨勢線作預測,可是這僅僅是一個因變量與一個自變量之間的趨勢關係,以下圖繪製的利潤趨勢僅僅與時間維度相關:rem

若是影響利潤的因素由銷售數量、銷售額和折扣率三個變量組成,該如何將回歸後的預測體如今圖中呢? 經過R擬合預測值:

從圖中的結果顯示,預測與實際的趨勢一致,是一個比較理想的預測模型。 3、聚類分析 聚類分析是數據挖掘中無監督的算法之一,R語言能夠很是便捷的實現各類聚類算法,如K-Means、K中心、EM指望最大法、層次分析等,下面就是要K均值算法的距離結果在Tableau中展現:

強大的可視化工具與強大的統計分析工具讓你的工做變得更加高效和方便。

進入CDA官方小程序,解鎖更多新鮮資訊和優質內容,還有免費試聽課程,千萬不能錯過喲!

相關文章
相關標籤/搜索