關於數據分析,在這以前你可能聽過這樣的故事:算法
奧克蘭「運動家球隊」一反傳統球隊依據擊球率選拔球員,經過數據分析依據「高上壘率」選取了所需的低價球員,取得20連勝最終奪冠;數據庫
零售帝國沃爾瑪在一次例行的數據分析以後發現: 跟尿布一塊兒搭配購買最多的商品,竟是啤酒!工具
Target超市給女孩郵寄嬰兒服裝和孕婦服裝的優惠券,比女孩的父親更先知道了該女孩懷孕;oop
一頭剛出生30天的豬,數據預測它的生長週期,進而看到「人爲刀俎,我爲魚肉」;大數據
在這背後都是大量技術人員專業的規律統計、數據預測和相關性分析。spa
專業的數據分析仍是有必定技術門檻的。可是近兩年,不少公司的業務都已經結合着數據分析去開展,好比產品運營須要作運營數據分析,財務管理須要作財務分析,庫存管理須要分析產品流轉存儲,這其中最廣泛應用的就是BI。設計
BI全稱商業智能(Business Intelligence),在傳統企業中,它是一套完整的解決方案。將企業的數據有效整合,快速製做出報表以做出決策,涉及數據倉庫,ETL,OLAP,權限控制等模塊。排序
BI工具主要有兩種用途。hadoop
一種是利用BI製做自動化報表,數據類工做天天都會接觸大量數據,而且須要整理彙總,這是一塊很大的工做量。這部分工做能夠交給BI自動化完成,從數據規整、建模到下載。rem
另一種是使用其可視化功能進行分析,BI的優勢在於它提供比Excel更豐富的可視化功能,操做簡單上手,並且美觀,若是你們天天做圖須要兩小時,BI會縮短一半時間。
在這裏,本文想強勢安利一款數據BI——FineBI,探索性的分析操做、分析圖表、數據挖掘,能引導數據走向真相,關鍵不須要寫代碼就能直接上手。
如下是介紹綱要:
通常要分析的數據五花八門,數據量小能夠用Excel解決。數據量大,大到錯綜複雜各式各樣億萬級數據量的企業數據庫,Oracel、DB二、SAP HANA\大數據kylin、hadoop等,FineBI都能直接鏈接,或者直接導入本地Excel分析也行。
這裏假設我已經鏈接好了數據源,以後要開始分析。咱們來看下FineBI是如何操做一個數據分析的:
一、準備數據:選數據表和要用到的數據字段
自助數據集這個功能裏,能夠自行選擇數據表和須要用到的數據字段。數據太多,不知道如何入手,因此在開始分析以前,儘量明確你的分析目標是什麼,而後選擇做用的數據。
二、清洗數據:數據加工,規整數據
好的數據是數據分析成功的基礎。通常來講,咱們拿到數據以後,數據並非那麼完美,對於自己質量不好的數據進行分析每每是南轅北轍的,得出來的分析結果也是錯誤的,進步還會誤導咱們對事情自己的判斷,作出錯誤的決策。因此可能咱們在開始拿到數據後,須要對數據進行梳理,這也就是咱們一般所說的數據清洗。好比某些數據缺失,好比增長一些數據字段,好比列重命名 、數據類型轉換、異常值處理、合併數據等等。
在FineBI自助數據集功能裏, 能夠對數據實現過濾、分組彙總、新增列、字段設置、排序、合併等等操做,能夠把數據進行規整。
不明白能夠看下方的示意:
若是還不能明白,FineBI設置了自動數據清洗的功能,經過點擊鼠標就可以完成你對有缺陷數據的清洗。
一、智能推薦圖表
圖表展現數據必定是最直觀的。但實際上咱們可能不明白爲何要選用柱狀圖,不知道選用了漏斗圖是什麼意思。當你想分析兩個或者兩個以上數據字段的相關性時,FineBI會自動爲你選擇最合適的圖表,每種圖表背後都有很強的數據分析算法,能夠幫助你先初步瞭解你的數據狀況,邁出數據分析的第一步。不用再花時間想用什麼圖表,隨便拖拽就行了,所思即所見,所見即所得。
二、可視化不只是爲了美,更是幫助分析
FineBI基於著名的圖形語法(The Grammar Of Graphics)設計改良,提供了無限的視覺分析可能,咱們稱之爲「無限圖表類型」。FineBI取消了傳統圖表類型的概念,取代以'形狀'和形狀對應的'顏色','大小','提示',‘標籤’等屬性;取消了'分類'、'系列'等概念,取代以'橫軸'、 '縱軸'兩個方向。
上面這句話是官方的,比較拗口。簡單來說就是,FineBI既讓你保留了傳統固定圖表的分析習慣,你能夠基於智能推薦的結果去調整對應圖表類型,但更打破了傳統,鼓勵你去基於你的思考去造成你的分析,全部形狀、顏色、大小、提示、標籤、圖表、警惕標識都將是你思考點的體現,而再也不用圖表去限制你的思考。
什麼意思呢,以上面所取的數據爲例,來看一個大區銷售額的對比分析:
拖拽字段,智能推薦了最經常使用的柱狀圖。
咱們可能更習慣橫向去看具體銷售額的數值,從上到下去看對比狀況,這時咱們但願橫縱軸切換一下分析維度,直接一鍵切換,能夠看到切換後意外地發現造成了咱們熟悉的條形圖。
甚至能夠設置形狀的顏色不一樣來區分大區,設置形狀的大小來表示銷售額,甚至直接替換形狀。
以上幾個步驟,就是FineBI的基礎操做,能夠初步的丟手頭的數據有個大體的瞭解,初步造成分析思路。
接下來就要講講計算處理數據的部分。
OLAP分析,老生常談的分析技術,對數據進行鑽取、放大、過濾、維度切換、跳轉、聯動、導出、複用等等。
經過FineBI的OALP分析,能夠輕鬆玩轉你的數據,從大到小,由淺及深,探索數據之間的深層關聯。
好比對區域-門店-品牌-銷售額不一樣維度之間,快速進行特定區域、門店-品牌的銷售額分析。
一、搭建各類業務分析模型
真正的數據分析工具,一定脫離不了數據分析模型。長期以來,數據分析的先驅和專家們,沉澱出了不可勝數經典的數據分析模型,在諸多領域和行業中獲得了普遍的應用,也帶來了實質的業務價值,同時,經典的數據分析模型,有利於咱們快速上手數據分析,減小自我探索過程當中的彎路。
因爲FineBI能夠各類處理數據:新建數據字段、介入計算公式、過濾等等,因此能再分析時搭建各類業務模型,諸如金字塔模型、KANO分析模型、RFM模型、購物籃分析模型、四象限模型等等。
以RFM模型搭建爲例,從最基礎的數據(下圖1)到成功搭建一個RFM模型(下圖2),再到進行模型應用(下圖3),只要不到10分鐘的實際。以前研究過RFM客戶價值模型,在市面上尋找體驗了許多分析工具,FineBI絕對是國內製做RFM模型最高效便捷的軟件。
顧客購買的原始數據:
通過數據處理快速搭建出RFM價值模型:
二、數據挖掘和R語言
數據挖掘是結合數學統計知識,更深刻的挖掘數據之間的內在聯繫。好比面向過去,發現潛藏在數據表面之下的歷史規律或模式,稱之爲描述性分析;或面向將來,對將來趨勢進行預測,稱之爲預測性分析。
FineBI提供了5種現成的數據挖掘模型,時序預測、聚類、分類預測、迴歸和關聯分析。也就是說,若是你想預測將來的銷售額,你想智能地給用戶羣分類,或者你想知道短信發給哪一個用戶得到的反饋可能性比較大,將會成爲現實。
除此以外和集成了R語言,能夠直接在FineBI中進行R語言編譯,實現更多數據挖掘分析需求,一手寫法,一手用FineBI出可視化報告。
預測1:基於過去的航空公司乘客數據預測將來十個月的乘客數量:
預測2:基於已有會員數據預測未註冊客戶的會員等級
預測3:根據花萼長度和寬度、花瓣長度和寬度來對花卉種類分類:
好馬配好鞍,最終的數據分析結果天然少不了一副好的皮囊。做爲一款專業的數據分析工具來說,FineBI的可視化功能也十分強大,能夠製做各類可視化的報告,爲數據分析錦上添花。最終數據分析的結果天然要來貼上幾張可視化的圖,直接來查看下FIneBI數據可視化的效果: