1、爲何須要數據挖掘?算法
咱們知道,BI能夠輔助決策,BI應用按照不一樣的程度可分爲現狀分析、緣由分析、預測分析。數據庫
現狀分析洞察發生了什麼?例如企業運營好了仍是壞了?經營指標完成狀況?業務構成?各項業務構成、發展及變更等。編程
緣由分析進一步洞察爲何會發生?例如去年利潤環比降低10%什麼緣由致使的?年度的銷售量目標爲何未達成?網絡
預測分析洞察未來要發生什麼?例如明年公司業績將會是多少?哪些客戶可能流失?機器學習
不論是現狀分析,仍是緣由分析,經過OLAP均可以實現。可是,OLAP實現不了預測分析,而預測偏偏就是數據挖掘最擅長的。編程語言
2、什麼是數據挖掘?工具
數據挖掘是按照預約的規則對數據庫和數據倉庫中已有的數據進行信息開採、挖掘和分析,從中識別和抽取隱含的模式和有趣知識,爲決策者提供決策依據。數據挖掘的任務是從數據中發現模式。模式有不少種,按功能可分爲兩大類:預測型(Predictive)模式和描述型(Descriptive)模式。學習
預測型模式是能夠根據數據項的值精準肯定某種結果的模式。挖掘預測型模式所使用的數據也都是能夠明確知道結果的。描述型模式是對數據中存在的規則作一種描述,或者根據數據的類似性把數據分組。描述型模式不能直接用於預測。在實際應用中,根據模式的實際做用,可細分爲分類模式、迴歸模式、時間序列模式、聚類模式、關聯模式和序列模式6 種。其中包含的具體算法有貨籃分析(Market Analysis)、聚類檢測(Clustering Detection)、神經網絡(Neural Networks)、決策樹方法(Decision Trees)、遺傳算法(Genetic Analysis)、鏈接分析(Link Analysis)、基於範例的推理(Case Based Reasoning)和粗集(RoughSet)以及各類統計模型。測試
3、OLAP與數據挖掘的區別?優化
OLAP 與數據挖掘的區別是:OLAP 側重於與用戶的交互、快速的響應速度及提供數據的多維視圖,而數據挖掘則注重自動發現隱藏在數據中的模式和有用信息,儘管容許用戶指導這一過程。OLAP 的分析結果能夠給數據挖掘提供分析信息做爲挖掘的依據,數據挖掘能夠拓展OLAP 分析的深度,能夠發現OLAP 所不能發現的更爲複雜、細緻的信息。數據挖掘的研究重點則偏向數據挖掘算法以及數據挖掘技術在新的數據類型、應用環境中使用時所出現新問題的解決上,如對各類非結構化數據的挖掘、數據挖掘語言的標準化以及可視化數據挖掘等。
簡單來講,OLAP揭示的是已知的、過去的數據關係,數據挖掘揭示的是未知的、未來的數據關係。因此,數據挖掘能夠用來作預測!
4、爲何須要數據挖掘?
數據挖掘是如何作到預測的?由於數據挖掘有一套標準的流程,能夠對數據進行各類科學的處理和測試,從而發現數據自己隱藏的規律。這套流程歸納起來包括業務理解、數據準備、創建模型和評估模型4個步驟,咱們以「預測銀行零售客戶流失」這個應用場景爲例進行說明:
第1步:業務理解
肯定目標,明確分析需求
預測哪些銀行零售客戶將會流失,提早作好營銷挽留。
第2步:數據準備
收集原始數據、檢驗數據質量、整合數據、格式化數據
初步判斷客戶可能會流失的狀況,如銀行卡交易量逐月降低、客戶投訴持續不斷,對跟這些狀況有關的數據進行採集、格式化。
第3步:創建模型
選擇建模技術、參數調優、生成測試計劃、構建模型
客戶是否會流失,是一個分類問題,因此選擇分類算法創建模型並進行訓練。
第4步:評估模型
對模型進行全面的評估,評估結果、重審過程
對創建好的模型進行評估,而且要根據預測結果不斷調整模型參數,實現模型的最優化。
5、數據挖掘工具的使用
整個數據挖掘流程最關鍵是模型的迭代優化,模型算法有分類算法、迴歸算法、聚類算法等,每種算法類型又包含多種不一樣的算法,例如分類算法,就包含邏輯迴歸、樸素貝葉斯、決策樹等,使用的編程語言有Java語言、Python語言、R語言。挖掘挖掘不只須要紮實的計算機知識,並且還涉及到統計學、模型算法等技術,學習門檻很高,通常是專業技術人員在使用。
可是,藉助市場上提供的數據挖掘工具,能夠把數據挖掘的流程大大簡化,讓普通的分析人員也能夠快速掌握。例如,由思邁特軟件推出的數據挖掘工具Smartbi Mining,以互聯網式用戶體驗爲設計目標,極簡風格的流式建模,快速實現各類類型的數據挖掘應用,爲我的、團隊和企業所作的決策提供預測性分析。
Smartbi Mining具有流程化、可視化的建模界面,內置實用的、經典的統計挖掘算法和深度學習算法,這些算法配置簡單下降了機器學習的使用門檻,大大節省了成本,業務人員可經過輕鬆拖拉拽組件的操做,進行可視化建模,完成模型流程的搭建,並能將模型發佈管理。
6、數據挖掘的應用場景
數據挖掘可普遍應用於各個領域,包括企業運營、生產控制、市場分析、工程設計、城市規劃和科學探索等,下面是幾個在企業運營領域的典型應用場景:
一、精準營銷
分析客戶的屬性和消費行爲,爲客戶推薦最合適的產品信息,提升營銷的效果。
二、客戶保留
分析客戶在購買產品方面的行爲變化和滿意度狀況,預測可能會流失的客戶,提早作好挽留工做。
三、銷量預測
分析產品的歷史銷售數據,預測將來一段時間的產品銷量,爲生產、庫存提早作好準備。
四、價格預測
收集市場上影響產品價格的各類數據進行分析,預測產品價格的發展趨勢,搶佔市場先機。
五、信用評分
分析客戶的基本信息和消費、還貸等記錄,對客戶信用進行評分,防範信用風險,減小損失。
不論是OLAP,仍是數據挖掘,數據分析技術一直都在創新發展。將來隨着BI融合AI的不斷深刻,數據分析也將變得更加智能,更加易用。咱們須要根據實際的應用場景,選擇最適合的分析工具來提升工做效率,從而更好地指導業務決策,讓BI發揮出更多的效益!