分析報告、統計分析與數據挖掘的區別(轉)

 
「分析報告給你後見之明 (hindsight);統計分析給你先機 (foresight);數據挖掘給你洞察力 (insight)」舉個例子說:你看到孫悟空跟二郎神打仗,而後寫了個分析報告,說孫悟空在柔韌性上優點明顯,二郎神在力氣上出類拔萃,因此剛開始不相上下;結果兩我的跑到竹林裏,在竹子上面打,孫悟空的優點發揮出來,因此孫悟空贏了。這叫分析報告。孫悟空要跟二郎神打架了,有個賭徒找你預測。你作了個統計,發現兩人鬥爭4567次,其中孫悟空贏3456次。另外,孫悟空×××魔王,勝率是89%,二郎神×××魔王勝率是71%。你得出趨勢是孫悟空贏。由於你假設了此次勝利跟歷史的關係,根據經驗做了一個假設。這叫統計分析。你什麼都沒作,讓計算機本身作關聯分析,自動找到了出身、教育、經驗、單身四個因素。得出結論是孫悟空贏。計算機經過分析發現貧苦出身的孩子通常比皇親國戚功夫練得刻苦;打架經驗豐富的人由於擅長利用環境而機會更多;在都遇獲得明師的狀況下,貧苦出身的孩子功夫可能會高些;單身的人功夫總比一樣環境非單身的高。孫悟空遇到的名師不亞於二郎神,而打架經驗絕對豐富,而且單身,因此此次打頭,孫悟空贏。這叫數據挖掘。數據挖掘跟OLAP的區別在於它沒有假設,讓計算機找出這種背後的關係,而這種關係多是你所想獲得的,也多是所想不到的。好比數據挖掘找出的結果發如今2億條打鬥記錄中,姓孫的跟姓楊的打,老是姓孫的勝利,孫悟空姓孫,因此,悟空勝利。用在現實中,咱們舉個例子來講,作OLAP分析,咱們找找哪些人老是不及時向電信運營商繳錢,通常會分析收入低的人每每會繳費不及時。經過分析,發現不及時繳錢的窮人佔71%。而數據挖掘則不一樣,它本身去分析緣由。緣由多是,家住在五環之外的人,不及時繳錢。這些結論對推動工做有很深的價值,好比在五環外做市場調研,發現須要創建更多的合做渠道以方便繳費。這是數據挖掘的價值。
相關文章
相關標籤/搜索