http://www.36dsj.com/archives/40815機器學習
這篇文章裏,有三位來自不一樣公司的大數據運營人員各自分享了他們運用大數據的經驗。這三位是來自維亞康姆(Viacom)的Luzzi、Globys公司的Olly Downs以及知名市場顧問公司Dunnhumby的CEO Andy Hill。工具
就算一個公司擁有再多的數據,也不能表明它就必定會得到商業上的成功。只有真正懂得如何利用大數據,瞭解到公司利用大數據能夠達到什麼目標,公司最終纔有可能真正成功。在公司在發展過程當中每每也會面臨諸多選擇,也只有目標設定明確了,纔可以縮小選擇範圍聚焦精力去發展。企業應時刻保持頭腦清醒,朝着本身定好的目標前進,纔有助於公司進行持續長久的良好運做。學習
不過,Luzzi也表示,有時候,利用太複雜先進的數據分析工具每每也會帶來不少問題,不過若是咱們可以經過分析大量的數據來獲得最終的結果,那就不用懷疑了,你就幹吧,至少方向確定是對的。大數據
如今,企業能夠作到一些他們以往沒有能力作到的事。對於不少公司來講,可供分析的數據更多,能夠用來分析數據的工具和方法也比之前更先進方便。公司已經徹底有能力去分析和處理他們收集到的大量數據,這對於企業來講或許是件好事,然而,有時候這些數據也會過於分散。數據分析
Globys公司的Olly Down表示說,如今,不少公司都傾向於收集精度較高的數據,由於得到的數據越精確,就越有利於分析受衆羣體,也更有利於公司進行相關戰略和產品的調整。不過,公司每每須要花費大量的時間去處理大量的數據,結果卻有可能不盡如人意,因此,在進行數據分析處理時,有時候沒有必要執着於某一棵「樹」長成什麼樣子,而應該注重這片「森林」,要懂得舍小取大。產品
在大數據的世界裏,最有價值和做用的數據每每十分稀少。要想找到真正有價值的數據,就如同大海撈針同樣困難。因此,爲了找到這些有價值的數據,企業內部應齊心合力通力合做,要常常保持有效的溝通和協做。方法
例如,爲了能更好地利用數據來分析公司的實際運營狀況,數據專家們應該瞭解公司決策者爲公司制定的戰略目標。反過來也同樣,公司決策者也應該知道,公司的數據團隊得出的分析結果,最終能給公司帶來什麼收益。統計
Luzzi 表示,以大數據做爲工具,他能夠創建模型來幫助公司作出商業決策。因爲公司決策者對公司總體運行狀況及所處商業環境更加了解,當決策者看到分析結果時,確定能看到一些他看不到的地方。但同時,決策者們也不會知道他是用什麼方法得出這些數據和結果的。經驗
Olly Downs也說,公司的數據團隊和各部門以及管理層應保持良好的溝通交流,這樣公司才能良好高效的運行,有效的協調配合須要經過有效的溝通交流來實現。有一個商業智能團隊爲預測公司的客戶流失率創建了一個模型,因爲你們缺乏有效的溝通,操做團隊認爲這個模型「頗有趣」,可是公司卻認爲這個模型沒有任何意義。數據
「若是你的公司僱傭了一個數據研究小組,他們宣稱本身創建了一個有效的模型,但是公司別的相關部門卻認爲這個模型沒有效果,緣由便在於兩者之間缺少溝通。」Downs表示。
機器學習指計算機模擬或實現人類的學習行爲,以獲取新的知識或技能,從而對自身功能進行改進。機器學習相比人工學習,速度更快,學習規模也更大,一個公司能經過機器學習較快地發現新的問題。
好比,爲了研究特定消費者的消費行爲模式,企業能夠研究用什麼樣的方式對單個消費者進行研究分析,依據不一樣的消費者選擇不一樣的模型,進而對消費者行爲進行追蹤研究。公司認爲,在單個消費者身上所需的分析時間是10分鐘,按照這個速度,公司共有260萬消費者須要調查追蹤,須要416000個分析員,天天工做10小時,天天觀察單個消費者8次,才能得出結果。顯然,若是真經過人工分析,那就須要花費太多的時間和精力了。
因此,Downs認爲,企業若是有大量的數據須要進行分析處理,最好的辦法就是讓機器代替人工來作,機器學習的速度很快,能在短期內同時分析大量的數據,這樣一來,所需的分析時間就會大大縮短。與人工分析相比,成本也會大大下降。
有時,企業是沒有能力去獲取數據的,也就無法用數據去解決問題。就算公司得到了一些數據,他們每每也不清楚這些數據最終可否解決他們的問題。
在這一點上,維亞康姆集團的Luzzi的建議是,一個數據是否有效,是否能幫助公司解決問題,最好詢問數據小組的意見。
Dunnhumby公司會對消費者數據進行統計和分析,這樣一來公司即可以瞭解到哪些數據是有用的,以及這些數據有多大價值。若是公司能收集到有價值的數據,公司實際經營中遇到的相關問題就能獲得有效解決。知名市場顧問公司Dunnhumby的 CEO Andy Hill表示,企業不只應該瞭解收集到的數據到底能解決哪些問題,更應該知道,哪些問題還不能經過這些數據獲得解決。若是還有一些問題解決不了,公司便須要繼續收集其餘維度的數據來補充。
有時候,重要的數據可能會被忽略。好比,當Downs爲他的前東家搭建交通狀況模型時,你們廣泛認爲天氣是預測交通情況的最重要因素。後來研究結果卻顯示,最影響那個地區交通情況的是當地學校的放學時間。當學生們放學時,堵車狀況尤其嚴重。
Downs說,從一開始的假設來看,咱們並無預見到會得出這樣的結論,因此,應謹慎認真對待數據,數據會真實客觀地告訴你想要的答案。有時,數據能告訴你的會讓你大吃一驚。
因爲人爲主觀因素和不相關數據的干擾,有時候得出的結論每每是錯誤的。
「不要讓不相干的數據影響到整個結果,有至關一部分的數據並不重要,這些不相關的‘樹’每每並不能表明整個‘森林’。」Luzzi說,「若是使用了錯誤的數據,得出的結論每每也是錯的。」
數據選擇上的錯誤會影響人們解決問題的過程,也會影響人們如何看待這些數據和結果。錯誤的數據選擇可能影響到公司作出相關決策。
Dunnhumby 公司的CEO Andy Hill表示:「爲了消除數據上的偏差,你須要準確找到特定的目標人羣,這些人的行爲每每能夠準確地回答你須要解決的問題。」