Spark機器學習 Day2 快速理解機器學習

Spark機器學習 Day2

快速理解機器學習

有兩個問題:編程

  1. 機器學習究竟是什麼。
  2. 大數據機器學習究竟是什麼。

機器學習究竟是什麼

人正常思惟的過程是根據歷史經驗得出必定的規律,而後在當前狀況下根據這種規律來預測當前的狀況下該怎麼作,這種過程就是一個機器學習的過程。機器學習

咱們能夠發現,這個過程裏有規律和當前的狀況。規律就是模型,當前狀況就是當前的數據,會根據當前的狀況會根據不一樣的規律來得出不一樣的結論來驅動下一個行爲,就是數據驅動的一種決策方式,這和咱們編程用的指令驅動方式是徹底不一樣的。學習

機器學習是根據統計學的理論,得出影響咱們結果的幾個變量,有應變量和自變量。大數據

例如想預測房價,會根據歷史房價波動的因素,判斷哪些會影響房價,得出一個房價模型,就會根據具體地方和具體時間來預測房價,機器學習也是從數據中得出某種模型的。spa

機器學習其實和人的決策過程是同樣的。spark

大數據機器學習是什麼

爲何大數據機器學習特別重要,由於不管創建模型仍是得出結果都是數據驅動的過程,而數據驅動顯然在大數據和分佈的狀況下數據面更多,得出的模型更爲合理,當前狀況若是有更多的數據,得出的結論會更準確。變量

因此大數據機器學習已經成爲了業界的主流,有着很是普遍的應用。統計

欲知後事如何,且聽下回分解!

DT大數據天天晚上20:00YY頻道現場授課頻道68917580經驗

相關文章
相關標籤/搜索