欠擬合(一般表明高誤差)html
精度微信
過擬合(一般表明高方差)網絡
過少的數據樣本與有效特徵,太高的維度,會致使模型學到噪聲和沒必要要的無效特徵,這個概念叫作過擬合,是維度災難的一個直接後果。機器學習
如何改進模型的有效性函數
聊一下模型訓練過程當中的學習曲線性能
咱們根據模型經過可視化圖形從數據中學習的能力來探討誤差與方差之間的關係。機器學習中的學習曲線是一種可視化圖形,能根據一系列訓練實例中的訓練和測試數據比較模型的指標性能。在查看數據與偏差之間的關係時,咱們一般會看到,隨着訓練點數量的增長,偏差會趨於降低。因爲咱們嘗試構建從經驗中學習的模型,所以這頗有意義。咱們將訓練集和測試集分隔開,以便更好地瞭解可否將模型泛化到未見過的數據而不是擬合到剛見過的數據。在學習曲線中,當訓練曲線和測試曲線均達到穩定階段,而且二者之間的差距再也不變化時,則能夠確認模型已盡其所能地瞭解數據。學習
誤差測試
方差spa
理想的學習曲線.net
說一下你理解的信息增益(Information gain)
在一個條件下,信息不肯定性減小的程度!
決策樹就是這樣來找特徵的。
說一下分類和迴歸的區別?
二者追到本質是同樣。
Logistic Regression 和 Linear Regression:
Support Vector Regression 和 Support Vector Machine:
Naive Bayes 用於分類 和 迴歸:
前饋神經網絡(如 CNN 系列) 用於 分類 和 迴歸:
循環神經網絡(如 RNN 系列) 用於分類 和 迴歸:
如文章你已看懂,點個「喜歡」便可。如若錯誤以及不清晰的地方,隨時提出。歡迎掃一掃上面二維碼加入個人我的微信號進行技術交流。