量化投資學習筆記30——《Python機器學習應用》課程筆記04

有監督學習
經常使用分類算法
KNN:K近鄰分類器。經過計算待分類數據點,與已知數據中全部點的距離,取距離最小的前K個點,根據"少數服從多數"的原則,將這個數據點劃分爲出現次數最多的那個類別。
在sklearn中,使用sklearn.neighbors.KNeighborsClassifier建立K鄰近分類器。
選取較大K值,能夠減少偏差,但可能致使預測錯誤。選取k值較小,易引發過擬合。通常傾向於選擇較小的k值,並使用交叉驗證法選取最優的k值。
決策樹算法
是一種樹形結構分類器,經過順序詢問分類點的屬性決定分類點最終的類別。一般根據特徵的信息增益等構建決策樹。
使用sklearn.tree.DecisionTreeClassifier構建決策樹進行分類。
決策樹本質上是尋找一種對特徵空間上的劃分,旨在構建一個訓練數據擬合的好,而且複雜度小的決策樹。
樸素貝葉斯
以貝葉斯定理爲基礎的分類器。sklearn實現了三個樸素貝葉斯分類器:高斯樸素貝葉斯,多項式樸素貝葉斯,伯努利樸素貝葉斯。分別適用與不一樣的觀測值的分佈。
樸素貝葉斯是典型的生成學習算法。在小規模的數據上表現良好,適合進行多分類任務。
代碼: https://github.com/zwdnet/MyQuant/blob/master/30git

我發文章的四個地方,歡迎你們在朋友圈等地方分享,歡迎點「在看」。
個人我的博客地址:https://zwdnet.github.io
個人知乎文章地址: https://www.zhihu.com/people/zhao-you-min/posts
個人博客園博客地址: https://www.cnblogs.com/zwdnet/
個人微信我的訂閱號:趙瑜敏的口腔醫學學習園地github

相關文章
相關標籤/搜索