from sklearn.processing import StandardSacler sc = StandardScaler() #實例化 sc.fit(X_train) sc.transform(X_train) # - 以上兩句能夠並寫成一句sc.fit_transform(X_trian) # - 咱們使用相同的放縮參數分別對訓練和測試數據集以保證他們的值是彼此至關的。**可是在使用fit_transform 只能對訓練集使用,而測試機則只使用fit便可。** # - sklearn中的metrics類中包含了不少的評估參數,其中accuracy_score, # - 中accuracy_score(y_test,y_pred),也就是那y_test與預測值相比較,得出正確率 y_pred = model.predict(X_test-std)
過擬合現象出現有兩個緣由:python
感知機的一個最大缺點是:在樣本不是徹底線性可分的狀況下,它永遠不會收斂。
分類算中的另外一個簡單高效的方法:logistics regression(分類模型)算法
特定的事件的發生的概率,用數學公式表示爲:$\frac{p}{1-p} $,其中p爲正事件的機率,不必定是有利的事件,而是咱們將要預測的事件。以一個患者患有某種疾病的機率,咱們能夠將正事件的類標標記爲y=1。
機器學習
參考文獻:函數