【LDA】線性判別分析
參數:
solver:一個字符串,指定了求解最優化問題的算法,能夠爲以下的值。
- 'svd':奇異值分解。對於有大規模特徵的數據,推薦用這種算法。
- 'lsqr':最小平方差,能夠結合skrinkage參數。
- 'eigen' :特徵分解算法,能夠結合shrinkage參數。
skrinkage:字符串‘auto’或者浮點數活者None。該參數一般在訓練樣本數量小於特徵數量的場合下使用。該參數只有在solver=lsqr或者eigen下才有意義
- '字符串‘auto’:根據Ledoit-Wolf引理來自動決定shrinkage參數的大小。
- 'None:不使用shrinkage參數。
- 浮點數(位於0~1之間):指定shrinkage參數。
priors:一個數組,數組中的元素依次指定了每一個類別的先驗機率。若是爲None,則認爲每一個類的先驗機率都是等可能的。
n_components:一個整數。指定了數組降維後的維度(該值必須小於n_classes-1)。
store_covariance:一個布爾值。若是爲True,則須要額外計算每一個類別的協方差矩陣。
warm_start:一個布爾值。若是爲True,那麼使用前一次訓練結果繼續訓練,不然從頭開始訓練。
tol:一個浮點數。它指定了用於SVD算法中評判迭代收斂的閾值。
返回值
coef_:權重向量。
intercept:b值。
covariance_:一個數組,依次給出了每一個類別煩人協方差矩陣。
means_:一個數組,依次給出了每一個類別的均值向量。
xbar_:給出了總體樣本的均值向量。
n_iter_:實際迭代次數。
方法
fix(X,y):訓練模型。
predict(X):用模型進行預測,返回預測值。
score(X,y[,sample_weight]):返回(X,y)上的預測準確率(accuracy)。
predict_log_proba(X):返回一個數組,數組的元素一次是 X 預測爲各個類別的機率的對數值。
predict_proba(X):返回一個數組,數組元素一次是 X 預測爲各個類別的機率的機率值