sklearn作交叉驗證

時間 2019-12-07

標籤 sklearn 交叉驗證简体版

原文原文鏈接

交叉驗證是常常用到的驗證方法
使用sklearn能夠很大程度上簡化交叉驗證的過程
使用過程見下方：code

from sklearn import cross_validation
gbdt=GradientBoostingRegressor()
score = cross_validation.cross_val_score(gbdt, train_set, 
    label_set, cv=10, scoring='accuracy')

這裏以gbdt模型爲例
train_set：訓練集
label_set：標籤
cv: 交叉驗證的倍數
scoring: 返回結果的類型，能夠自定義，也有不少默認選項
         例如‘accuracy’, 就是返回準確率
         [‘accuracy‘, ‘adjusted_rand_score‘, 
         ‘average_precision‘, ‘f1‘, ‘f1_macro‘, 
         ‘f1_micro‘, ‘f1_samples‘, ‘f1_weighted‘, 
         ‘log_loss‘, ‘mean_absolute_error‘, 
         ‘mean_squared_error‘, ‘median_absolute_error‘,
          ‘precision‘, ‘precision_macro‘, 
          ‘precision_micro‘, ‘precision_samples‘, 
          ‘precision_weighted‘, ‘r2‘, ‘recall‘, 
          ‘recall_macro‘, ‘recall_micro‘, 
          ‘recall_samples‘, ‘recall_weighted‘, 
          ‘roc_auc‘]   都是能夠的

這就是簡單的用法，只有scoring比較複雜，其餘都比較簡單ci

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。