交叉驗證是常常用到的驗證方法
使用sklearn能夠很大程度上簡化交叉驗證的過程
使用過程見下方:code
from sklearn import cross_validation gbdt=GradientBoostingRegressor() score = cross_validation.cross_val_score(gbdt, train_set, label_set, cv=10, scoring='accuracy') 這裏以gbdt模型爲例 train_set:訓練集 label_set:標籤 cv: 交叉驗證的倍數 scoring: 返回結果的類型,能夠自定義,也有不少默認選項 例如‘accuracy’, 就是返回準確率 [‘accuracy‘, ‘adjusted_rand_score‘, ‘average_precision‘, ‘f1‘, ‘f1_macro‘, ‘f1_micro‘, ‘f1_samples‘, ‘f1_weighted‘, ‘log_loss‘, ‘mean_absolute_error‘, ‘mean_squared_error‘, ‘median_absolute_error‘, ‘precision‘, ‘precision_macro‘, ‘precision_micro‘, ‘precision_samples‘, ‘precision_weighted‘, ‘r2‘, ‘recall‘, ‘recall_macro‘, ‘recall_micro‘, ‘recall_samples‘, ‘recall_weighted‘, ‘roc_auc‘] 都是能夠的
這就是簡單的用法,只有scoring比較複雜,其餘都比較簡單ci