scikit-learn官方文檔-preprocessing data(數據預處理)

1、標準化,均值和方差縮放 數據集的標準化是許多在scikit-learn中實現的機器學習估計器的廣泛要求。若是單個特徵或多或少看起來不像標準正態分佈數據,則它們的性能可能會不好。標準正態分佈的定義:平均值和單位方差爲零的高斯。 在實踐中,咱們常常忽略分佈的形狀,而只是經過刪除每一個特徵的平均值來變換數據以使其居中,而後經過將非恆定特徵除以它們的標準誤差來縮放它。 例如,學習算法的目標函數中使用的
相關文章
相關標籤/搜索