機器學習導論(二)

數據集 數據集的行----樣本 數據集的列----特徵 特徵組成的空間----特徵或屬性空間 組成屬性空間中的點----特徵或屬性向量 將數據集切分成訓練集和測試集 使用訓練集+算法構成模型解決實際問題 誤差: 絕對誤差 平方誤差 訓練誤差:訓練集 測試誤差:測試集 泛化誤差:新數據預測 對於非數值的特徵,需要進行特徵轉換,編碼方式有兩種:標籤編碼和獨熱編碼 注意:獨熱編碼需要將維度擴大 對二分類
相關文章
相關標籤/搜索