寫給小白的機器學習之數據表示與特徵工程詳解(附實戰代碼)

數據類型有不少,在機器學習中,這些類型基本特徵大體分爲兩類:git 一是如浮點數組成的連續特徵 二是一般並非數值的分類特徵,或者叫作離散特徵 一般不管你的數據包含那種類型的特徵,數據表示方式都會對機器學習模型的性能產生巨大影響,這就要求咱們要對數據進行處理,如數據放縮、特徵擴充等等。github 對於某個特定應用來講,如何找到最佳數據表示,這個問題被稱爲特徵工程(feature engineeri
相關文章
相關標籤/搜索