高級實訓第四周週報

本週工作   本週主要還是數據預處理與特徵選擇部分,相比之前簡單地用平均值填充數值類數據,用衆數填充類別類數據並使用全部特徵,我對數據分門別類進行了更細緻的處理,並捨棄了一些不必要的或暫時較難利用的特徵。 首先,除了object類的數據爲類別類數據外,有些數值類數據的取值個數都比較有限,且取值集中在幾個數值上(例如n0),此時採用均值填充缺失值可能並不是一個很好的選擇,可以把它當作類型屬性。對一些
相關文章
相關標籤/搜索