我對機器學習的整理理解

  在機器學習通常來說,特徵工程對模型性能影響最大,參數調優一般提升不如特徵工程提升。   首先需要對數據進行充分探索,如屬性是字符串類型、日期類型 還是 數值類型;若提供的數據存在幾張表中,表中數據是否存在關聯,是否可以進行統計、聚合;從業務理解上,可能影響模型性能的因素有哪些,表中數據能否構造該因素。   其次,我們需要對數據進行預處理。對字符串、categories 一般來說我們可以:   
相關文章
相關標籤/搜索