特徵工程總結與學習

文章目錄 1. 機器學習流程 2. 數值型數據 2.1 標量、向量和空間 2.2 處理計數 2.3 對數變換 2.4 特徵縮放/歸一化 2.5 交互特徵 2.6 特徵選擇 3. 文本數據:扁平化、過濾和分塊 3.1 元素袋:將自然文本轉換爲扁平向量 3.2 使用過濾獲取清潔特徵 4. 特徵縮放的效果:從詞袋到tf-idf 4.1 tf-idf: 詞袋的一種簡單擴展 5. 分類變量:自動化時代的數據
相關文章
相關標籤/搜索