輕量級學習系列--2、機器學習數據清理

1、數據預處理 主要包括 •特徵提取 •處理缺失數據 •數據定標 •數據轉換: One-Hot encoding, One/Two/MultiGram, Bag of words, 取對數 •1、特徵提取: a、以基於圖像進行行人檢測爲例, 需要提取圖像的梯度直方圖 b、以自然語言處理爲例, 需要提取文字的n-gram,其實就是將文字轉換成數字形式,然後通過計算句子各個單詞同時出現的概率(通過歷史
相關文章
相關標籤/搜索