特徵提取方法: one-hot 和 TF-IDF

one-hot 和 TF-IDF是目前最爲常見的用於提取文本特徵的方法,本文主要介紹兩種方法的思想以及優缺點。 1. one-hot 1.1 one-hot編碼   什麼是one-hot編碼?one-hot編碼,又稱獨熱編碼、一位有效編碼。其方法是使用N位狀態寄存器來對N個狀態進行編碼,每個狀態都有它獨立的寄存器位,並且在任意時候,其中只有一位有效。舉個例子,假設我們有四個樣本(行),每個樣本有三
相關文章
相關標籤/搜索