文本表示方法

文本表示就是將文本轉化成數學上的向量表示,怎麼把字符串轉化爲向量,就是文本表示的核心問題。 離散表示 1.One-hot 這種編碼格式首先建立一個全局的完備的詞典,該詞典包含所有文本中的詞,因此該方式表示後的形式爲一個很大的vector,vector中只在該詞出現的位置設置爲1,表示該詞出現,其餘全部爲0。 例: 小明喜歡看電影,小紅喜歡聽歌。 小張喜歡打籃球。 這兩個句子中包含的詞去重後構建一個
相關文章
相關標籤/搜索