詞向量

用數字表示文本 要將自然語言交給機器學習中的算法來處理,通常需要首先將語言數學化,詞向量就是用來將語言中的詞進行數學化的一種方式,然後再其饋入模型。 獨熱編碼 對詞彙表中的每個單詞進行「獨熱」編碼。 考慮這樣一句話:「The cat sat on the mat」。 這句話中的詞彙(或唯一單詞)是(cat、mat、on、sat、the)。 爲了表示每個單詞,我們將創建一個長度等於詞彙量的零向量,然
相關文章
相關標籤/搜索