word vetor

@TOCword vetor 1\計算機的運算都是數字,在處理語言時做的也是數據運算,語言由詞彙含一定語法組成,詞彙需要數字化表示,one-hot 可以算作一種,假設世界只有 「好好學習天天向上」6個字,也用 100000 代表好、010000 代表學 …。但是沒法比較相似度,而且詞彙量比較大,one-hot需要改進 2\語言中的詞和上下文是有「連貫性」的,連貫性以在數學上表現起來就是相近的數字,
相關文章
相關標籤/搜索