NLP-詞和文檔向量化方法

0 爲什麼要向量化? 向量化文本就可以將一些文本處理問題轉換爲機器學習問題: 0.1 機器學習問題:文本分類,文本聚類,情感分析等,輸入到seq2seq等模型需要數字化的詞的表示形式。 0.2 文本、關鍵詞檢索問題(算相似度):關鍵詞搜索,文檔檢索等 計算機去理解文本的語義核心在於通過詞和上下文統計詞的分佈去表示文本,或通過幾何的視角通過詞上下文去找到詞在空間中的幾何表示(深度學習方法)。 這也引
相關文章
相關標籤/搜索