NLP-詞和文檔向量化方法

0 爲何要向量化?html 向量化文本就能夠將一些文本處理問題轉換爲機器學習問題:算法 0.1 機器學習問題:文本分類,文本聚類,情感分析等,輸入到seq2seq等模型須要數字化的詞的表示形式。機器學習 0.2 文本、關鍵詞檢索問題(算類似度):關鍵詞搜索,文檔檢索等分佈式 計算機去理解文本的語義核心在於經過詞和上下文統計詞的分佈去表示文本,或經過幾何的視角經過詞上下文去找到詞在空間中的幾何表示(
相關文章
相關標籤/搜索