tfidf+embedding

轉自:https://blog.csdn.net/pnnngchg/article/details/86500648 我們知道,tfidf和embedding都是將文本表示成包含文本信息的高維向量的方法。tfidf關注的是單詞在文檔中的頻率,最終計算出的向量包含的信息是一種單詞出現頻率的tradeoff。而embedding則關注的是單詞的語義。兩者包含的信息不同,因此將兩者結合起來表示文本是對文
本站公眾號
   歡迎關注本站公眾號,獲取更多信息