sklearn.feature_extraction.text 中的 TfidfVectorizer 實現過程

對於NLP,已經學習一年了,可是一直有一個問題困擾着我,終於忍無可忍,決定將問題解決掉。 首先,介紹一下我的問題: 對於TFIDF算法,當利用訓練集訓練完成分類器,利用分類器進行訓練時,如果測試集中只有一個文檔,TFIDF數據是如何生成的? 這個問題可能對於很多人來說,很簡單。但是對於我來說着實很糾結。 1. TFIDF算法基礎知識 TF-IDF(Term Frequency-InversDocu
相關文章
相關標籤/搜索