如何用scikit-learn求TF-IDF

第一次在CSDN發博客,望有什麼錯誤的話,但願各位大牛指出 關於scikit-learn能夠處理的文本類型 經過參考網站的內容是直接創建一維列表,列表中的內容都是已經被分好詞的字符串,每一行的字符串稱做相應行的 第幾類文本,如 中文效果就是: corpus=["我 來到 北京 清華大學", #第一類文本切詞後的結果,詞之間以空格隔開                    "他 來到 了 網易 杭研
相關文章
相關標籤/搜索