特徵抽取---CountVectorizer

CountVectorizer旨在通過計數來將一個文檔轉換爲向量。當不存在先驗字典時, Countvectorizer作爲Estimator提取詞彙進行訓練,並生成一個CountVectorizerModel 用於存儲相應的詞彙向量空間。該模型產生文檔關於詞語的稀疏表示,其表示可以傳遞 給其他算法,例如LDA。 在CountVectorizerModel的訓練過程中,CountVectorizer
相關文章
相關標籤/搜索