sk-learn學習筆記三

通過哈希技巧實現特徵向量 哈希技巧是無固定狀態的,它把任意的數據塊映射到固定數目的位置,並且保證相同的輸入一定產生相同的輸出,不同的輸入儘可能產生不同的輸出。scikitlearn提供了HashingVectorizer來實現這個技巧: from sklearn.feature_extraction.text import HashingVectorizer corpus = ['the', 'a
相關文章
相關標籤/搜索