基於機器學習的文本分類算法的研究

1. 簡述 文本分類的方法屬於有監督的學習方法,分類過程包括文本預處理、特徵抽取、降維、分類和模型評價。本文首先研究了文本分類的背景,中文分詞算法。然後是對各種各樣的特徵抽取進行研究,包括詞項頻率-逆文檔頻率和word2vec,降維方法有主成分分析法和潛在索引分析,最後是對分類算法進行研究,包括樸素貝葉斯的多變量貝努利模型和多項式模型,支持向量機和深度學習方法。深度學習方法包括多層感知機,卷積神經
相關文章
相關標籤/搜索