Python文本數據分析:新聞分類任務(貝葉斯,TF-IDF詞向量)

文章目錄 基本思路 1.文本分析 11.查看數據 1.2轉換爲llist格式 1.3使用jieba分詞 1.4轉換爲DataFrame格式 1.5使用停用詞 1.6查看詞頻 1.7生成詞雲 2.TF-IDF關鍵詞提取 2.1 提取關鍵詞 3.LDA建模 3.1建模 3.2 輸出20個主題的的關鍵詞和權重 4.基於貝葉斯算法進行新聞分類 4.1 轉換數據 4.2 建立訓練、測試集 4.3 構建貝葉斯
相關文章
相關標籤/搜索