【Scikit-Learn】樸素貝葉斯文檔分類

本文使用的數據集來自mlcomp.org上的20news-18828,下載地址爲:mlcomp.org/datasets/379python 1. 讀入數據 datasets/mlcomp/379/train目錄下放的是語料庫,其中包含20個子目錄,每一個子目錄的名字表示的是文檔的類別,子目錄下包含這種類別的全部文檔。web load_files()函數會從這個目錄裏把全部的文檔都讀入內存,而且自
相關文章
相關標籤/搜索