集體智慧編程——垃圾郵件過濾器(貝葉斯)-Python實現

介紹垃圾郵件分類器的設計與實現,分爲一下幾個步驟:python 特徵提取: 將訓練樣本的正文切分爲特徵,若是是英文,直接按照空格切分,每一個詞能夠做爲一個特徵;若是是中文,則須要藉助分詞器,如jieba分詞器等。切分後,將詞和所屬類別創建一個字典存儲。字典的結構是: {word1:{class1:count1, class2:count2}, word2:{class1:count1, class
相關文章
相關標籤/搜索