樸素貝葉斯進行非結構化文本分類

樸素貝葉斯非結構化文本分類 英語單詞大概有1百萬左右,若是分別計算每一個詞在當前位置出現的機率來計算整篇文章的機率的話,是不現實的 所以咱們採起另外一種簡化方法,即轉化積極文檔的第n個位置是單詞x的機率爲單詞x在積極文檔中出現的機率。 通常步驟以下 1.肯定詞彙表的大小,即積極文檔和消極文檔中出現的全部獨立單詞的個數。 對於每一個單詞計算積極消極兩種假設的機率     1.1 將積極文檔合併成一個
相關文章
相關標籤/搜索