《數學之美》第15章 矩陣運算和文本處理中的兩個分類問題

1 文本和詞彙的矩陣     在天然語言處理中,最多見的兩個分類問題分別是:將文本按主題歸類(好比將全部介紹奧運會的新聞歸到體育類)和將詞彙表中的字詞按意思歸類(好比將各類運動的項目名稱歸成體育一類)。    spa     新聞分類乃至各類分類問題實際上是一個聚類問題,關鍵是計算兩篇新聞的類似度。爲了完成這個過程,咱們要將新聞變成表明它們內容的實詞,而後在變成一組數,具體說是向量,最後求出這兩個
相關文章
相關標籤/搜索