python+NLTK 自然語言學習處理八:分類文本一

從這一章開始將進入到關鍵部分:模式識別。這一章主要解決下面幾個問題 1 怎樣才能識別出語言數據中明顯用於分類的特性 2 怎樣才能構建用於自動執行語言處理任務的語言模型 3 從這些模型中我們可以學到那些關於語言的知識。 監督式分類: 分類是爲給定的輸入選擇正確的類標籤。就好比身份證上的身份證號。每個身份證號都能標識出對應的一個人。在比如我們從一個固定的主題領域列表中,如「體育」,「技術」和「政治」來
相關文章
相關標籤/搜索