機器學習筆記(十一) 機器學習系統的設計

1.工作的優先級    以垃圾郵件分類器算法爲例進行討論:    爲了解決問題,我們首先要決定如何表達特徵向量 x。選擇一個由 100 個最常出現在垃圾郵件中的詞所構成的列表,根據這些詞是否有在郵件中出現(出現爲 1,不出現爲 0),獲得特徵向量。    爲了構建這個分類器算法,我們可以:    (1)收集更多的數據,有更多的垃圾郵件和非垃圾郵件的樣本;    (2)開發一系列複雜的特徵;    
相關文章
相關標籤/搜索