確定執行的優先級以及誤差分析

本節我們討論在設計一個機器學習的系統時,應該先做什麼後做什麼。 我們以垃圾郵件分類爲例:   特徵向量: 我們發現很多遇見故意拼錯單詞,從而逃避被視爲垃圾郵件: 正確的步驟: 我們應該先實現一個簡單粗暴的算法,然後將郵件進行分類, 接着手動的去將分錯了的郵件重新分類,並且歸納出分錯郵件的特徵,從而增加我們的特徵個數, 在判斷是否要使用提取詞幹、區分大小寫等方法時,我們直接先用交叉驗證集來計算誤差,
相關文章
相關標籤/搜索