機器學習教程之8-機器學習系統的設計(Machine Learning System Design)

0.概述 當數據有類偏斜的現象時,查準率和查全率能更準確的判斷算法效果的好壞。 1.首先要做什麼 以構建垃圾人郵件分類器算法爲例,我們可以做很多事情,例如: (1)收集更多的數據,讓我們有更多的垃圾郵件和非垃圾郵件的樣本 (2) 基於郵件的路由信息開發一系列複雜的特徵 (3) 基於郵件的正文信息開發一系列複雜的特徵,包括考慮截詞的處理 (4) 爲探測刻意的拼寫錯誤(把 watch 寫成 w4tch
相關文章
相關標籤/搜索