機器學習系統的設計

機器學習系統的設計 一、垃圾郵件分類器 二、構建學習算法方法 三、類偏斜的誤差度量 四、查全率和查準率之間的權衡 五、機器學習數據 一、垃圾郵件分類器 首先決定如何選擇並表達特徵向量x。 選擇一個由100個最常出現在垃圾郵件中的詞所構成的列表,根據這些詞是否出現在郵件中,獲得特徵向量(出現爲1,不出現爲0,尺寸爲100×1)。 爲了構建這個分類器算法,可以採取以下操作: 1.收集更多數據,擁有更多
相關文章
相關標籤/搜索