機器學習實戰(基於scikit-learn和TensorFlow)學習心得(7)--數據的篩選

當我們train數據的時候,我們想當然的想讓數據之間的聯繫更加緊密,但更緊密不意味着更好的性能. 當我們研究median income和median house pricing的時候,我們可以從圖上觀測到 圖片中在450000和350000的地方有兩條比較明顯的橫線. 對於這種情況,我們應該適當的去除掉這些數據以保證我們的model不會過分的關注到這點以至於錯誤的分析了這兩個features的關係
相關文章
相關標籤/搜索