數據歸一化

我們完成分類的時候少做了數據歸一化Featur Scaling 兩本間的距離發現以時間爲主導 在這個例子中,假設兩個特徵 ,腫瘤大小和發現時間 這兩個樣本的距離如果是歐拉距離,就是以時間主導了 雖然樣本數據中5和1相差5倍,200和100相差2倍 但是由於量綱不同,導致了最終的距離其實是主要發現的天數他們之間的差距 這是因爲腫瘤大小之間的差值太小了  如果我們這麼調整,那麼腫瘤大小又被腫瘤大小所主
相關文章
相關標籤/搜索