BN 層原理解析

1 訓練數據爲什麼要和測試數據同分布? 看看下圖,如果我們的網絡在左上角的數據訓練的,已經找到了兩者的分隔面w,如果測試數據是右下角這樣子,跟訓練數據完全不在同一個分佈上面,你覺得泛化能力能好嗎? 2 爲什麼白化訓練數據能夠加速訓練進程 如下圖,訓練數據如果分佈在右上角,我們在初始化網絡參數w和b的時候,可能得到的分界面是左下角那些線,需要經過訓練不斷調整才能得到穿過數據點的分界面,這個就使訓練過
相關文章
相關標籤/搜索