簡單的說就是有些調整是不相互影響的,因此能夠分開作git
通常來講有一個單一數值做爲評價指標會更好
若是存在多個指標,通常能夠優化一個,其餘幾個知足必定條件就好
除了通用的一些指標,咱們能夠經過給樣本加權的方式,使得得到更加適合咱們應用的評價指標github
假設一個圖像識別的任務學習
Humans | 1% | 7.5% |
---|---|---|
Training error | 8% | 8% |
Dev Error | 10% | 10% |
能夠經過手動隨機抽樣分析一些數據,看哪類的數據它出錯最多,從而作針對性改進。測試
也能夠分析一些他分對的業務和沒對的業務,從而獲得他的不足優化
數據分佈不一致會致使上面的分析存在問題,因此這時候須要引入相似train-dev機制來實現設計
典型的就是fine-tunningblog
同時作多個任務,而且這多個任務能夠互相幫助get
https://github.com/mbadry1/DeepLearning.ai-Summary深度學習