mxnet 顯存優化

現狀:基於 mxnet 開發的深度學習應用比 tensorflow 等框架 佔用的顯存更少、運行更快; mxnet 官方網站有一篇文章介紹了 mxnet 在顯存方面的優化,以下概括大意: 使用同一個圖去計算前向預測和反向傳播還是顯式地指定反向傳播路徑?Caffee,CXXNet,Torch 選擇了前者,Theano,CGT,mxnet 選擇了後者,同時 mxnet 也支持類似前者的情況;使用後者的
相關文章
相關標籤/搜索