keras分佈式訓練模型 openMpi+Horovod+keras -Effective DeepLearning

時間 2020-07-17

標籤 keras 分佈式訓練模型 openmpi+horovod+keras openmpi horovod effective deeplearning 欄目系統架構简体版

原文原文鏈接

最近由於項目的須要咱們以前作的模型的分類猛增3，4倍，數量的數據也隨之增長致使了訓練模型的時間從原來的10幾個小時增長到如今的大概要100小時，這時候以前用的單機雙GPU的訓練方式明顯已經遇到了瓶頸(咱們的開發機GPU是GTX1080i PC級別算是最好的了吧)。這時候咱們只能從單機訓練方式轉化到分佈式的訓練方式。Keras官文首頁寫着方便遷移方便作分佈式訓練的因此想都不想就開工作了，誰知道原來這

>>阅读原文<<