Keras中poly學習策略的實現

時間 2021-01-02

原文原文鏈接

前言：在各種論文中，我見到過最多的優化器就是SGD，雖然Adam，Nadam很潮，優點很多，但是我也不知道爲啥，那些很優秀的論文總是喜歡用SGD，或許是因爲SGD的學習率和和decay可‘手動’調節的緣故吧，SGD的學習率衰減策略有很多，接下來就講解一個各個衰減策略，以及poly衰減策略的實現，另一方面是網上基本上是沒有Keras上實現poly的代碼，經過我一個下午的摸

>>阅读原文<<