pytorch實現straight-through estimator(STE)

如今深度學習中通常咱們學習的參數都是連續的,由於這樣在反向傳播的時候才能夠對梯度進行更新。可是有的時候咱們也會遇到參數是離>散的狀況,這樣就沒有辦法進行反向傳播了,好比二值神經網絡。本文中講解了如何用pytorch對二值化的參數進行梯度更新的straight-through estimator算法。 Question: STE核心的思想就是咱們的參數初始化的時候就是float這樣的連續值,當咱們f
相關文章
相關標籤/搜索