帶你認識神奇的Gumbel trick

The Gumbel soft-max Gumbel trick有兩個用途,一個用途是是用來對離散分佈進行採樣,這是一種重參數化(reparameterization trick)的技巧,另外一個用途是用於估計normalizing partition function,也就是分佈的歸一化項。本文將介紹這兩種方法的原理。 下面是一個使用gumbel trick來模擬離散分佈採樣的例子: 如上圖例子
相關文章
相關標籤/搜索