談一談對transformer的理解(代碼)

關於transformer的原理,這裏就不多說,主要還是結合論文中的圖來對代碼進行一下講解。 看這張圖,其實可以看到最核心的部分就是下面這一塊: 關於講解,我就直接寫在代碼裏面,用中文來對其進行詳細的一個介紹。相對應的代碼如下:   class ScaledDotProductAttention(nn.Module): ''' Scaled Dot-Product Attention ''
相關文章
相關標籤/搜索