談一談對transformer的理解（代碼）

時間 2021-07-12

標籤 NLP nlp 简体版

原文原文鏈接

關於transformer的原理，這裏就不多說，主要還是結合論文中的圖來對代碼進行一下講解。看這張圖，其實可以看到最核心的部分就是下面這一塊：關於講解，我就直接寫在代碼裏面，用中文來對其進行詳細的一個介紹。相對應的代碼如下： class ScaledDotProductAttention(nn.Module): ''' Scaled Dot-Product Attention ''

>>阅读原文<<