UNIVERSAL TRANSFORMERS讀書筆記

ABSTRACT 作者提出了一種稱爲universal transformer(簡稱UT)的模型,總的來說,該模型就是集合了Transformer和基於RNN結構的神經網絡的優點而提出的更加通用的Transformer模型,具體來說它主要結合了這兩個模型中的如下優點: UTs combine the parallelizability and global receptive field of f
相關文章
相關標籤/搜索