NLP系列 10. BERT

Transformer的原理 BERT的算法來自谷歌的另一篇論文:https://arxiv.org/abs/1706.03762 。完全拋棄了RNN、CNN,而提出了另外一種新的網絡結構:Transformer。Transformer現在是谷歌雲TPU推薦的參考模型。 Transformer由encoder和decoder組成,encoder、decoder分別由一些編碼器和解碼器構成。 編碼器
相關文章
相關標籤/搜索