Attention Is All You Need 筆記

摘抄自:https://jalammar.github.io/illustrated-transformer/ 1.Overall的定性理解 結構: input–encoder–decoder–output 1.1 encoder part encoder中包含數個相同結構的encoder layer(不共享權重),文章中用了六個(該數目可相應調整)。 每個encoder layer有兩個subl
相關文章
相關標籤/搜索