MASS: 一統GPT和BERT的Seq to Seq框架

MASS: 一統GPT和BERT的Seq to Seq框架 MASS的功能 GPT和BERT 比較 痛點 MASS模型 模型解釋 思想根源 實驗 結語 MASS的功能 MASS的全名叫Masked Sequence to Sequence Pre-training for Language Generation,這個其實已經隱含了和GPT及BERT(前文有介紹)的關係: "Masked"對應了BE
相關文章
相關標籤/搜索