GPT-2解讀(論文 + TensorFlow實現)

GPT-2是對GPT的一個升級,而且更着重於將思路放在爲什麼pretrain是有用的上面,認爲LM自己是一個Multi-task Learner,而且大力用ZSL實驗來佐證這個思路。html 文章目錄 一. 前言 二. GPT-2原理 1. 數據集 2. 輸入表徵 3. 模型 三. 實驗 四. TensorFlow實現 1. 模型結構 2. 文本續寫 五. 總結 優點 不足 傳送門 一. 前言 G
相關文章
相關標籤/搜索