DialoGPT12-10 issue記錄

有趣,作者強調了Padding方式是通過 「context [SEP] response [SEP] [PAD]」 但是在inference的時候,有時候會沒有標準答案的response 所以我只能將context放入並且padding進行實驗。作者仍然強調了在訓練過程中與這個的區別。有意思,但是區別是 response是一個decoding過程,在作爲標準的過程中,當然是可以作爲decoder的
相關文章
相關標籤/搜索