序列生成(sequence generate)架構

序列生成架構: decoder模型: 1.1 模型架構圖: 1.2 數據流: 數據形式:使用歷史token序列預測當前時刻 t 下一個時刻 t+1 時刻。 訓練數據形式:假設有一段token序列X,那麼input_sequence = X[:-1],lable_sequence = X[1:],原則就是使用當前時刻的歷史hidden state info和當前token作爲模型(模型可是RNN或t
相關文章
相關標籤/搜索