Attention (學習筆記)

Seq-Seq 模型的困難: p ( y 1 , . . . y T ) ∣ x 1 , . . . x T = ∏ t = 1 T ′ p ( y t ∣ c , y 1 , . . . , y t − 1 ) = ∏ t = 1 T ′ g ( c , s t − 2 , y t − 1 ) p(y_1,...y_T)|x_1,...x_T=\prod _{t=1}^{T^{'}}p(y_t|
相關文章
相關標籤/搜索