理解機器翻譯模型 Transformer

transformer是一種不一樣於RNN的架構,模型一樣包含 encoder 和 decoder ,可是encoder 和 decoder 拋棄 了RNN,而使用各類前饋層堆疊在一塊兒。html Encoder:git     編碼器是由N個徹底同樣的層堆疊起來的,每層又包括兩個子層(sub-layer),第一個子層是multi-head self-attention mechanism層,第二
相關文章
相關標籤/搜索