理解Transformer的三層境界(待續...)

文章目錄 0x00、先導知識 0.1 Seq2Seq 0.2 Attention 0x01.第一層境界 高屋建瓴,會當凌絕頂 總結 0x02、第二層境界 由淺入深,由表及裏,漸入佳境 宏觀視角(A High-Level Look) 將張量引入圖片(Bringing The Tensors Into The Picture) 開始「編碼」(Now We’re Encoding! ) 從宏觀視角看自注
相關文章
相關標籤/搜索