6. 文本分類——transformer模型

文章目錄 一、簡介 二、transformer結構 三、用於文本分類的transformer 1. embedding layer(嵌入層) 2. positional encoding(位置編碼) 3. Scaled dot-product attention(縮放的點乘注意力機制) 4. Multi-head attention(多頭注意力) 5. Padding mask 6. 殘差連接 7
相關文章
相關標籤/搜索