吳恩達Coursera深度學習課程 deeplearning.ai (5-3) 序列模型和注意力機制--課程筆記

3.1 基礎模型 sequence to sequence sequence to sequence:兩個序列模型組成,前半部分叫做編碼,後半部分叫做解碼。用於機器翻譯。 image to sequence sequence to sequence:一個卷積神經網絡和一個序列模型組成,前半部分叫做編碼,後半部分叫做解碼。用於圖片描述。 3.2 選擇最可能的句子 語言模型:根據輸入的零向量根據概率預
相關文章
相關標籤/搜索