關於注意力機制的理解

文章目錄 圖像捕捉 memory network muti-hop分析 圖像捕捉 將input image切成不同的region,再用cnn去encoder成不同的vector,然後再六個不同的vectior計算不同的attention 得到這個時間點的六個hidden layer的weigtht,算出下個時間點 distribution,然後求和放入enconder當中得到下一個預測的單詞。 m
相關文章
相關標籤/搜索