Video retrieval based on deep convolutional neural network 論文閱讀

      《Video retrieval based on deep convolutional neural network》論文中採用CNN提取高級語義特徵,輸入的三個視頻共享一個cnn參數,經過cnn得到三個視頻各自的特徵([batch,16,Nd]),根據我的理解,FC1的上一層是各視頻特徵的壓縮,由[batch,16,Nd]壓縮到了[batch,16*Nd]。此時的特徵再經過一個FC
相關文章
相關標籤/搜索