Video retrieval based on deep convolutional neural network 論文閱讀

時間 2020-12-26

原文原文鏈接

《Video retrieval based on deep convolutional neural network》論文中採用CNN提取高級語義特徵，輸入的三個視頻共享一個cnn參數，經過cnn得到三個視頻各自的特徵（[batch,16,Nd]），根據我的理解，FC1的上一層是各視頻特徵的壓縮，由[batch,16,Nd]壓縮到了[batch,16*Nd]。此時的特徵再經過一個FC

>>阅读原文<<