CVPR2020 Learning in the Frequency Domain學習筆記

論文總結 爲了解決CNN只能接受低分辨率的RGB圖像,並且不改變現有的神經網絡,論文提出了一種從頻域上對圖像進行reshape的方法,把原有圖像壓縮中的decoding環節裏的IDCT過程去掉(計算量很大),而直接將反量化後的數據輸入到神經網絡中。就是說假設原有YUV圖像尺寸爲448x448x3,採用默認8x8爲DCT的blocksize,統計相同位置的頻率分量,那麼現有的基於頻域的feature
相關文章
相關標籤/搜索