[論文筆記]多模態數據集預處理方法

摘要 對文本是單個詞語的一般採用詞袋特徵 圖片可以採用多種靈活的處理方式 對文本是句子甚至是段落的則需要採用較爲複雜的處理方式,參考文獻[1-2]中對Wiki和Pascal Sentence數據集的處理方式 Wiki 參考文獻 [1] Wang D, Gao X, Wang X, et al. Multimodal discriminative binary embedding for large
相關文章
相關標籤/搜索