Mark 一些有意思的深度學習方向

1. VQA        Visual Question Answering,給出一張圖片,就該圖片提出任何問題?自動get到你所期望的答案。        這屬於Visual Reasoning 的範疇,學者們不滿足於傳統的圖像識別、分割、Caption等工作,嘗試去挖掘更高級的機器推理能力。        來看解決思路,CNN、LSTM(RNN)、Attention Model、BOW,都是
相關文章
相關標籤/搜索