RGB-D Scene Classification via Multi-modal Feature Learning論文翻譯

摘要 以前的方法大部分是用全局信息來進行場景的分類,並且把圖像中所有的像素用來高級別的任務。它們只是把RGB和深度信息連接起來,沒有探索RGB和深度的關係和互補性,也沒有考慮局部特徵的分佈。從人的觀點來看,我們識別物體的種類一般是通過:外觀,紋理,形狀和深度。不同物體之間的結構分佈也要考慮。基於這個觀察,建立一箇中級別的物體區分性的表示應該會對場景分析很有效。作者提出了LM-CNN(new Con
相關文章
相關標籤/搜索