DeepMind提出空間語言集成模型SLIM,有效編碼自然語言的空間關係

前不久,DeepMind 提出生成查詢網絡 GQN,具備從 2D 畫面到 3D 空間的轉換能力。近日,DeepMind 基於 GQN 提出一種新模型,可以捕捉空間關係的語義(如 behind、left of 等),其中包含一個基於從場景文本描述來生成場景圖像的新型多模態目標函數。結果表明,內部表徵對意義不變的描述變換(釋義不變)具備穩健性,而視角不變性是該系統的新興屬性。 論文:Encoding
相關文章
相關標籤/搜索