視覺語言導航綜述Visual Language Navigation

abstract: | 視覺語言導航任務(Visual Language Navigation) 是讓智能體跟着自然語言指令進行導航,這個任務需要同時理解自然語言指令與視角中可以看見的圖像信息,然後在環境中對自身所處狀態做出對應的動作,最終達到目標位置。該問題的難點還有自然語言指令的複雜、包含了當前可見與不可見的信息,環境給的反饋非常模糊使得智能體很難判斷自身位置。本文從仿真環境與文本數據來源先簡
相關文章
相關標籤/搜索