【論文筆記】M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search

本文用了強化學習,在知識圖譜上游走,尋找目標節點。 一、簡介 大概意思就是,在知識圖譜上,給出一個起始節點和查詢(query),然後找到目標節點。  圖G包含節點和邊。 如下圖,給出起始節點Obama,query:citizenship,目標節點是USA。     我們要學習一個方法來預測。 我們我們將f作爲強化學習力的agent。他要學習搜索策略(search policy) 訓練的時候,我們給
相關文章
相關標籤/搜索