【論文筆記】M-Walk: Learning to Walk over Graphs using Monte Carlo Tree Search

時間 2020-12-30

標籤強化學習推薦系統論文简体版

原文原文鏈接

本文用了強化學習，在知識圖譜上游走，尋找目標節點。一、簡介大概意思就是，在知識圖譜上，給出一個起始節點和查詢（query），然後找到目標節點。圖G包含節點和邊。如下圖，給出起始節點Obama，query：citizenship，目標節點是USA。我們要學習一個方法來預測。我們我們將f作爲強化學習力的agent。他要學習搜索策略（search policy）訓練的時候，我們給

>>阅读原文<<