論文筆記 | MathDQN: Solving Arithmetric Word Problems via Deep Reinforcement Learning

時間 2020-12-24

原文原文鏈接

簡介 Lei Wang 和 Dongxiang Zhang團隊在AAAI18上發表的文章，使用了DQN來解決MWP(Math Word Problem)問題。 Motivation 在將問題表達成一個表達式樹的時候，有一種方法是枚舉所有的操作數，組成樹的葉子節點。這種方法所需的搜索空間很大，雖然有一些剪枝的算法可以運用，但仍不能滿足需求。在實踐中，可以發現Deep Q-netwrok能夠處理搜索

>>阅读原文<<