論文筆記 | MathDQN: Solving Arithmetric Word Problems via Deep Reinforcement Learning

簡介 Lei Wang 和 Dongxiang Zhang團隊在AAAI18上發表的文章,使用了DQN來解決MWP(Math Word Problem)問題。 Motivation 在將問題表達成一個表達式樹的時候,有一種方法是枚舉所有的操作數,組成樹的葉子節點。這種方法所需的搜索空間很大,雖然有一些剪枝的算法可以運用,但仍不能滿足需求。 在實踐中,可以發現Deep Q-netwrok能夠處理搜索
相關文章
相關標籤/搜索