【AAAI Oral】利用深度增強學習自動解數學題，準確率提升15%

時間 2021-01-13

原文原文鏈接

【AI科技大本營導讀】增強學習和人類學習的機制非常相近，DeepMind已經將增強學習應用於AlphaGo以及Atari遊戲等場景當中。作爲智能教育領域的引領者，阿凡題研究院首次提出了一種基於DQN（Deep Q-Network）的算術應用題自動求解器，能夠將應用題的解題過程轉化成馬爾科夫決策過程，並利用BP 神經網絡良好的泛化能力,存儲和逼近增強學習中狀態-動作對的Q 值。實驗表明該算法在標準測

>>阅读原文<<