【AAAI Oral】利用深度增強學習自動解數學題,準確率提升15%

【AI科技大本營導讀】增強學習和人類學習的機制非常相近,DeepMind已經將增強學習應用於AlphaGo以及Atari遊戲等場景當中。作爲智能教育領域的引領者,阿凡題研究院首次提出了一種基於DQN(Deep Q-Network)的算術應用題自動求解器,能夠將應用題的解題過程轉化成馬爾科夫決策過程,並利用BP 神經網絡良好的泛化能力,存儲和逼近增強學習中狀態-動作對的Q 值。實驗表明該算法在標準測
相關文章
相關標籤/搜索