JavaShuo
欄目
標籤
策略評估policy evaluation
策略評估policy evaluation
全部
評估
policy
evaluation
策略
評估器
估
策略性
組策略
選股策略
同源策略
風控策略
強化學習(三):動態規劃求解MDP(Planning by Dynamic Programming)
2021-01-08
強化學習Reinforcement Learning
價值迭代value iteration
策略迭代policy iteration
策略評估policy evaluation
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。