機器學習(三十)——Model-Free Control

https://antkillerfarm.github.io Model-Free Control 概述 之前提到的MC & TD都是Model-free prediction,下面講講Model-Free Control。 現實中有很多此類的例子,比如控制一個大廈內的多個電梯使得效率最高;控制直升機的特技飛行,機器人足球世界盃上控制機器人球員,圍棋遊戲等等。所有的這些問題要麼我們對其模型運行機
相關文章
相關標籤/搜索