沒有公式、沒有代碼,文科生也能看懂的AI大熱方向【強化學習】基本原理 || 自動控制、圍棋、AlphaGo核心算法:強化學習

不用公式、不用代碼,白話講講強化學習原理 The best way to learn is to teach others. 近年來,強化學習在圍棋等棋牌項目、星際爭霸等電腦遊戲、機器人玩魔方等自動控制領域頗有建樹,那麼其核心原理是什麼呢?筆者這裏用白話談談心得。 在說強化學習之前,我們先來聊聊他的兩個兄弟:監督學習和無監督學習。 監督學習 監督學習就是,你餵給機器一堆有標籤的數據,比如下表這樣。
相關文章
相關標籤/搜索