沒有公式、沒有代碼，文科生也能看懂的AI大熱方向【強化學習】基本原理 || 自動控制、圍棋、AlphaGo核心算法：強化學習

時間 2021-01-14

標籤 Reinforcement Learning Amazing-Brick 简体版

原文原文鏈接

不用公式、不用代碼，白話講講強化學習原理 The best way to learn is to teach others. 近年來，強化學習在圍棋等棋牌項目、星際爭霸等電腦遊戲、機器人玩魔方等自動控制領域頗有建樹，那麼其核心原理是什麼呢？筆者這裏用白話談談心得。在說強化學習之前，我們先來聊聊他的兩個兄弟：監督學習和無監督學習。監督學習監督學習就是，你餵給機器一堆有標籤的數據，比如下表這樣。

>>阅读原文<<