DeepMind的AI學會了畫畫，利用強化學習徹底不需人教

時間 2019-12-07

原文原文鏈接

鄧侃解讀：DeepMind如何教AI自主學會畫畫？算法

給你一幅油畫，問你是否是梵高風格，這個問題很容易回答。可是讓你用文字描述，什麼是梵高風格，卻很難清晰地界定。函數

如何讓電腦自動模仿梵高油畫？DeepMind 想了一個辦法。學習

1. 用強化學習算法，像走迷宮那樣，在畫布上塗抹顏色。剛開始時，不妨把強化學習算法設定爲隨機行走。一通亂走，直到把畫布填滿。設計

2. 強化學習算法須要設定報酬函數，評定算法的好壞，而後反覆調整算法參數，使得報酬最大。剛開始時，隨機塗鴉的做品，固然離梵高風格差距很大。差距越大，報酬越低。反覆調整算法參數，使之得到的報酬愈來愈高。直到報酬再也不增加，訓練過程結束。blog

3. 設計一個報酬函數，若是電腦的做品，與梵高做品越類似，那麼報酬越高。如何設計報酬函數呢？一個辦法是作一個分類器（classifier），若是這個分類器，可以垂手可得地辨別電腦的做品，不是梵高油畫，那麼報酬越低。反之，若是分類器傻傻分不清哪一幅是電腦做品，哪一幅電腦做品，那麼說明電腦已經模仿得很像，這時報酬很高。class

DeepMind 用這個算法，教電腦模仿手寫體數字，教電腦畫頭像。最後成像效果不錯，可是筆劃順序不對。im

相關標籤/搜索