鄧侃解讀:DeepMind如何教AI自主學會畫畫?算法
給你一幅油畫,問你是否是梵高風格,這個問題很容易回答。可是讓你用文字描述,什麼是梵高風格,卻很難清晰地界定。函數
如何讓電腦自動模仿梵高油畫?DeepMind 想了一個辦法。學習
1. 用強化學習算法,像走迷宮那樣,在畫布上塗抹顏色。剛開始時,不妨把強化學習算法設定爲隨機行走。一通亂走,直到把畫布填滿。設計
2. 強化學習算法須要設定報酬函數,評定算法的好壞,而後反覆調整算法參數,使得報酬最大。剛開始時,隨機塗鴉的做品,固然離梵高風格差距很大。差距越大,報酬越低。反覆調整算法參數,使之得到的報酬愈來愈高。直到報酬再也不增加,訓練過程結束。blog
3. 設計一個報酬函數,若是電腦的做品,與梵高做品越類似,那麼報酬越高。如何設計報酬函數呢?一個辦法是作一個分類器(classifier),若是這個分類器,可以垂手可得地辨別電腦的做品,不是梵高油畫,那麼報酬越低。反之,若是分類器傻傻分不清哪一幅是電腦做品,哪一幅電腦做品,那麼說明電腦已經模仿得很像,這時報酬很高。class
DeepMind 用這個算法,教電腦模仿手寫體數字,教電腦畫頭像。最後成像效果不錯,可是筆劃順序不對。im