DeepMind的AI學會了畫畫,利用強化學習徹底不需人教

鄧侃解讀:DeepMind如何教AI自主學會畫畫?算法

給你一幅油畫,問你是否是梵高風格,這個問題很容易回答。可是讓你用文字描述,什麼是梵高風格,卻很難清晰地界定。函數

如何讓電腦自動模仿梵高油畫?DeepMind 想了一個辦法。學習

1. 用強化學習算法,像走迷宮那樣,在畫布上塗抹顏色。剛開始時,不妨把強化學習算法設定爲隨機行走。一通亂走,直到把畫布填滿。設計

2. 強化學習算法須要設定報酬函數,評定算法的好壞,而後反覆調整算法參數,使得報酬最大。剛開始時,隨機塗鴉的做品,固然離梵高風格差距很大。差距越大,報酬越低。反覆調整算法參數,使之得到的報酬愈來愈高。直到報酬再也不增加,訓練過程結束。blog

3. 設計一個報酬函數,若是電腦的做品,與梵高做品越類似,那麼報酬越高。如何設計報酬函數呢?一個辦法是作一個分類器(classifier),若是這個分類器,可以垂手可得地辨別電腦的做品,不是梵高油畫,那麼報酬越低。反之,若是分類器傻傻分不清哪一幅是電腦做品,哪一幅電腦做品,那麼說明電腦已經模仿得很像,這時報酬很高。class

eaec4692cf3869503fb3fb48be662403a585568b

DeepMind 用這個算法,教電腦模仿手寫體數字,教電腦畫頭像。最後成像效果不錯,可是筆劃順序不對。im

相關文章
相關標籤/搜索