今天給你們分享《深度強化行動中的學習》,這本書將教咱們如何根據自身環境的直接反饋對可適應和改進的AI代理進行編程。在這個示例豐富的教程中,咱們將經過挑戰有趣的挑戰(如迷宮導航和玩視頻遊戲)來掌握基礎和高級DRL技術。在此過程當中,咱們將使用核心算法(包括深度Q網絡和策略梯度)以及行業標準工具(例如PyTorch和OpenAI Gym)進行工做。算法
重點說明:隨書同時提供代碼,能夠讓你動手測試改進。編程
《深度強化學習實戰》微信
![](http://static.javashuo.com/static/loading.gif)
做者簡介網絡
Alexander Zai是Amazon AI的機器學習工程師。布蘭登·布朗(Brandon Brown)是機器學習和數據分析博客做者。過去三年來,他在outlace.com上發表了大量有關機器學習的博文。機器學習
獲取方式svg
長按關注【小白學視覺】工具
獲取更多計算機視覺學習資源
學習
資源內容測試
你們能夠在:https://www.manning.com/books/deep-reinforcement-learning-in-action在線閱讀。spa
部份內容截圖以下:
從以上圖片展現能夠看出,內容能夠說是很是的豐富而又全面,不管是小白仍是老司機,都是一份很是不錯的學習資料。
獲取方式
長按關注【小白學視覺】
獲取更多計算機視覺學習資源
本文分享自微信公衆號 - Python與算法之美(Python_Ai_Road)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。