【強化學習】python 實現 q-learning 例二

本文做者:hhh5460html 本文地址:https://www.cnblogs.com/hhh5460/p/10134855.htmlpython 問題情境 一個2*2的迷宮,一個入口,一個出口,還有一個陷阱。如圖算法 (圖片來源:https://jizhi.im/blog/post/intro_q_learning)數組  這是一個二維的問題,不過咱們能夠把這個降維,變爲一維的問題。app
相關文章
相關標籤/搜索