Q-learning算法實踐

時間 2021-01-20

標籤人工智能智能學習機器人學習简体版

原文原文鏈接

我們將會應用 Q-learning 算法完成一個經典的 Markov 決策問題 -- 走迷宮！項目描述：在該項目中，你將使用強化學習算法，實現一個自動走迷宮機器人。如上圖所示，智能機器人顯示在右上角。在我們的迷宮中，有陷阱（紅色炸彈）及終點（藍色的目標點）兩種情景。機器人要儘量避開陷阱、儘快到達目的地。小車可執行的動作包括：向上走 u、向右走 r、向下走 d、向左走 l。執行不同的動作後

>>阅读原文<<

相關文章

相關標籤/搜索

算法 - Lru算法

PHP 實現算法

KMP算法實現

JAVA算法實現

算法實驗四

算法python實現

紅包項目實戰

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<