強化學習筆記1-Python/OpenAI/TensorFlow/ROS-基礎知識

時間 2019-12-05

標籤強化學習筆記 python openai tensorflow ros 基礎知識欄目 Python 简体版

原文原文鏈接

概念：機器學習分支之一強化學習，學習經過與環境交互進行，是一種目標導向的方法。html 不告知學習者應採用行爲，但其行爲對於獎勵懲罰，從行爲後果學習。python 機器人避開障礙物案例：git 靠近障礙物-10分，遠離障礙物+10分。github 智能體本身探索獲取優良獎勵的各自行爲，包括以下步驟：docker 智能體執行行爲與環境交互行爲執行後，智能體從一個狀態轉移至另外一個狀態依據行爲得

>>阅读原文<<