強化學習中的線性代數知識

時間 2021-01-12

原文原文鏈接

作者|Nathan Lambert 編譯|VK 來源|Towards Data Science 線性代數的基本原理如何用於深度強化學習？答案是解決了馬爾可夫決策過程時的迭代更新。強化學習(RL)是一系列用於迭代性學習任務的智能方法。由於計算機科學是一個計算領域，這種學習發生在狀態向量、動作等以及轉移矩陣上。狀態和向量可以採用不同的形式。當我們考慮通過某個線性系統傳遞一個向量變量，並得到一個類似的

>>阅读原文<<