C. 人工智能 --- 強化/增強學習

C. 強化/增強學習 離散 馬爾可夫模型 馬爾科夫鏈 馬爾可夫決策過程 動態規劃 貝爾曼方程 策略估計 策略改進 策略迭代 值迭代 蒙特卡羅方法 時間差分法 隱馬爾可夫模 評估問題:前向後向算法 解碼問題:維特比算法(Viterbi) 學習問題:前向後向算法(BAUM-WELC
相關文章
相關標籤/搜索