【論文筆記】NEURAL COMBINATORIAL OPTIMIZATION WITH REINFORCEMENT LEARNING

時間 2020-12-24

標籤 ML&CO 简体版

原文原文鏈接

目錄論文一、概論二、模型參數公式網絡 Critic網絡 actor-critic算法搜索策略三、實驗及結果幾種不同的實驗組合實驗結論四、遷移到揹包問題定義實驗結論 ![在這裏插入圖片描述](https://img-blog.csdnimg.cn/20200519165501917.png) 論文強化學習+指針網絡+組合優化一、概論主要是用強化學習中的策略梯度方法，來

>>阅读原文<<