基於深度強化學習的離散自動生產線智能調度

獲取更多資訊,趕快關注上面的公衆號吧! 文章目錄 摘要 結論 ​1引言 2文獻綜述 ​3基於DRL的調度 3.1基於深度強化學習的智能調度 3.1.1加工單元的狀態建模 a每個加工單元的繁忙或空閒 b工藝中每道工序的繁忙或空閒​ ​c多加工資源狀態 3.1.2運輸單元的行爲建模 ​3.1.3獎勵建模 3.1.4調度策略建模​ 3.1.5調度算法學習迭代 3.2離散事件仿真環境和基於深度強化學習的調
相關文章
相關標籤/搜索