基於深度強化學習的離散自動生產線智能調度

時間 2021-01-13

標籤筆記简体版

原文原文鏈接

獲取更多資訊，趕快關注上面的公衆號吧！文章目錄摘要結論 1引言 2文獻綜述 3基於DRL的調度 3.1基於深度強化學習的智能調度 3.1.1加工單元的狀態建模 a每個加工單元的繁忙或空閒 b工藝中每道工序的繁忙或空閒 c多加工資源狀態 3.1.2運輸單元的行爲建模 3.1.3獎勵建模 3.1.4調度策略建模 3.1.5調度算法學習迭代 3.2離散事件仿真環境和基於深度強化學習的調

>>阅读原文<<