一個簡單易懂的多智能體強化學習建模過程的例子

        這裏基於一篇論文分享一種強化學習的建模過程,它是將通訊當中的資源分配問題創建成強化學習方法,首先大概讀一遍這個題目,叫「基於多智能體強化學習的無人機網絡資源分配」,這裏的network是通訊網絡不是神經網絡,資源分配是指通訊網絡中,頻譜資源、信道、帶寬、天線功率等等是有限的,怎麼管理這些資源來保證可以通訊的同時優化整個網絡吞吐量、功耗,這個就是網絡資源分配。這裏多智能體就是涉及博弈
相關文章
相關標籤/搜索