Deepmind「好奇心」強化學習新突破！改變獎勵機制，讓智能體不再「兜圈子」...

時間 2021-01-13

原文原文鏈接

新智元報道來源：Google AI 作者：Nikolay Savinov, Timothy Lillicrap, 編譯：大明【導讀】Google、Deepmind和蘇黎世聯邦理工學院的研究人員提出「好奇心學習」新方法，改變了智能體「好奇心」的生成方式和獎勵機制，獎勵機制不再基於智能體的「意外」，而是其記憶和所在情景。研究人員稱，新方法可以有效降低智能體「原地兜圈子」、「拖延」等不良

>>阅读原文<<