Deepmind「好奇心」強化學習新突破!改變獎勵機制,讓智能體不再「兜圈子」...

  新智元報道   來源:Google AI  作者:Nikolay Savinov,  Timothy Lillicrap, 編譯:大明 【導讀】Google、Deepmind和蘇黎世聯邦理工學院的研究人員提出「好奇心學習」新方法,改變了智能體「好奇心」的生成方式和獎勵機制,獎勵機制不再基於智能體的「意外」,而是其記憶和所在情景。研究人員稱,新方法可以有效降低智能體「原地兜圈子」、「拖延」等不良
相關文章
相關標籤/搜索