深度強化學習系列之(13): 深度強化學習實驗中應該使用多少個隨機種子?How Many Random Seeds Should I Use?

How Many Random Seeds Should I Use? Statistical Power Analysis in (Deep) Reinforcement Learning Experiments 前言 不斷檢查實驗結果的統計意義是解決深度強化學習中所謂「再現性危機」的強制性方法步驟之一。本論文將解釋隨機種子數與統計錯誤概率之間的關係。對於t檢驗和bootstrap置信區間檢驗,
相關文章
相關標籤/搜索