爲何E-GREEDY算法中e越小,性能會更好

爲何E-GREEDY算法中e越小,性能會更好算法 How to understand the following sentences 性能 第一句,講的是e-貪心方法最終的性能更好的緣由在於它持續地探索使得找到最優動做的機率提升了(純粹的貪心只有1/3的機率找到最優動做)。blog 第二句,當e=0.1時,該方法探索的機率更高,於是能更早地找到最優動做,但它選取該動做的機率不超過91%(由於有10
相關文章
相關標籤/搜索