《Scala機器學習》一一2.3 探索與利用問題

2.3 探索與利用問題 探索(exploration)與利用(exploitation)的應用很廣,從資金分配到研究自動駕駛汽車項目都在使用,但它最初也是源於賭博問題。該問題的經典形式是一個多臂賭博機(老虎機)問題,即假設有一個或多個手臂的賭博機,按次序以未知概率來拉動每個手臂,以此來表示獨立同分布的回報。在這種簡化模型中不斷獨立地重複。假設多個手臂間的回報是獨立的。其目標是最大化回報(比如贏錢的
相關文章
相關標籤/搜索