Bandit算法

       在生活中,每個人都會面臨各種各樣的選擇問題,簡單的來說中午吃什麼有很多種可能性,怎麼樣能提供一種比較好的辦法來解決選擇難的問題,那就是Bandit算法       說到Bandit算法,我起初剛看到這個算法的時候是出現在強化學習裏面,這個算法主要來源於賭博的問題,主要是這麼回事,一個人去賭場搖老虎機,你不知道老虎機是什麼可以理解爲就是一臺機器你搖它的手臂它會往出吐錢,賭場有一排老虎機
相關文章
相關標籤/搜索