Bandit算法

       在生活中,每一個人都會面臨各類各樣的選擇問題,簡單的來講中午吃什麼有不少種可能性,怎麼樣能提供一種比較好的辦法來解決選擇難的問題,那就是Bandit算法git       說到Bandit算法,我起初剛看到這個算法的時候是出如今強化學習裏面,這個算法主要來源於賭博的問題,主要是這麼回事,一我的去賭場搖老虎機,你不知道老虎機是什麼能夠理解爲就是一臺機器你搖它的手臂它會往出吐錢,賭場有一
相關文章
相關標籤/搜索