深度強化學習爲什麼在實際當中用的比較少 ?

寶珠道人(擅長於AI+科普,中國科學院大學)回答: RL相比CV和NLP的落地項目的確很少,比較有名的像AlphaGo都已經被吹爛了。其實很多業務用傳統方法就能做的不錯了,完全沒有必要用RL去冒險。當然落地少自然有它的幾個原因,我簡單分析一下可能有以下幾點。 1. 難以調參 我們都知道深度學習是黑箱,RL都是end2end的模型,你就不知道自己哪一步有沒有寫錯,有可能一個加號和拼接之間的差距就很大
相關文章
相關標籤/搜索