深度強化學習爲什麼在實際當中用的比較少？

時間 2021-01-20

原文原文鏈接

寶珠道人（擅長於AI+科普，中國科學院大學）回答： RL相比CV和NLP的落地項目的確很少，比較有名的像AlphaGo都已經被吹爛了。其實很多業務用傳統方法就能做的不錯了，完全沒有必要用RL去冒險。當然落地少自然有它的幾個原因，我簡單分析一下可能有以下幾點。 1. 難以調參我們都知道深度學習是黑箱，RL都是end2end的模型，你就不知道自己哪一步有沒有寫錯，有可能一個加號和拼接之間的差距就很大

>>阅读原文<<