JavaShuo
欄目
標籤
# 理論知識
# 理論知識
全部
知識整理
知識梳理
理性知識
理論知識學習
知識
論理
理論
認識論
AD小知識
C#小知識
知識點
Dubbo的運行原理,支持什麼協議,與SpringCould相比它爲什麼效率要高一些,Zookeeper底層原理
2020-12-27
# 理論知識
Dubbo
【李宏毅深度強化學習筆記】1、深度強化學習算法 策略梯度方法(Policy Gradient)
2021-01-02
強化學習
# 理論知識
深度強化學習
策略梯度
【李宏毅深度強化學習筆記】8、Imitation Learning
2021-01-02
強化學習
# 理論知識
深度強化學習
Imitation Learning
Behavior Cloning
Inverse Reinforcement Learning
強化學習Proximal Policy Optimization (PPO) 原理
2021-01-16
強化學習和深度學習
# 理論知識
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。