聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

RL极简入门:从MDP、DP MC TC到Q函数、策略学习、PPO

2023-02-10 14:09 浏览: 1404397 次 我要评论(0 条) 字号:

强化学习里面的概念、公式,相比ML/DL特别多,初学者刚学RL时,很容易被接连不断的概念、公式给绕晕,而且经常忘记概念与公式符号表达的一一对应(包括我自己在1.10日之前对好多满是概念/公式的RL书完全看不下去,如今都看得懂了,故如果读文本之前,你正在被RL各种公式困扰,相信看完这篇RL极简入门后就完全不一样了)。


网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复