强化学习里面的概念、公式,相比ML/DL特别多,初学者刚学RL时,很容易被接连不断的概念、公式给绕晕,而且经常忘记概念与公式符号表达的一一对应(包括我自己在1.10日之前对好多满是概念/公式的RL书完全看不下去,如今都看得懂了,故如果读文本之前,你正在被RL各种公式困扰,相信看完这篇RL极简入门后就完全不一样了)。
RL极简入门:从MDP、DP MC TC到Q函数、策略学习、PPO
上一篇: 美团视觉GPU推理服务部署架构优化实践
下一篇: 数字水印在数据安全保护中的应用实践和优化
网友评论已有0条评论, 我也要评论