聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

  • 1322826 views阅读

    总有一天,失业不再遥远

    尽管人类离[通用人工智能]的路还很远,但越来越多新技术的出现,让这条路得以不断加速。 ​What?强化学习设计芯片? 就这几天的事:Google已经开始用强化学习技术来设计芯片了! 如果说用强化学习来玩游戏、下围棋,甚至用来帮助提升互联网广告的点击率、收入,都不是什么新鲜事的话,那么用强化学习来设计芯片,就也太新鲜了吧?但G...

    分类:技术文章 时间:2020-05-03 21:30 我要评论(0个)

  • 1293494 views阅读

    强化学习框架 rlpyt 源码分析:(10) 基于CPU的并行采样器CpuSampler,worker的实现

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。 本文是上一篇文章的续文,继续分析CpuSampler的源码。...

    分类:技术文章 时间:2020-01-21 23:25 我要评论(0个)

  • 907322 views阅读

    强化学习框架 rlpyt 源码分析:(9) 基于CPU的并行采样器CpuSampler

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。 本文是上一篇文章的续文,继续分析CpuSampler的源码。...

    分类:技术文章 时间:2020-01-20 23:25 我要评论(0个)

  • 2622143 views阅读

    强化学习框架 rlpyt 源码分析:(8) 基于CPU的并行采样器CpuSampler

    转载需注明出处:https://www.codelast.com/ 写这篇文章的过程中,我改稿改到怀疑人生,因为有些我自己下的结论在看了很多次源码之后又自我否定了多次,所以这篇文章花了我很长时间才完工。虽然完稿之后我仍然不敢保证绝对正确,但这至少是在我当前认知情况下我“自以为”正确的版本了,写长稿不易,望理解。 查看关于 rlpyt 的更多文章请点击这里。...

    分类:技术文章 时间:2020-01-12 23:25 我要评论(0个)

  • 2337855 views阅读

    强化学习框架 rlpyt 源码分析:(7) 模型参数是在哪更新的

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。 如果你想用这个框架来开发自己的强化学习程序(尤其是那些不属于...

    分类:技术文章 时间:2020-01-09 11:25 我要评论(0个)

  • 3531686 views阅读

    强化学习框架 rlpyt 并行(parallelism)原理初探

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。  在单机上全面的并行(Parallelism)特性是 rlp...

    分类:技术文章 时间:2019-12-24 11:25 我要评论(0个)

  • 4347702 views阅读

    强化学习的Atari环境下的frame skipping(跳帧)是指什么

    转载需注明出处:https://www.codelast.com/ 查看更多强化学习的文章请点击这里。 Atari是强化学习领域最常用的一个游戏实验环境,在很多文章以及代码中,会看到frame skipping(跳帧)这个概念,那么它到底是指什么呢? 使用ALE接口来实现agent与Atari环境的交互时,Atari环境会返回游戏的每一帧图像作为observation,agent需要为这...

    分类:技术文章 时间:2019-12-15 23:25 我要评论(0个)

  • 2835500 views阅读

    强化学习框架 rlpyt:如何保存训练过程中的所有model

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。  本文描述了如何保存迭代训练过程的所有model,以及背后的...

    分类:技术文章 时间:2019-12-11 23:25 我要评论(0个)

  • 7709792 views阅读

    强化学习框架 rlpyt:如何使用预训练(pre-trained)的model

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。  本文描述了在 rlpyt 框架下,如何使用一个预训练过的(...

    分类:技术文章 时间:2019-12-11 23:25 我要评论(0个)

  • 2019126 views阅读

    强化学习框架 rlpyt:如何同时输出gaussian(高斯)和categorical(类别)的action

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。  本文记录 rlpyt 的一些issue提及的问题以及解决方...

    分类:技术文章 时间:2019-12-11 11:25 我要评论(0个)

  • 1947700 views阅读

    强化学习框架 rlpyt 源码分析:(6) 模型指标什么时候从 nan 变成有意义的值

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。 如果你想用这个框架来开发自己的强化学习程序(尤其是那些不属于...

    分类:技术文章 时间:2019-12-08 23:25 我要评论(0个)

  • 3676206 views阅读

    强化学习框架 rlpyt 数据可视化

    转载需注明出处:https://www.codelast.com/ 查看关于 rlpyt 的更多文章请点击这里。 rlpyt 是BAIR(Berkeley Artificial Intelligence Research,伯克利人工智能研究所)开源的一个强化学习(RL)框架。我之前写了一篇它的简介。  在训练强化学习模型的过程中,rlpyt 产生的大量训练日志...

    分类:技术文章 时间:2019-12-03 23:25 我要评论(0个)