


  • OpenAI的spinning up,主要讲深度强化学习的基本概念和算法的主流思想,里面也有配套代码,代码适合初学者学习,不过配置环境有点恶心,涉及到OpenMPI的内容,代码实在跑不起来就算了,能读懂就挺好,这个强烈推荐看完

  • OpenAI的gym(更名为Gymnasium了,其实就是gym)环境,经典的强化学习环境,这个环境可以好好玩玩

  • stable baseline3,深度强化学习经典/常用算法合集,和gym配合使用,gym只是一个环境,或者叫agent,这个是学习控制agent的算法,或者叫policy。

  • 这个是网上一个老哥写的强化学习算法合集,这个和stable baseline3的算法内容基本相同,但是简单很多,适合初学者学习,可以配合这spinning up来看,这个代码很好读也很好跑起来。

  • 另一个不错的强化学习算法库:

  • 最后推荐一本叫《强化学习》的书,这本书很经典系统的介绍了强化学习的基础理论。但是这本书知识有点旧了,但是对入门还是有一些帮助,主要是前几张的内容可以仔细看看,理解一下动态规划,蒙特卡洛,和时序差分的概念比较重要。

  • pytorch必学深度学习框架,个人感觉学习pytorch看官网的教程就够了,不懂的api问gpt就好


以上就是强化学习/深度学习的一些资料,建议先熟悉熟悉基本的强化学习。熟悉一下linux和python,以及pytorch,之后再看下一步的强化学习在机器人上的应用。强烈建议看完spinning up,以及gym,后面那些框架大概看看就好,不要花费太多时间看算法框架,很多也不一定适合,而且太复杂,不要话太多时间思考算法细节,初步使用不会涉及到修改学习算法本身,多看看仿真器,多跑跑实际工程。多写多练才能更快进步。





