Introduction

从大一开始,我写博文已经有3年了,从一开始的在csdn、博客园、github.io个人主页再到后来自己购置了服务器,搭建了自己的博客网站,在这个过程中也慢慢掌握了一些写作上的心得和经验。

这个博客的主要用途是强化学习的经典论文阅读笔记和教程,以及一些自己的学习心得和技术分享。希望能够通过这个博客记录自己的学习历程,也希望能够帮助到一些有需要的人。

本博客假设读者有一定的强化学习基础,了解强化学习的基本概念和算法。如果对强化学习还不太了先解,建议学习一些强化学习的基础知识。推荐的基础材料如下:

2024.9.21 读论文心得:TakeAway Message is the most important thing in reading papers.

2024.10.4 读论文心得:借助AI论文阅读助手进行速读,可以提高阅读效率,比如我推荐的是腾讯的元宝

Paper List

(1) Baseline

DQN, Double DQN,Duel DQN,RainboW,DDPG,TD3,SAC,TRPO,PPO

(2) 细分方向

  1. 基于偏好的强化学习:TREX,DREX,InstructGPT

  2. 多智能体强化学习:QMIX,QPLEX

  3. 元强化学习:MAML,PEARL

  4. 基于表征的强化学习: Diversity is all you need

  5. 模仿学习:

    • DAgger,GAIL,IQ-Learn
  6. (model-free)离线强化学习:CQL,BCQ,IQL,AWAC,XQL,DT

  7. 基于模型的强化学习:

    • a.Online:Dreamer系列,MBPO
    • b. Offline:MOPO,COMBO,RAMBO-RL
    • c.Planning:TD-MPC系列,TT,Diffuser

博文撰写心得

写博文并不是一件简单的事情,尤其是当你要把一个理念清楚有力地传达给接收方时。我个人一直认为:写作和做Presentation,都是一个科研人员的能力的体现。如何从一个很简单的motivation或者思想出发,循序渐进地将一篇论文的方法娓娓道来,并辅以一些比较独特的个人见解(High-Level Idea),这是一件非常有挑战性的事情。所以,我将从以下几个方面来谈谈我在博文撰写过程中的一些心得,这也是本网站的博文所遵循的写作框架:

  1. 从想要解决的问题或者motivation出发,引出论文的主要方法和思想,这是一篇博文的开篇,也是最重要的部分。如果你能够很好地引出论文的主要方法和思想,那么你的博文就成功了一半。

  2. 讲完motivation之后,先将算法的整体框架展示出来,这样读者就能够对整个算法有一个大致的了解,然后再逐步展开细节。这个过程可以稍微增加一些代码片段,然后简单的呈现实验效果。

  3. 最后是补充一些理论定理,重点不在证明这些定理,而是宏观地理解这些定理在整个算法中的作用,定理部分不应该是简单的将论文拷贝粘贴,而是要有自己的理解和见解。

  4. 总结全文,提出一些自己的见解,这个部分是最能体现个人思想的部分,也是最能体现个人水平的部分。

前沿研究

Noam Brown

results matching ""

    No results matching ""