RL – Blog Sketch

强化学习中的若干概念

wponaws — Sun, 25 Aug 2024 23:46:11 +0000

这是学习我阅读若干在线 RL 教程所作的笔记，比较杂乱无章，不适合作为你的第一个 RL 教程阅读，如果想要找一个入门的 RL 教程推荐从头到尾阅读 OpenAI 的 Spinning Up

再贴一个叶哥的同类博文作为参照，叶哥的博文详尽全面。

Model-free 的方法不会对环境进行建模。当然，为了训练，代码中至少是要某种程度上建模环境和回报的，但除了定义…

wponaws — Tue, 11 Jun 2024 04:59:28 +0000

智能体行动的环境，很多都可以归入如下两类：

…