Category: paper

  • 强化学习中的若干概念

    这是学习我阅读若干在线 RL 教程所作的笔记,比较杂乱无章,不适合作为你的第一个 RL 教程阅读,如果想要找一个入门的 RL 教程推荐从头到尾阅读 OpenAI 的 Spinning Up 再贴一个叶哥的同类博文作为参照,叶哥的博文详尽全面。 Model-free 和 Model-based RL Model-free 的方法不会对环境进行建模。当然,为了训练,代码中至少是要某种程度上建模环境和回报的,但除了定义…

  • paper: 不借助平行语料可以进行机器翻译吗?

    这是以 “paper:” 作为标题前缀的论文速读系列。我如何写作本系列:在接触到令人尤其感兴趣的论文后,总结论文的部分内容,探讨论文之外的相关思想,不作为论文的概括,亦不保证信息或推理全部准确。本系列的更新策略:直接修改博文内容,而不标注”X月X日更新“ UNSUPERVISED MACHINE…