Tag: RLHF

  • LLM + RLHF = Chat Agent

    Large-Scale Language Model + Reinforcement learning from human feedback = Helpful Chat Agent 回顾 OpenAI GPT 的规模升级之路 在对话智能体应用大火的今天,回顾第一个杀手级应用 ChatGPT 被研发出来之前经历的事情格外有趣。从其创造者…