Tag Archive

标签：强化学习

这里整理所有带有「强化学习」标签的文章，方便按主题快速回看。

强化学习

共 2 篇

主题归档 · 2026-06-14

从不动点方程、压缩映射、采样估计、分布漂移和三重耦合出发，用小白能听懂的方式解释强化学习为什么比监督学习难。

主题归档 · 2026-06-14

用小白能听懂的方式拆解 V777 关于强化学习的知乎回答：对偶配对、占据测度、HJB 对偶、Actor-Critic、PPO、single shooting、MPC，以及这套叙事对 LLM Agent 的启发。