Tag Archive

标签:reasoning-sft

这里整理所有带有「reasoning-sft」标签的文章,方便按主题快速回看。

reasoning-sft

共 1 篇
论文精读 · 2026-06-18

Rethinking Generalization in Reasoning SFT:SFT 真的只会记忆吗?

解读 arXiv 2604.06628:reasoning SFT 的泛化不是“有/没有”的二元问题,而是由优化充分性、数据质量与结构、基础模型能力共同决定,并且伴随安全退化代价。
reasoning-sftlong-cotpost-traininggeneralizationrlvrsafety