Tag Archive
标签:reasoning-sft
这里整理所有带有「reasoning-sft」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
复现指南
reasoning-sft
共 1 篇
论文精读 · 2026-06-18
Rethinking Generalization in Reasoning SFT:SFT 真的只会记忆吗?
解读 arXiv 2604.06628:reasoning SFT 的泛化不是“有/没有”的二元问题,而是由优化充分性、数据质量与结构、基础模型能力共同决定,并且伴随安全退化代价。
reasoning-sft
long-cot
post-training
generalization
rlvr
safety