Tag Archive

标签:think model

这里整理所有带有「think model」标签的文章,方便按主题快速回看。

think model

共 1 篇
主题归档 · 2026-06-15

Think / Reasoning 模型的 SFT:和传统指令微调有什么不同?

系统梳理 think/reasoning 模型 SFT 与传统 instruction SFT 的差异,分析 DeepSeek-R1、s1、LIMO、STILL-2、Sky-T1、OpenThoughts、Qwen3 等代表工作,并讨论 long-CoT SFT、cold-start、蒸馏、verifier、RLVR、test-time compute 与 latent reasoning 的关系。
LLMreasoning modelthink modelSFTlong-CoTRLVRdistillation