Tag Archive

标签:Test-time Scaling

这里整理所有带有「Test-time Scaling」标签的文章,方便按主题快速回看。

Test-time Scaling

共 1 篇
论文精读 · 2026-06-17

VibeThinker-3B:3B 小模型能否逼近一线可验证推理能力?

详解 VibeThinker-3B 技术报告:如何用 Spectrum-to-Signal 后训练范式、multi-domain RL、offline self-distillation 与 claim-level test-time scaling,把 3B dense 小模型推到数学和代码等可验证推理任务的一线性能区间。
LLM ReasoningSmall Language ModelsPost-trainingRLVRCode ReasoningTest-time Scaling