Tag Archive

标签:PrefixLM

这里整理所有带有「PrefixLM」标签的文章,方便按主题快速回看。

PrefixLM

共 1 篇
论文精读 · 2026-05-24

HRM-Text:一篇试图把“预训练”重新做小的论文

解读 arXiv:2605.20613 HRM-Text:用分层递归架构、任务完成目标和 PrefixLM,把 1B 模型从零训练的门槛压到 40B tokens / 约 1500 美元量级。
论文解读预训练架构PrefixLMrecurrent-modelLLM