Tag Archive

标签：预训练

这里整理所有带有「预训练」标签的文章，方便按主题快速回看。

预训练

共 3 篇

论文精读 · 2026-05-24

HRM-Text：一篇试图把“预训练”重新做小的论文

解读 arXiv:2605.20613 HRM-Text：用分层递归架构、任务完成目标和 PrefixLM，把 1B 模型从零训练的门槛压到 40B tokens / 约 1500 美元量级。

论文解读预训练架构 PrefixLM recurrent-model LLM

主题归档 · 2026-04-30

数学数据能提升代码能力吗？代码数据能反哺数学推理吗？

数学与代码能力确实存在迁移，但不是简单对称迁移：代码更像形式化执行与工具使用的底座，常常更强地反哺数学；数学数据更强地提升抽象推理与可验证训练信号，对代码的提升依赖任务形态与训练阶段。

LLM 数学推理代码智能预训练后训练数据配比 RLVR

主题归档 · 2026-04-30

预训练数据能否像人类教育一样组织？Curriculum Learning、数据混合与 Developmental Pretraining 研究脉络

调研“按人类学习顺序组织预训练数据”的现有研究支撑：从 Bengio 的 Curriculum Learning、自步学习、NMT 中的 competence-based curriculum，到 BabyLM、TinyStories、Textbooks Are All You Need、DoReMi、ODM、Irreducible Curriculum 与最新 LLM 预训练课程实验，分析该想法的证据、边界与可研究机会。

LLM 预训练 curriculum-learning data-mixture developmental-learning data-centric-ai