Tag Archive

标签:LLM

这里整理所有带有「LLM」标签的文章,方便按主题快速回看。

LLM

共 60 篇
每日调研 · 2026-06-14

2026-06-14 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-13

2026-06-13 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-12

2026-06-12 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-11

2026-06-11 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-10

2026-06-10 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
论文精读 · 2026-06-10

Post-training is (Massive) Supervised Learning:后训练正在把 LLM 带回“大规模监督学习”吗?

这篇 position paper 认为,当前 LLM 的大规模后训练正在把评测分布变成训练分布;即使从随机初始化开始,只靠数学/代码 SFT 数据也能在对应 benchmark 上取得不低成绩,因此很多“推理能力”可能首先是分布拟合能力,而不是开放泛化能力。
LLMpost-trainingsupervised learningSFTRLreasoningmeta-learning
每日调研 · 2026-06-09

2026-06-09 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-08

2026-06-08 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-07

2026-06-07 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-06

2026-06-06 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-05

2026-06-05 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-04

2026-06-04 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-03

2026-06-03 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-02

2026-06-02 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-06-01

2026-06-01 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-31

2026-05-31 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-30

2026-05-30 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-29

2026-05-29 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-27

2026-05-27 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-26

2026-05-26 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-25

2026-05-25 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-24

2026-05-24 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
论文精读 · 2026-05-24

HRM-Text:一篇试图把“预训练”重新做小的论文

解读 arXiv:2605.20613 HRM-Text:用分层递归架构、任务完成目标和 PrefixLM,把 1B 模型从零训练的门槛压到 40B tokens / 约 1500 美元量级。
论文解读预训练架构PrefixLMrecurrent-modelLLM
主题归档 · 2026-05-24

STaR 与自举式自训练:LLM 能不能自己生成训练数据并训练自己?

从 STaR 到 Quiet-STaR、V-STaR、B-STaR、AdaSTaR、START、STaR-SQL 等系列工作,系统梳理“模型自己生成训练信号再训练自己”这条路线的技术脉络、核心瓶颈与研究机会。
LLM自训练STaR推理合成数据self-improvement
每日调研 · 2026-05-23

2026-05-23 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-22

2026-05-22 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-21

2026-05-21 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-20

2026-05-20 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-19

2026-05-19 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-18

2026-05-18 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-17

2026-05-17 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-16

2026-05-16 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-05-16

大模型 OPD:经典工作、发展逻辑与最新问题

系统梳理大模型 On-Policy Distillation 的定义、经典工作、发展逻辑、方法谱系与当前开放问题。
LLMOPDOn-Policy Distillation后训练LLM Agent
每日调研 · 2026-05-15

2026-05-15 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-14

2026-05-14 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-05-14

大语言模型 Adaptive Thinking:从“会思考”到“知道该想多久”

梳理大语言模型 Adaptive Thinking / reasoning effort / thinking budget 的主流做法、think/no-think 开关机制、训练与推理控制路径,以及当前研究机会。
LLMadaptive-thinkingreasoningtest-time-computepost-training
每日调研 · 2026-05-13

2026-05-13 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-05-13

GPT-5.5、GPT-5.4、Codex、DeepSeek V4 与 GLM-5.1:Benchmark 与价格横向对比

横向比较 GPT-5.5、GPT-5.4、GPT-5.4 mini、GPT-5.3 Codex、GPT-5.2、DeepSeek V4 Pro/Flash 与 GLM-5.1 在 Agent、通用、数学、代码 benchmark 以及 API 价格上的表现。
LLMAgentBenchmarkCodingPricing
每日调研 · 2026-05-12

2026-05-12 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-11

2026-05-11 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-10

2026-05-10 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-05-10

上下文太多为什么会让大模型变笨:长上下文退化、Context Engineering 与科研机会综述

面向初学者和研究选题,系统解释长上下文退化的现象、机制、评测、模型与系统方案,以及它如何连接 RAG、上下文压缩、KV cache、Agent memory、代码智能、长轨迹 RL 和 latent-space reasoning。
long-contextLLMcontext-engineeringRAGmemoryagentbenchmark
每日调研 · 2026-05-09

2026-05-09 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
论文精读 · 2026-05-09

daVinci-LLM:把预训练从“炼丹”推进到“科学实验”

详细解读 daVinci-LLM 的核心贡献:全开放预训练过程、Data Darwinism 数据处理框架、两阶段自适应课程、200+ 消融实验,以及它对基础模型训练研究的启发。
LLMPretrainingOpen ModelsDataReasoning
每日调研 · 2026-05-08

2026-05-08 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-07

2026-05-07 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-06

2026-05-06 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-05-06

大模型预训练与 Mid-training 数据的差距:阶段定位、数据配方与准备方法

系统梳理大模型训练中 pretraining 与 mid-training 的定位差异:预训练数据负责建立通用语言、知识与表征底座,mid-training 数据则作为从通用预训练分布到后训练目标分布的桥梁,面向数学、代码、QA、长上下文、指令与推理等能力做高质量、低比例、强评估闭环的阶段性注入。
LLMpretrainingmid-trainingdata curationpost-trainingfoundation modelOLMoLlama
每日调研 · 2026-05-04

2026-05-04 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-03

2026-05-03 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-02

2026-05-02 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-05-01

2026-05-01 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-04-30

2026-04-30 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-04-30

数学数据能提升代码能力吗?代码数据能反哺数学推理吗?

数学与代码能力确实存在迁移,但不是简单对称迁移:代码更像形式化执行与工具使用的底座,常常更强地反哺数学;数学数据更强地提升抽象推理与可验证训练信号,对代码的提升依赖任务形态与训练阶段。
LLM数学推理代码智能预训练后训练数据配比RLVR
主题归档 · 2026-04-30

预训练数据能否像人类教育一样组织?Curriculum Learning、数据混合与 Developmental Pretraining 研究脉络

调研“按人类学习顺序组织预训练数据”的现有研究支撑:从 Bengio 的 Curriculum Learning、自步学习、NMT 中的 competence-based curriculum,到 BabyLM、TinyStories、Textbooks Are All You Need、DoReMi、ODM、Irreducible Curriculum 与最新 LLM 预训练课程实验,分析该想法的证据、边界与可研究机会。
LLM预训练curriculum-learningdata-mixturedevelopmental-learningdata-centric-ai
每日调研 · 2026-04-29

2026-04-29 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
论文精读 · 2026-04-29

从事实知识反推模型规模:IKP 论文解读与“价格能否替代知识探针”的小实验

解读 Incompressible Knowledge Probes 如何用长尾事实知识估算黑盒大模型规模,并用 OpenRouter 价格数据检验“能否用模型价格得到类似结论”。
LLM模型规模知识容量API价格论文解读
每日调研 · 2026-04-28

2026-04-28 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-04-28

On-Policy Distillation:从模型压缩到 Agent 自我进化的蒸馏范式

On-Policy Distillation 将蒸馏从静态教师数据推进到学生自身行为分布上的密集监督;它不仅是 RL 的稳定替代形态,也是 DeepSeek-V4 式多专家合版、coding agent 经验吸收和 personal agent 自我进化的关键桥梁。
LLMAgentReinforcement LearningDistillationSelf-EvolutionDeepSeek-V4Coding Agent
主题归档 · 2026-04-27

大模型预训练数据准备中的去重算法:从 ExactSubstr 到 MinHash LSH 与语义去重

系统梳理大模型预训练数据去重的主流算法脉络,重点解释当前最常用、最有效的 MinHash LSH 近重复去重,以及 ExactSubstr、后缀数组、语义去重和 GPU 加速工具链的适用边界。
LLM预训练数据数据去重MinHashSemDeDup