Tag Archive

标签:Agent

这里整理所有带有「Agent」标签的文章,方便按主题快速回看。

Agent

共 4 篇
每日调研 · 2026-04-30

2026-04-30 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-04-29

2026-04-29 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
每日调研 · 2026-04-28

2026-04-28 AI/LLM 最新论文与研究热点简报

最近 24-48 小时 AI/LLM/Agent/代码智能相关最新论文与热点进展筛选。
dailyAILLMAgentCode IntelligenceResearch Briefing
主题归档 · 2026-04-28

On-Policy Distillation:从模型压缩到 Agent 自我进化的蒸馏范式

On-Policy Distillation 将蒸馏从静态教师数据推进到学生自身行为分布上的密集监督;它不仅是 RL 的稳定替代形态,也是 DeepSeek-V4 式多专家合版、coding agent 经验吸收和 personal agent 自我进化的关键桥梁。
LLMAgentReinforcement LearningDistillationSelf-EvolutionDeepSeek-V4Coding Agent