Tag Archive
标签:Code Agent
这里整理所有带有「Code Agent」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
复现指南
Code Agent
共 1 篇
论文精读 · 2026-05-26
ECHO:Terminal Agents 如何“免费”学到世界模型
解读 Microsoft Research 论文 ECHO:把终端环境返回的 stdout、stderr、日志、文件内容等 observation token 也纳入训练损失,让失败轨迹也产生密集监督,从而在不增加 rollout 的情况下提升 terminal agent 的 RL 效率。
LLM Agent
Agent RL
World Model
GRPO
Terminal Agent
Code Agent