Tag Archive
标签:test-time learning
这里整理所有带有「test-time learning」标签的文章,方便按主题快速回看。
首页
每日调研
论文精读
主题归档
实验分析
复现指南
test-time learning
共 1 篇
论文精读 · 2026-06-15
JitRL:不用梯度更新,让 LLM Agent 在测试时做“即时强化学习”
详解 Just-In-Time Reinforcement Learning 如何把历史轨迹记忆转成 advantage,在推理时直接加到候选动作 logits 上,从而在不更新参数的情况下实现类似 KL 约束策略优化的 agent 持续学习。
LLM Agent
reinforcement learning
continual learning
test-time learning
memory
WebArena