test-time-learning

标签

Cards List
#test-time-learning

PACEvolve++:提升进化搜索代理的测试时学习能力

Hugging Face Daily Papers · 6天前 缓存

本文介绍了 PACEvolve++,这是一种强化学习框架,通过将假设生成与执行解耦,提高了进化搜索代理在测试时的策略适应能力。

0 人收藏 0 人点赞
#test-time-learning

EvoTest:面向自我改进智能体系统的进化式测试时学习

arXiv cs.CL · 2026-04-20 缓存

EvoTest 引入了 J-TTL,一个衡量智能体测试时学习能力的基准,并提出了一个进化框架,其中 Actor 智能体玩游戏,而 Evolver 智能体在不进行微调的情况下迭代改进系统的提示、记忆和超参数。该方法在基于复杂文本的游戏中表现出优于基于反思和记忆的基线方法的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈