long-horizon-reasoning

标签

Cards List
#long-horizon-reasoning

MAP:一种用于长周期交互式智能体推理的“先绘图后行动”范式

Hugging Face Daily Papers · 昨天 缓存

本文提出了“先绘图后行动”范式(MAP),这是一个即插即用的框架,在执行前将环境理解前置到交互式LLM智能体中,在多个基准测试中取得了一致性的性能提升,并使前沿模型在25个游戏环境中的22个上超越了接近零的基线性能。

0 人收藏 0 人点赞
#long-horizon-reasoning

HAGE: 通过强化学习驱动加权图演化利用智能体记忆

Hugging Face Daily Papers · 3天前 缓存

HAGE引入了一种加权多关系记忆框架,能够在统一关系记忆图上实现查询条件化的遍历,通过自适应记忆检索和基于强化学习的优化来提高长程推理准确性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈