llm-guided

#llm-guided

面向稀疏奖励强化学习的不确定性感知LLM引导策略塑形

arXiv cs.LG ↗ · 3天前缓存

提出ULPS，一种将校准的LLM集成到RL训练中的框架，通过不确定性调制的引导和基于A*的符号轨迹，在MiniGrid-UnlockPickup上实现了更高的成功率和样本效率。

0 人收藏 0 人点赞

#llm-guided

arXiv cs.LG ↗ · 2026-05-25 缓存

介绍了多智能体残差上下文学习（MARICL），这是一种智能体框架，利用LLM智能体分析基础模型在表格数据上的残差，假设缺失的结构，并通过文本梯度优化产生显式的修正项。在九个基准测试中，MARICL持续优于其基础模型，并在无细胞蛋白质预测中展示了机制泛化能力。

0 人收藏 0 人点赞