llm-guided

标签

Cards List
#llm-guided

面向稀疏奖励强化学习的不确定性感知LLM引导策略塑形

arXiv cs.LG · 3天前 缓存

提出ULPS,一种将校准的LLM集成到RL训练中的框架,通过不确定性调制的引导和基于A*的符号轨迹,在MiniGrid-UnlockPickup上实现了更高的成功率和样本效率。

0 人收藏 0 人点赞
#llm-guided

从残差到推理:基于LLM的表格数据机制推断

arXiv cs.LG · 2026-05-25 缓存

介绍了多智能体残差上下文学习(MARICL),这是一种智能体框架,利用LLM智能体分析基础模型在表格数据上的残差,假设缺失的结构,并通过文本梯度优化产生显式的修正项。在九个基准测试中,MARICL持续优于其基础模型,并在无细胞蛋白质预测中展示了机制泛化能力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈