pomdp

标签

Cards List
#pomdp

上下文收集决策过程:用于智能体搜索的POMDP框架

arXiv cs.AI · 3天前 缓存

本文引入了上下文收集决策过程(CGDP),这是一个用于建模LLM智能体搜索行为的POMDP框架,提出了能够提升多跳推理能力并降低Token消耗且不影响性能的干预措施。

0 人收藏 0 人点赞
#pomdp

基于路径策略梯度的非短视主动特征获取

arXiv cs.LG · 6天前 缓存

本文提出了 NM-PPG,这是一种利用路径策略梯度优化昂贵预测场景中顺序特征选择的非短视主动特征获取方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈