cost-aware

#cost-aware

GraphDx：一种成本感知、知识增强的序贯诊断多智能体框架

arXiv cs.AI ↗ · 2026-07-20 缓存

GraphDx是一种成本感知、知识增强的序贯诊断多智能体框架，利用LLM构建的医学知识图谱和三个协作智能体，提高诊断成功率并降低测试成本。

0 人收藏 0 人点赞

#cost-aware

超越成功率：成本感知的攻击与防御安全智能体评估

Hugging Face Daily Papers ↗ · 2026-07-17 缓存

本文提出了一种成本感知的安全AI智能体评估框架，不仅衡量成功率，还衡量推理和工具成本。研究发现，攻击性CTF性能随计算资源增加而提升，而防御性SOC任务更多依赖于规范的工具使用而非单纯的推理预算。

0 人收藏 0 人点赞

#cost-aware

从新手到专家：面向众感知中工人性能演变的成本感知型Bandits

arXiv cs.LG ↗ · 2026-07-16 缓存

本文介绍了一种面向移动众感知的成本感知Bandit框架，该框架将工人性能建模为先增后收敛的函数，并在预算约束下处理未知成本。

0 人收藏 0 人点赞

#cost-aware

更少专家，更快解码：面向混合专家模型的成本感知推测解码

arXiv cs.CL ↗ · 2026-07-15 缓存

本文提出EcoSpec，一种针对混合专家模型的成本感知推测解码框架，在草稿选择阶段考虑了专家激活成本。通过在无需修改目标模型验证规则的情况下减少专家足迹，该方法在DeepSeek-V3.1、Qwen3-235B-A22B和GPT-OSS-120B等大规模MoE模型上实现了高达1.62倍的加速。

0 人收藏 0 人点赞

#cost-aware

RouteRec：推荐智能体选择与聚合的严格评估

arXiv cs.CL ↗ · 2026-07-14 缓存

RouteRec是一个用于在成本约束下评估请求级硬选择与项目级学习聚合异构推荐智能体（包括LLM重排序器）的框架。在MovieLens-1M上的实验表明，项目级聚合显著优于请求级选择。

0 人收藏 0 人点赞

#cost-aware

TSRouter：用于时间序列推理的动态模态-模型选择

arXiv cs.LG ↗ · 2026-07-13 缓存

介绍TSRouter，一种基于图的动态路由框架，能够为时间序列推理任务选择最佳模态（LLM或VLM）和模型，相较于基线实现了16%到46%的相对改进，并展示了零样本泛化能力。

0 人收藏 0 人点赞

#cost-aware

SAGEAgent: 用于多模态生存预测中成本感知模态获取的自进化智能体

arXiv cs.AI ↗ · 2026-07-13 缓存

SAGEAgent 是一种基于LLM的临床智能体，它依次决定为癌症患者获取哪些诊断模态，以平衡预测准确性与临床侵入性，在将获取负担降低55%的同时，保持具有竞争力的生存预测性能。

0 人收藏 0 人点赞

#cost-aware

AdaStop：面向DNN测试选择的成本感知提前停止策略

arXiv cs.LG ↗ · 2026-07-08 缓存

AdaStop是一个用于DNN测试选择的成本感知提前停止框架，当边际故障发现率低于阈值时，它最优地停止标注，仅使用9%-31%的标注预算就能实现65%-84%的故障发现。

0 人收藏 0 人点赞

#cost-aware

学习何时停止有用？推理模型早期退出的成本感知研究

arXiv cs.AI ↗ · 2026-07-01 缓存

本文介绍了LearnStop，一种用于推理模型的轻量级检查点停止器，它从在线特征中预测前缀正确性，并发现学习式停止仅在多个问题早期正确且没有单一可靠的标量信号时，才比标量规则更有价值。

0 人收藏 0 人点赞

#cost-aware

聚类、路由、升级：面向成本感知的LLM服务的级联框架

arXiv cs.CL ↗ · 2026-06-29 缓存

提出了一种面向成本感知的LLM服务的两阶段级联框架，该框架将查询聚类并路由至最具成本效益的模型，然后将低质量输出升级至更强的模型。在降低推理成本的同时，保留了97-99%的准确率。

0 人收藏 0 人点赞

#cost-aware

Translate-R1：基于强化学习的成本感知翻译工具使用

arXiv cs.CL ↗ · 2026-06-08 缓存

Translate-R1引入了一种基于强化学习的方法，用于大语言模型中的成本感知翻译工具使用。该模型根据自身的理解能力和一个成本敏感性参数，学会决定何时翻译输入，从而在多种语言之间实现帕累托最优权衡。

0 人收藏 0 人点赞

cost-aware

提交意见反馈