inference-time-control

标签

Cards List
#inference-time-control

大语言模型搜索代理的推理时预算控制

arXiv cs.AI · 2026-05-08 缓存

本文提出了一种用于大语言模型(LLM)搜索代理的两阶段推理时预算控制方法,利用信息价值(VOI)分数在多跳问答过程中优化工具调用和 Token 分配。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈