token-reduction

标签

Cards List
#token-reduction

立即就绪:LOOP技能引擎通过一次性记录和确定性回放实现99%成功率并削减99%代币用量

arXiv cs.AI · 20小时前 缓存

LOOP技能引擎通过记录单次LLM驱动的执行,并通过参数化无分支技能进行确定性回放,实现了周期性AI代理任务99%的成功率和99%的代币削减,消除了随机性失效和高昂成本。

0 人收藏 0 人点赞
#token-reduction

@berryxia: Agent 记忆真是太特么卷了啊! 不得不说,这个赛道越多人加入越爽啊! Tencent AI团队花了整整6个月,就死磕一个问题:AI agent长会话里疯狂丢上下文。 他们最后把一套记忆系统做完,直接开源了。 我看完他们的分享,最大的感…

X AI KOLs Timeline · 昨天 缓存

腾讯AI团队开源了Agent记忆系统,通过实时上下文压缩、Mermaid任务地图和Persona记忆三种方法,显著提升长对话中的token效率和agent一致性,token消耗降低61%,人格一致性从48%提升至76%。

0 人收藏 0 人点赞
#token-reduction

提示微调:数据越少,推理能力越强

arXiv cs.CL · 3天前 缓存

本文提出了一种名为“提示微调”(Hint Tuning)的数据高效方法,该方法根据问题难度校准推理深度,从而减少推理模型中的标记使用量。在仅需1K个自标注样本的情况下,该方法在 Qwen3-Thinking 和 DeepSeek-R1-Distill 等模型上实现了显著的标记减少(24%-66%)。

0 人收藏 0 人点赞
#token-reduction

学习自适应推理路径以实现高效视觉推理

Hugging Face Daily Papers · 2026-04-16 缓存

AVR是一种自适应视觉推理框架,能够动态选择最优推理格式,在视觉推理任务中减少50-90%的token使用量同时保持准确性。该方法通过将视觉推理分解为三种认知功能并使用FS-GRPO训练来鼓励高效格式选择,从而解决推理路径冗余问题。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈