runtime-optimization

标签

Cards List
#runtime-optimization

RAMPART:基于注册表的智能体记忆系统,具备优先级感知的运行时转换能力

arXiv cs.CL · 昨天 缓存

RAMPART 是一种面向基于 LLM 的智能体的编译期内存模型和纯内存块注册表,通过五种可组合的原语管理上下文组装,支持优先级排序与淘汰策略。在多个 7B 至 14B 参数规模模型上的实验表明,块分组、相关性门控和模式淘汰能够显著提升任务成功率并降低提示词 token 开销。

0 人收藏 0 人点赞
#runtime-optimization

@_akhaliq: GPU Forecasters 语言模型作为内核运行时优化的选择性代理

X AI KOLs Following · 2天前 缓存

本文提出使用语言模型作为选择性代理来优化GPU内核运行时,展示了一种新颖的性能预测方法。

0 人收藏 0 人点赞
#runtime-optimization

SkillSmith: 将智能体技能编译为边界引导的运行时接口

arXiv cs.AI · 2026-05-18 缓存

SkillSmith是一个边界优先的编译器-运行时框架,从LLM智能体技能中提取细粒度的操作边界,使智能体能够动态访问仅相关的组件,在SkillsBench基准测试上减少了57.44%的求解阶段令牌使用量和42.99%的思考迭代次数。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈