semantic-aware

标签

Cards List
#semantic-aware

并非所有令牌都值得缓存:学习语义感知的LLM前缀缓存驱逐策略

arXiv cs.LG · 2026-05-20

一种针对LLM前缀缓存的新型语义自适应驱逐策略,学习不同令牌类型间的令牌重用模式,相比现有策略实现了1.4倍至2.7倍的TTFT提升。

0 人收藏 0 人点赞
#semantic-aware

通过语法引导和语义感知偏好优化改进代码翻译

arXiv cs.AI · 2026-05-14 缓存

本文提出CTO方法,通过对比学习和直接偏好优化结合语法引导与语义感知偏好优化来改进代码翻译,在C++、Java和Python翻译中显著优于现有基线。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈