adaptive

标签

Cards List
#adaptive

面向大语言模型的自适应多分辨率程序性知识压缩

Hugging Face Daily Papers · 2天前 缓存

SKIM是一个自适应多分辨率软令牌压缩框架,用于压缩面向LLM的程序性技能,在降低预填充成本和延迟的同时保持任务性能。

0 人收藏 0 人点赞
#adaptive

AdaPLD:自适应检索与复用的高效无模型推测解码方法

arXiv cs.CL · 2026-06-05 缓存

AdaPLD是一种无需训练的方法,通过自适应检索结合词汇与语义相似度,并构建分支复用假设来处理续写不确定性,从而提升无模型推测解码的效率,最高可实现3.10倍解码加速。

0 人收藏 0 人点赞
#adaptive

CosmicFish-HRM:通过紧凑语言模型中的层级循环机制实现自适应推理

arXiv cs.LG · 2026-05-29 缓存

本文介绍了 CosmicFish-HRM,这是一个紧凑的 8277 万参数语言模型,配备层级推理模块,在推理过程中动态分配推理计算资源,并根据输入复杂度学习何时停止。

0 人收藏 0 人点赞
#adaptive

知识蒸馏中一致性信息丰富的软标签温度

arXiv cs.LG · 2026-05-21 缓存

提出CIST方法,在知识蒸馏中为教师和学生分配独立的样本自适应温度,生成一致性信息丰富的软标签,并放宽严格的logit尺度匹配。在视觉和语言任务上的实验表明,相比标准KD具有一致的改进。

0 人收藏 0 人点赞
#adaptive

并非所有令牌都值得缓存:学习语义感知的LLM前缀缓存驱逐策略

arXiv cs.LG · 2026-05-20

一种针对LLM前缀缓存的新型语义自适应驱逐策略,学习不同令牌类型间的令牌重用模式,相比现有策略实现了1.4倍至2.7倍的TTFT提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈