vocabulary-reduction

标签

Cards List
#vocabulary-reduction

通过令牌剪枝优化韩语中心的大语言模型

arXiv cs.CL · 2026-04-20 缓存

本文系统地评估了令牌剪枝这一压缩技术在韩语中心的LLM任务上的应用,该技术通过移除与无关语言对应的令牌和嵌入参数来压缩模型。研究评估了流行的多语言模型(Qwen3、Gemma-3、Llama-3、Aya)在不同词汇配置下的表现,发现令牌剪枝能显著改进生成稳定性并降低特定领域部署的内存占用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈