tokenizer-agnostic

标签

Cards List
#tokenizer-agnostic

跨分词器LLM蒸馏:基于字节级接口的方法

Hugging Face Daily Papers · 2026-04-13 缓存

本文提出字节级蒸馏(BLD),一种简单的跨分词器知识迁移方法,通过在共享的字节级接口上操作,在1B-8B参数模型上实现了与更复杂现有方法相当或更优的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈