byte-level

标签

Cards List
#byte-level

字节级模型

Reddit r/LocalLLaMA · 6天前

讨论了字节级分词器是否在精确任务(如区分相似名称、计数字符和大小写敏感)上优于子词分词器,并询问当前推荐。

0 人收藏 0 人点赞
#byte-level

跨分词器LLM蒸馏:基于字节级接口的方法

Hugging Face Daily Papers · 2026-04-13 缓存

本文提出字节级蒸馏(BLD),一种简单的跨分词器知识迁移方法,通过在共享的字节级接口上操作,在1B-8B参数模型上实现了与更复杂现有方法相当或更优的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈