adapter-efficiency

标签

Cards List
#adapter-efficiency

LLiMba:单卡GPU上的撒丁语——将3B参数语言模型适配至一种濒临消失的罗曼语族语言

arXiv cs.CL · 2天前 缓存

本文介绍了 LLiMba,这是一个基于 Qwen2.5 适配而来的3B参数模型,旨在支持撒丁语。该模型在单张消费级 GPU 上通过继续预训练和有监督微调完成训练。文章评估了多种 LoRA 配置,发现适配器容量对低资源语言适配的性能和事实准确性有显著影响。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈