Code2LoRA:超网络生成的适配器,用于软件演进中的代码语言模型
摘要
Code2LoRA 引入了一个超网络,该超网络能够从代码仓库中一次性前向传播生成 LoRA 适配器,使得冻结的代码大语言模型无需额外 token 即可适应仓库上下文,并高效支持不断演进的代码库。此外,它还提供了 RepoPeftBench,一个用于仓库条件代码建模的基准测试。
查看缓存全文
缓存时间: 2026/06/05 18:10
论文页面 - Code2LoRA:面向软件演化的超网络生成式代码语言模型适配器
来源:https://huggingface.co/papers/2606.06492
仓库上下文是代码大语言模型的瓶颈:每次补全都需要了解项目的导入、API和约定,而目前我们通过RAG、依赖分析或不断拉长的提示词为每次查询付出上下文代价——或者为每个仓库微调一个LoRA,然后看着它在下一次提交后失效。
我们问一个简单的问题:如果仓库本身就是提示词,但只使用一次呢?Code2LoRA是一个超网络,它读取一个仓库(或其提交流),并在单次前向传播中为一个冻结的代码大语言模型生成LoRA适配器。仓库的知识存储在权重中,推理时无需增加额外token。
该框架包含两种变体。
- Code2LoRA-Static将仓库快照转换为适配器,无需针对每个仓库进行训练,在仓库内评估中即可匹配每个仓库LoRA的上限,并在跨仓库场景中击败RAG/依赖解析上下文/FFT+RAG(精确匹配提升+9.9pp)。
- Code2LoRA-Evo是我们最兴奋的部分:一个GRU遍历提交历史并以每个提交O(1)的复杂度刷新适配器,从而使模型紧跟活跃开发而非与之对抗。在严格截止日期后的92个仓库OOD保留集上——即编码器从未见过的仓库——Code2LoRA-Evo将Qwen2.5-Coder骨干从44.6%精确匹配提升至74.1%。
为了确保这一切可测量,我们还发布了RepoPeftBench:604个Python仓库,涉及62K静态任务和400K基于提交的断言补全任务,并包含仓库内、跨仓库和时间OOD划分。我们希望它能够成为一个有用的基准,用于研究仓库条件化和感知演化的代码建模,而不仅限于我们自己的设置。
代码:https://anonymous.4open.science/r/code2lora-6857 · 数据和模型:https://huggingface.co/code2lora
相似文章
@_akhaliq: Code2LoRA 软件演化下代码语言模型的超网络生成适配器
本文介绍了Code2LoRA,一种基于超网络的方法,用于生成代码语言模型的适配器,以应对软件演化中的挑战。
JumpLoRA:大语言模型持续学习的稀疏适配器
JumpLoRA 引入了一个新颖的稀疏适配器框架,用于大语言模型的持续学习。该方法使用 JumpReLU 门控来动态隔离任务参数并防止灾难性遗忘。它增强了基于 LoRA 的方法,并超越了 ELLA 等最先进的持续学习方法。
ReLoRA: 知识复用适应方法,用于快速部署不断演进的LLM服务
ReLoRA是一个知识复用的适应框架,能够高效恢复面向不断演进的LLM服务的、可投入使用的LoRA适配器。通过自适应初始化和计划正则化,它可将准备时间缩短最多8.9倍,并将准确率提升最高4.6%。
Video2LoRA: 视觉-语言模型的参数化视频内化
本文介绍Video2LoRA,一种直接从视频表示预测低秩适配(LoRA)权重的方法,能够在冻结的视觉-语言模型中实现高效的视频处理。它将视觉令牌负载降低最多1500倍,查询TTFT降低6-80倍,同时在视频摘要和字幕生成基准上保持性能。
LoREnc: 低秩加密用于保护基础模型与LoRA适配器
LoREnc是一个无需训练的框架,通过谱截断与补偿来保护基础模型和LoRA适配器,防止未经授权的模型恢复,同时为授权用户保持性能。已被ICIP 2026录用。