hypernetwork

标签

Cards List
#hypernetwork

@_akhaliq: Code2LoRA 软件演化下代码语言模型的超网络生成适配器

X AI KOLs Following · 14小时前 缓存

本文介绍了Code2LoRA,一种基于超网络的方法,用于生成代码语言模型的适配器,以应对软件演化中的挑战。

0 人收藏 0 人点赞
#hypernetwork

Code2LoRA:超网络生成的适配器,用于软件演进中的代码语言模型

Hugging Face Daily Papers · 2天前 缓存

Code2LoRA 引入了一个超网络,该超网络能够从代码仓库中一次性前向传播生成 LoRA 适配器,使得冻结的代码大语言模型无需额外 token 即可适应仓库上下文,并高效支持不断演进的代码库。此外,它还提供了 RepoPeftBench,一个用于仓库条件代码建模的基准测试。

0 人收藏 0 人点赞
#hypernetwork

输入凸神经网络训练的一种提升方法

arXiv cs.LG · 2026-05-26 缓存

提出了一种用于训练输入凸神经网络(ICNN)的“提升”方法,该方法使用无约束的超网络生成非负的层间权重,从而软化损失景观并避免梯度衰减,相比投影梯度下降和softplus重参数化,实现了更低的测试损失。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈