symmetry

标签

Cards List
#symmetry

将约束程序转化为局部搜索输入

arXiv cs.AI · 2026-05-20

本文提出了一种方法,利用对称性质从约束规范中自动生成局部搜索邻域,并在六个优化问题上进行了评估。

0 人收藏 0 人点赞
#symmetry

优化器设计的对称兼容原则:嵌入层、语言模型头、SwiGLU MLP 和 MoE 路由器

Hugging Face Daily Papers · 2026-05-18 缓存

研究人员提出了对称兼容优化器,这些优化器尊重神经网络参数的等变性结构,相比 Adam 等传统方法提高了训练稳定性和性能。该方法在多种语言模型架构上得到验证,包括 Qwen3-0.6B、Gemma 3 1B 和 OLMoE-1B-7B。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈