norm-preserving

标签

Cards List
#norm-preserving

保范Abliteration应用于Qwen3.6-35B-A3B:0%拒绝率,基准测试性能完整,开源数据集

Reddit r/LocalLLaMA · 5小时前

对Qwen3.6-35B-A3B应用保范Abliteration技术,实现0%拒绝率,基准测试性能保持不变,并发布了开源数据集。

0 人收藏 0 人点赞
#norm-preserving

基于广义杨-巴克斯特方程的可积令牌混合层

arXiv cs.LG · 2026-06-16 缓存

论文介绍了YB-Mixer,这是一种从广义杨-巴克斯特方程推导出的令牌混合层,具有精确的范数保持、深度稳定特性,并支持无顺序推理和可变预算推理。与注意力机制和状态空间基线相比,它在长程记忆任务上以更少的参数实现了具有竞争力的性能。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈