model-blending

标签

Cards List
#model-blending

RIO事件

Reddit r/ArtificialInteligence · 5天前

围绕Rio 3.5 Open 397B发生了一起争议:Nex-AGI声称该模型并非独立训练,而是其模型与Qwen的混合体;证据包括模型身份和权重匹配。

0 人收藏 0 人点赞
#model-blending

干预还是不干预:使用概率模型融合引导推理时对齐

arXiv cs.LG · 2026-06-11 缓存

本文介绍了BlendIn,一个推理时对齐框架,它使用概率模型融合来评估指导可靠性并按比例加权模型贡献,通过避免有害干预实现了高达50%的性能提升。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈