标签
Google DeepMind 发布了 Gemma 4 模型,这些模型通过量化感知训练(QAT)进行了优化,并提供包括 GGUF 在内的多种格式,在降低内存需求的同时实现了高质量。
本文通过稀疏自编码器刻画了指令调优大语言模型中的构成性文学原语,发现了自我、风格与情感的特征类别,这些特征能够在两种架构间实现情感引导。
ServiceNow 推出 SuperApriel-15B-Instruct:仅 15B 参数的单一 checkpoint,内置 8 组 mixer 预设,可在 1× 到 10.7× 解码吞吐之间切换,在 32K 上下文下仍保持高达 96% 的质量。
Google DeepMind 发布 Gemma 4,一系列开放权重的多模态模型,参数量从2.3B到31B,支持文本、图像、视频和音频输入。模型具有256K上下文窗口,MoE和密集架构,增强的推理能力,并针对从移动设备到服务器的部署进行优化。