标签
KwaiKeye 发布 Keye VL 2.0-30B-A3B,这是一个多模态模型,拥有 30B 总参数/3B 激活参数,通过 DeepSeek Sparse Attention 提供 256K 上下文,采用 Apache 2.0 许可证,声称其准确性可与 Qwen3 VL 和 Gemini 3 媲美。
量化版 27B Qwen3.6 在单颗 49W GB10 GPU 上借助 Dflash+DDTree 优化,256k 上下文、10 智能体并发,峰值达 200 tok/s,平均 136 tok/s。