256k-context

#256k-context

@AdinaYakup: Keye VL 2.0-30B-A3B 来自 @KwaiKeye 的新多模态模型 30B/3B 激活 - Apache 2.0 通过 DeepSeek Sparse Att… 提供 256K 上下文

X AI KOLs Following ↗ · 2026-06-01 缓存

KwaiKeye 发布 Keye VL 2.0-30B-A3B，这是一个多模态模型，拥有 30B 总参数/3B 激活参数，通过 DeepSeek Sparse Attention 提供 256K 上下文，采用 Apache 2.0 许可证，声称其准确性可与 Qwen3 VL 和 Gemini 3 媲美。

0 人收藏 0 人点赞

#256k-context

@iotcoi：Qwen3.6-27B-FP8 + Dflash + DDTree，256k 上下文，10 个智能体，单颗 49W GB10 上峰值 200 tokens/s，平均解码 136 tokens/s

X AI KOLs Timeline ↗ · 2026-04-22 缓存

量化版 27B Qwen3.6 在单颗 49W GB10 GPU 上借助 Dflash+DDTree 优化，256k 上下文、10 智能体并发，峰值达 200 tok/s，平均 136 tok/s。

0 人收藏 0 人点赞

256k-context

@AdinaYakup: Keye VL 2.0-30B-A3B 来自 @KwaiKeye 的新多模态模型 30B/3B 激活 - Apache 2.0 通过 DeepSeek Sparse Att… 提供 256K 上下文

@iotcoi：Qwen3.6-27B-FP8 + Dflash + DDTree，256k 上下文，10 个智能体，单颗 49W GB10 上峰值 200 tokens/s，平均解码 136 tokens/s

提交意见反馈