@AdinaYakup: Keye VL 2.0-30B-A3B 来自 @KwaiKeye 的新多模态模型 30B/3B 激活 - Apache 2.0 通过 DeepSeek Sparse Att… 提供 256K 上下文

X AI KOLs Following 模型

摘要

KwaiKeye 发布 Keye VL 2.0-30B-A3B,这是一个多模态模型,拥有 30B 总参数/3B 激活参数,通过 DeepSeek Sparse Attention 提供 256K 上下文,采用 Apache 2.0 许可证,声称其准确性可与 Qwen3 VL 和 Gemini 3 媲美。

Keye VL 2.0-30B-A3B 🔥 来自 @KwaiKeye 的新多模态模型 ✨ 30B/3B 激活 - Apache 2.0 ✨ 通过 DeepSeek Sparse Attention 提供 256K 上下文(这可能是第一个在生产中搭载该技术的模型?👀) ✨ 输入更多帧时,准确度更高 ✨ 与 Qwen3 VL 和 Gemini 3 相匹敌 https://t.co/B2MO3zMIad
查看原文
查看缓存全文

缓存时间: 2026/06/01 13:23

Keye VL 2.0-30B-A3B 🔥 来自@KwaiKeye 的新多模态模型

✨ 30B/3B 激活 - Apache 2.0
✨ 通过 DeepSeek 稀疏注意力实现 256K 上下文(可能是第一个在生产中部署此功能的模型?👀)
✨ 输入更多帧时会更准确
✨ 媲美 Qwen3 VL 和 Gemini 3 https://t.co/B2MO3zMIad

相似文章

Kwai-Keye/Keye-VL-2.0-30B-A3B

Hugging Face Models Trending

Kwai-Keye 发布了 Keye-VL-2.0-30B-A3B,这是一款 30B 级别的视觉语言模型,具备先进的视频理解、稀疏注意力机制和智能体能力,在多项基准测试中达到顶尖水平。

Kwai Keye-VL-2.0 技术报告

Hugging Face Daily Papers

本技术报告介绍了 Kwai Keye-VL-2.0,这是一个开源的混合专家多模态基础模型,专为长视频理解和智能体智能设计,利用 DeepSeek 稀疏注意力机制和跨模态蒸馏技术,在同等规模模型中实现了最先进的性能。