Keye-VL-2.0-30B-A3B —— 首次将DSA注意力引入多模态

Reddit r/LocalLLaMA 2026/05/26 12:55 模型

multimodal vision-language long-video dsa-attention agent open-source 30b-parameters

摘要

快手发布Keye-VL-2.0-30B-A3B，这是一款30B级多模态基础模型，首次将DSA注意力引入多模态领域，专注于长视频理解与智能体能力。

介绍Keye-VL-2.0-30B-A3B —— Keye系列最新30B级旗舰基础模型，专为推动长视频理解的前沿以及解锁Keye家族第一代智能体能力而设计。 [https://huggingface.co/Kwai-Keye/Keye-VL-2.0-30B-A3B](https://huggingface.co/Kwai-Keye/Keye-VL-2.0-30B-A3B) https://preview.redd.it/wsxe233abh3h1.png?width=1244&format=png&auto=webp&s=aa9ffa388e16e4f8f5cb72ed3dae063f99df69f1 https://preview.redd.it/2iymyb9dbh3h1.png?width=2048&format=png&auto=webp&s=a834ce92294c3be059b50c6993f1be6d3faf2767

查看原文

Keye-VL-2.0-30B-A3B —— 首次将DSA注意力引入多模态

相似文章

Kwai-Keye/Keye-VL-2.0-30B-A3B

@AdinaYakup: Keye VL 2.0-30B-A3B 来自 @KwaiKeye 的新多模态模型 30B/3B 激活 - Apache 2.0 通过 DeepSeek Sparse Att… 提供 256K 上下文

Kwai Keye-VL-2.0 技术报告

InternVideo3: 使用多模态上下文推理将基础模型智能体化

Interdomain Attention: 超越令牌级键值记忆

提交意见反馈