moe

#moe

Qwen/Qwen3.6-35B-A3B-FP8

Hugging Face Models Trending ↗ · 2026-04-15 缓存

阿里巴巴发布了Qwen3.6-35B-A3B-FP8，这是Qwen3.6的开源权重量化变体，拥有35B参数，通过MoE激活3B，具有改进的智能编码能力和保持思维链的迭代开发特性。

0 人收藏 0 人点赞

#moe

Qwen/Qwen3.6-35B-A3B

Hugging Face Models Trending ↗ · 2026-04-15 缓存

Qwen 发布 Qwen3.6-35B-A3B，一款开源权重的混合专家（MoE）模型，总参数量 35B，激活参数量 3B，在智能体编码和推理能力保持方面实现显著提升。

0 人收藏 0 人点赞

#moe

deepseek-ai/DeepGEMM

GitHub Trending (daily) ↗ · 2026-04-21 缓存

# deepseek-ai/DeepGEMM 来源：[https://github.com/deepseek-ai/DeepGEMM](https://github.com/deepseek-ai/DeepGEMM) # DeepGEMM DeepGEMM 是一个统一的高性能张量核心内核库，整合了现代大语言模型的关键计算原语——GEMM（FP8、FP4、BF16）、带通信重叠的融合 MoE（Mega MoE）、闪电索引器的 MQA 评分、超连接（HC）等——形成一个统一的 CUDA 代码库。所有内核均在运行时编译

0 人收藏 0 人点赞

moe

Qwen/Qwen3.6-35B-A3B-FP8

Qwen/Qwen3.6-35B-A3B

deepseek-ai/DeepGEMM

提交意见反馈