Deepseek 发布 DeepEP V2 与 TileKernels

Reddit r/LocalLLaMA 2026/04/23 09:57 工具

摘要

Deepseek 开源 DeepEP V2 与 TileKernels，两套全新的 GPU 内核库，用于加速 AI 工作负载。

[https://github.com/deepseek-ai/DeepEP/pull/605](https://github.com/deepseek-ai/DeepEP/pull/605) [https://github.com/deepseek-ai/TileKernels](https://github.com/deepseek-ai/TileKernels)

查看原文

相似文章

deepseek-ai/DeepGEMM

GitHub Trending (daily)

# deepseek-ai/DeepGEMM 来源：[https://github.com/deepseek-ai/DeepGEMM](https://github.com/deepseek-ai/DeepGEMM) # DeepGEMM DeepGEMM 是一个统一的高性能张量核心内核库，整合了现代大语言模型的关键计算原语——GEMM（FP8、FP4、BF16）、带通信重叠的融合 MoE（Mega MoE）、闪电索引器的 MQA 评分、超连接（HC）等——形成一个统一的 CUDA 代码库。所有内核均在运行时编译

Deepseek 发布 DeepEP V2 与 TileKernels

相似文章

deepseek-ai/DeepGEMM

deepseek-ai/DeepSeek-V4-Flash

deepseek-ai/DeepSeek-V4-Pro

Metal 上的 DeepSeek V4 Flash 本地推理引擎

Moonshot 开源 FlashKDA：面向 Kimi Delta Attention 的 CUTLASS 内核，H20 上最高比 Triton 基线快 2.22 倍

提交意见反馈