@levidiamode: GPU编程的第163/365天 - 今天看几个不同的agentic GPU内核优化系统。我最感兴趣的两个是…

X AI KOLs Timeline 2026/06/15 21:33 新闻

gpu-programming kernel-optimization agentic-systems machine-learning competition research

摘要

一条推文讨论了两种agentic GPU内核优化系统：@dogacel0的Auto GPU Kernel和@songhan_mit实验室的Kernel Design Agents，两者均在MLSys Sparse Attention FlashInfer比赛中获胜。该帖子突出了使用子代理和Claude技能进行GPU编程的不同方法。

GPU编程的第163/365天今天来看几个不同的agentic GPU内核优化系统。目前我最感兴趣的两个是： - @dogacel0的Auto GPU Kernel，他用这个赢得了今年MLSys的DeepSeek Sparse Attention FlashInfer挑战赛 - @songhan_mit实验室的Kernel Design Agents，在同一个比赛的MoE赛道中获得第一名看到子代理和Claude技能（如Kernel Wiki）在优化这些用于GPU编程的agentic循环中的不同用法，非常有趣。两者都给我的工作流程带来了很好的灵感。

查看原文

查看缓存全文

缓存时间: 2026/06/16 01:13

163/365 of GPU Programming

今天关注了几个不同的代理式GPU内核优化系统。目前我最感兴趣的两个是：

@dogacel0 的 Auto GPU Kernel，他利用这个系统赢得了今年 MLSys 的 DeepSeek Sparse Attention FlashInfer 挑战赛。
@songhan_mit 实验室的 Kernel Design Agents，该系统在同一比赛的 MoE 赛道中获得了第一名。

看到子代理和 Claude 技能（如 Kernel Wiki）在优化这些 GPU 编程的代理循环中的不同用途，真的很有趣。这两个系统都为我自己的工作流程提供了很好的灵感。

仓库链接：

https://github.com/Dogacel/auto-gpu-kernel…
https://github.com/mit-han-lab/kernel-design-agents…

@levidiamode: GPU编程的第163/365天 - 今天看几个不同的agentic GPU内核优化系统。我最感兴趣的两个是…

相似文章

AgentKernelArena：兼顾泛化能力的GPU内核优化代理基准测试

@levidiamode: GPU编程第157/365天：另一个对我非常有帮助的FlashAttention4资源是@charles_irl的演讲…

@levidiamode: Day 138/365 of GPU Programming 今年我最喜欢的讲座之一是斯坦福大学的CS336第7讲关于GPU…

@levidiamode: GPU编程第158/365天——我觉得我大致理解了FlashAttention 2、3和4前向传播的高级区别…

AdaExplore：基于失败驱动的自适应与多样性保留搜索的高效内核生成

提交意见反馈