@PyTorch: 自动调优是Helion的支柱，Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用…

X AI KOLs Following 2026/06/18 17:27 工具

pytorch helion autotuning llm-guided-search kernel-tuning performance dsl

摘要

本文探讨了使用LLM引导的自动调优来加速PyTorch的Helion DSL中的内核配置搜索，取代了较慢的Likelihood-Free Bayesian Optimization方法。

自动调优是Helion的支柱，Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用Likelihood-Free Bayesian Optimization (LFBO)来寻找最高性能的配置。虽然LFBO效果不错，但它需要每个内核经历数百次编译和基准测试循环。如果，不是盲目开始搜索，而是可以询问LLM来推理内核并提出配置呢？在本文中，我们探讨了LLM引导的自动调优如何成为一种实用的方法，能够以生产级质量实现显著更快的内核调优。点击评论区链接了解更多。 @JongsokC @oguz_ulgen

查看原文

查看缓存全文

缓存时间: 2026/06/18 18:10

自动调优是 Helion（PyTorch 用于性能可移植 ML 内核的 DSL）的支柱。目前 Helion 的搜索使用无似然贝叶斯优化（LFBO）来寻找性能最优的配置。虽然 LFBO 表现良好，但它需要对每个内核进行数百次编译和基准测试周期。

如果不再盲目开始搜索，而是让 LLM 推理内核并提出配置，会怎么样？

在这篇博客中，我们探讨了 LLM 引导的自动调优如何成为一种实用方法，以生产质量大幅加快内核调优速度。

点击评论区中的链接了解更多信息。

@JongsokC @oguz_ulgen

@PyTorch: 自动调优是Helion的支柱，Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用…

相似文章

@PyTorch: 关于教程的更多详情 https://pldi26.sigplan.org/details/pldi-2026-tutorials/1/Writing-Performance-Portable-K…

@PyTorch: 6月15日（周一），PyTorch Foundation 项目 Helion 将在 PLDI 2026（第47届 ACM SIGPLAN 会议…）上举办 Helion DSL 教程。

@akshay_pachaar：PyTorch Autograd 与 Unsloth Triton 内核对比。UnslothAI 背后的核心工程一直令人印象深刻！它并未……

AccelOpt：一种用于AI加速器内核优化的自我改进LLM智能体系统

@leloykun：[进行中] 关于 Lean4-to-TileLang 张量程序超级优化器的博文：

提交意见反馈